Showing
1 changed file
with
7 additions
and
122 deletions
| 1 | -# WeiboSentiment_Qwen 微博情感分析(Qwen模型) | 1 | +# 微调Qwen3小参数模型来完成情感分析任务 |
| 2 | 2 | ||
| 3 | -## 项目背景 | ||
| 4 | - | ||
| 5 | -本文件夹专门用于基于阿里巴巴Qwen系列模型的微博情感分析任务。根据最新的模型评测结果,Qwen的小参数模型(如0.6B、4B、8B、14B)在话题识别、情感分析等相对简单的自然语言处理任务上表现优异,显著超越了传统的BERT等基础模型。 | ||
| 6 | - | ||
| 7 | -## 为什么选择Qwen模型 | ||
| 8 | - | ||
| 9 | -### 性能优势 | ||
| 10 | -- **更优的小模型表现**:Qwen的小参数模型在情感分析任务上展现出比BERT等传统模型更好的效果 | ||
| 11 | -- **参数效率高**:相比大型语言模型,Qwen的小参数版本在保持优秀性能的同时大幅降低了计算资源需求 | ||
| 12 | -- **中文优化**:Qwen模型对中文文本有更好的理解能力,特别适合微博等中文社交媒体数据 | ||
| 13 | - | ||
| 14 | -### 技术特点 | ||
| 15 | -- **多尺寸选择**:提供0.6B、4B、8B、14B等多种参数规模,可根据实际需求选择 | ||
| 16 | -- **易于微调**:模型架构设计合理,支持高效的下游任务微调 | ||
| 17 | -- **部署友好**:小参数模型便于在各种硬件环境下部署 | ||
| 18 | - | ||
| 19 | -## 数据集说明 | ||
| 20 | - | ||
| 21 | -本项目使用10万条已标注的微博情感二分类数据集进行模型微调: | ||
| 22 | - | ||
| 23 | -- **数据规模**:100,000条微博文本 | ||
| 24 | -- **标注类型**:情感二分类(正面/负面) | ||
| 25 | -- **数据来源**:微博平台真实用户发布内容 | ||
| 26 | -- **标注质量**:经过人工标注和质量验证 | ||
| 27 | - | ||
| 28 | -## 模型微调方案 | ||
| 29 | - | ||
| 30 | -### 支持的模型规格 | ||
| 31 | -- **Qwen-0.5B**:轻量级部署,适合资源受限环境 | ||
| 32 | -- **Qwen-1.8B**:平衡性能与效率的选择 | ||
| 33 | -- **Qwen-4B**:推荐配置,性能与资源消耗的最佳平衡 | ||
| 34 | -- **Qwen-7B**:高性能配置,适合对准确率要求较高的场景 | ||
| 35 | -- **Qwen-14B**:顶级性能,适合研究和高精度应用 | ||
| 36 | - | ||
| 37 | -### 微调策略 | ||
| 38 | -- **全参数微调**:针对有充足计算资源的用户 | ||
| 39 | -- **LoRA微调**:低资源消耗的高效微调方案 | ||
| 40 | -- **QLoRA微调**:量化版本,进一步降低内存需求 | ||
| 41 | - | ||
| 42 | -## 使用说明 | ||
| 43 | - | ||
| 44 | -### 环境要求 | ||
| 45 | -- Python 3.8+ | ||
| 46 | -- PyTorch 1.12+ | ||
| 47 | -- transformers 4.20+ | ||
| 48 | -- 建议使用GPU进行训练和推理 | ||
| 49 | - | ||
| 50 | -### 快速开始 | ||
| 51 | -```bash | ||
| 52 | -# 安装依赖 | ||
| 53 | -pip install -r requirements.txt | ||
| 54 | - | ||
| 55 | -# 数据预处理 | ||
| 56 | -python data_preprocessing.py | 3 | +<img src="https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/blob/main/static/image/logo_Qweb3.jpg" alt="微博情感分析示例" width="25%" /> |
| 57 | 4 | ||
| 58 | -# 模型微调 | ||
| 59 | -python train_qwen.py --model_size 4B --batch_size 16 --epochs 3 | ||
| 60 | - | ||
| 61 | -# 模型评估 | ||
| 62 | -python evaluate.py --model_path ./checkpoints/qwen-4b-finetuned | ||
| 63 | - | ||
| 64 | -# 模型推理 | ||
| 65 | -python inference.py --text "这是一条测试微博" --model_path ./checkpoints/qwen-4b-finetuned | ||
| 66 | -``` | ||
| 67 | - | ||
| 68 | -## 项目结构 | ||
| 69 | -``` | ||
| 70 | -WeiboSentiment_Qwen/ | ||
| 71 | -├── data/ # 数据集目录 | ||
| 72 | -│ ├── train.json # 训练数据 | ||
| 73 | -│ ├── dev.json # 验证数据 | ||
| 74 | -│ └── test.json # 测试数据 | ||
| 75 | -├── models/ # 模型配置文件 | ||
| 76 | -├── scripts/ # 训练和评估脚本 | ||
| 77 | -├── checkpoints/ # 模型检查点 | ||
| 78 | -├── results/ # 实验结果 | ||
| 79 | -└── utils/ # 工具函数 | ||
| 80 | -``` | ||
| 81 | - | ||
| 82 | -## 实验结果 | ||
| 83 | - | ||
| 84 | -| 模型 | 参数量 | 准确率 | F1分数 | 推理速度 | | ||
| 85 | -|------|--------|--------|--------|----------| | ||
| 86 | -| BERT-base | 110M | 0.851 | 0.847 | 基准 | | ||
| 87 | -| Qwen-0.5B | 620M | 0.863 | 0.859 | 2.1x | | ||
| 88 | -| Qwen-1.8B | 1.8B | 0.884 | 0.881 | 1.8x | | ||
| 89 | -| Qwen-4B | 3.9B | 0.897 | 0.893 | 1.4x | | ||
| 90 | -| Qwen-7B | 7.7B | 0.903 | 0.899 | 1.0x | | ||
| 91 | - | ||
| 92 | -## 模型选择建议 | ||
| 93 | - | ||
| 94 | -### 资源受限环境 | ||
| 95 | -- **推荐**:Qwen-0.5B 或 Qwen-1.8B | ||
| 96 | -- **适用场景**:移动端部署、边缘计算、实时性要求高的应用 | ||
| 97 | - | ||
| 98 | -### 平衡配置 | ||
| 99 | -- **推荐**:Qwen-4B | ||
| 100 | -- **适用场景**:大多数生产环境、批量处理任务 | ||
| 101 | - | ||
| 102 | -### 高精度需求 | ||
| 103 | -- **推荐**:Qwen-7B 或 Qwen-14B | ||
| 104 | -- **适用场景**:研究实验、对准确率要求极高的应用 | ||
| 105 | - | ||
| 106 | -## 贡献指南 | ||
| 107 | - | ||
| 108 | -欢迎社区贡献代码和改进建议: | ||
| 109 | - | ||
| 110 | -1. Fork本项目 | ||
| 111 | -2. 创建特性分支 (`git checkout -b feature/AmazingFeature`) | ||
| 112 | -3. 提交更改 (`git commit -m 'Add some AmazingFeature'`) | ||
| 113 | -4. 推送到分支 (`git push origin feature/AmazingFeature`) | ||
| 114 | -5. 开启Pull Request | ||
| 115 | - | ||
| 116 | -## 许可证 | ||
| 117 | - | ||
| 118 | -本项目遵循主项目的开源许可证,详见根目录LICENSE文件。 | 5 | +## 项目背景 |
| 119 | 6 | ||
| 120 | -## 联系方式 | 7 | +本文件夹专门用于基于阿里Qwen3系列模型的微博情感分析任务。根据最新的模型评测结果,Qwen3的小参数模型(如0.6B、4B、8B、14B)在话题识别、情感分析等相对简单的自然语言处理任务上表现优异,超越了传统的BERT等基础模型。 |
| 121 | 8 | ||
| 122 | -如有问题或建议,请通过以下方式联系: | ||
| 123 | -- 提交Issue到主项目仓库 | ||
| 124 | -- 参与项目讨论区 | 9 | +qwen 0.6B模型加线性分类器,做特定领域的文本分类和序列标注,优于bert,也优于235B的qwen3 few shot learning。在算力有限的情况下,性价比很高... |
| 125 | 10 | ||
| 126 | ---- | 11 | +在经过了一些相关的调研之后,我觉的将Qwen3的一些小参数模型用在本系统中是一个不错的选择。 |
| 127 | 12 | ||
| 128 | -**注意**:本项目是Weibo_PublicOpinion_AnalysisSystem的子模块,专注于Qwen模型的情感分析任务。用户可以根据自身需求和资源条件自由选择合适的模型规格进行使用。 | 13 | +虽然这个参数在LLM时代算小,但作为个人开发者计算资源有限,微调他们还是实属不易。 |
-
Please register or login to post a comment