README-CN.md
7.76 KB
[](https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/stargazers)
[](https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/network)
[](https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/issues)
[](https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/graphs/contributors)
[](https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem/blob/main/LICENSE)
[English](./README.md) | [中文文档](./README-CN.md)
🚀最新2.0版本已全面升级AI模式,欢迎体验!⬇️
微博舆情分析预测系统 是一个用于监控、分析和预测社交媒体平台(如微博)上的公众舆情趋势的社交网络舆情分析系统。该系统利用深度学习、自然语言处理(NLP)和机器学习技术,从大量社交媒体数据中提取有价值的舆情信息,帮助政府、企业及其他组织及时了解公众态度、应对突发事件并优化决策。📈
通过强大的数据采集与处理能力,微博舆情分析预测系统实现了实时数据收集、情感分析、话题分类和舆情预测等功能,确保用户能够在复杂多变的社交网络环境中获得准确、全面的舆情洞察。系统采用模块化设计,易于维护和扩展,旨在为用户提供一个高效、可靠的舆情分析工具,助力各类组织在信息化时代做出明智决策。
✨ 功能
- 实时数据采集:通过网络爬虫技术,从微博等社交平台实时获取用户生成内容。
- 数据清洗与处理:对采集到的数据进行预处理,包括分词、去停用词、表情符号和网址的去除等。
- 话题分类:利用机器学习和自然语言处理技术,对帖子和评论进行自动话题分类。
- 情感分析:分析文本中的情感倾向(正面、中性、负面),帮助理解公众情绪。
- 舆情监控与预测:实时监控舆情变化,并基于历史数据预测未来的舆情趋势。
- 数据可视化:通过图表和图形直观展示分析结果,便于用户理解和决策。
- 用户管理:提供用户注册、登录和会话管理功能,确保系统的安全性和个性化服务。
🚀 开始使用
按照以下步骤在您的系统上运行该项目。
前提条件
- Python 3.7 或更高版本
- MySQL 数据库
- Conda(可选,用于环境管理)
- 合法的微博账号(用于数据采集)
- 以下API密钥中至少需要一个(用于AI分析功能):
- OpenAI API密钥
- Anthropic(Claude)API密钥
- DeepSeek API密钥
安装步骤
- 克隆仓库: ```bash git clone https://github.com/666ghj/Weibo_PublicOpinion_AnalysisSystem.git cd Weibo-Public-Opinion-Analysis-System
- 创建并激活虚拟环境(可选):
conda create -n weibo_opinion_analysis python=3.8
conda activate weibo_opinion_analysis
- 安装依赖:
pip install -r requirements.txt
- 配置MySQL数据库:
- 运行
createTables.sql创建所需的数据库表。 - 修改
config.py中的数据库连接配置,确保与您的MySQL设置匹配。
- 配置AI分析功能(可选):
设置AI分析功能所需的环境变量:
# OpenAI API配置(使用GPT模型必需)
export OPENAI_API_KEY="你的openai密钥"
# Anthropic API配置(使用Claude模型必需)
export ANTHROPIC_API_KEY="你的anthropic密钥"
# DeepSeek API配置(使用DeepSeek模型必需)
export DEEPSEEK_API_KEY="你的deepseek密钥"
注意:至少需要配置一个API密钥才能使用AI分析功能。
支持的AI模型:
- OpenAI:GPT-3.5-Turbo、GPT-4
- Anthropic:Claude-3(Opus、Sonnet、Haiku)
- DeepSeek:DeepSeek-V3(deepseek-chat)、DeepSeek-R1(deepseek-reasoner)
- 启动Flask应用:
python app.py
- 访问应用: 打开浏览器,访问
http://localhost:5000以使用系统。
🛠️ 技术栈
微博舆情分析预测系统采用了一系列现代技术,以确保其高效性和可扩展性:
- Flask - 轻量级的Web应用框架。
- MySQL - 关系型数据库,用于存储采集和处理的数据。
- Scrapy - 强大的网络爬虫框架,用于数据采集。
- Jieba - 中文分词工具,用于文本预处理。
- SnowNLP - 中文自然语言处理库,用于情感分析。
- BERT - 预训练的语言模型,用于话题分类。
- Pandas - 数据分析和处理库。
- Matplotlib - 数据可视化库。
- Scikit-learn - 机器学习库,用于模型训练和评估。
- TensorFlow 或 PyTorch - 深度学习框架,用于高级模型开发。
- OpenAI GPT - 先进的语言模型,用于文本分析。
- Anthropic Claude - 智能AI模型,用于复杂文本分析。
- DeepSeek - 先进的中英双语AI模型。
🤝 贡献
我们欢迎您的贡献!以下是参与项目的步骤:
- Fork 本仓库。
- 创建您的功能分支 (
git checkout -b feature/新功能)。 - 提交您的更改 (
git commit -m '添加新功能')。 - 推送到分支 (
git push origin feature/新功能)。 - 打开一个 Pull Request。
请确保在提交之前运行所有测试,并遵循项目的编码规范。
📜 许可证
本项目采用 GPL-2.0 License 许可证 - 详情请参阅 LICENSE 文件。
🌟 支持一下
如果您喜欢这个项目,请在 GitHub 上给它一个星 ⭐!
📫 联系我们
有任何问题或建议,欢迎通过以下方式联系我们:
- GitHub Issues: 创建新问题
- 邮箱: 670939375@qq.com
✨ 贡献者
感谢以下这些优秀的贡献者: