需求分析
1、爬取百度贴吧吉林省高校(长春理工、长春工业、东北电力、吉林大学、东北师大、延边大学)2022年到2024年百度贴吧内容、包括(标题、发布时间、浏览量、点赞人数、评论等)通过分词(可以使用jieba库进行分词),进行数据预处理(清洗掉无用数据),收集到一份包含大学生网络行为数据的CSV文件,数据包括用户ID、行为时间、行为类型、行为内容等信息。
2、使用matplotlib或seaborn库绘制行为类型的分布图,了解大学生在网络空间中的主要行为。分析行为时间,了解大学生在网络空间中的活跃时间段。
3、对行为内容进行文本分析,可以使用jieba库进行分词,wordcloud库生成词云图,展示大学生关注的话题和热点。
4、基于用户ID和行为数据,分析大学生之间的社交关系,如通过点赞、评论等行为判断好友关系。
- 使用networkx库绘制社交关系网络图,分析社交网络的密度、节点重要性等指标。
5、对行为内容进行情感分析,判断大学生在网络空间中的情感态度。可以使用SnowNLP、TextBlob等Python库实现。
- 分析不同主题或话题下的情感分布,了解大学生的情感倾向。
6、将以上分析结果综合起来,形成对大学生网络文化特征的全面认识。
- 可以使用交互式数据可视化工具(如Dash、Plotly等)展示分析结果,方便用户交互和探索。
7、需要提供python原始代码,数据库要求使用mysql,数据可视化展示可以建立简单的网页进行展示(输入一些关键词检索)或使用python库进行展示也可。