职位ID:156264

python爬取百度贴吧数据

  • 合作方式:
  • 项目制 全国远程
  • 预估日薪:
  • 500
  • 预估总价:
  • 2000元
  • 预估工时:
  • 4天
  • 所在区域:
  • 全国远程

需求描述

需求分析
1、爬取百度贴吧吉林省高校(长春理工、长春工业、东北电力、吉林大学、东北师大、延边大学)2022年到2024年百度贴吧内容、包括(标题、发布时间、浏览量、点赞人数、评论等)通过分词(可以使用jieba库进行分词),进行数据预处理(清洗掉无用数据),收集到一份包含大学生网络行为数据的CSV文件,数据包括用户ID、行为时间、行为类型、行为内容等信息。
2、使用matplotlib或seaborn库绘制行为类型的分布图,了解大学生在网络空间中的主要行为。分析行为时间,了解大学生在网络空间中的活跃时间段。
3、对行为内容进行文本分析,可以使用jieba库进行分词,wordcloud库生成词云图,展示大学生关注的话题和热点。
4、基于用户ID和行为数据,分析大学生之间的社交关系,如通过点赞、评论等行为判断好友关系。
- 使用networkx库绘制社交关系网络图,分析社交网络的密度、节点重要性等指标。
5、对行为内容进行情感分析,判断大学生在网络空间中的情感态度。可以使用SnowNLP、TextBlob等Python库实现。
- 分析不同主题或话题下的情感分布,了解大学生的情感倾向。
6、将以上分析结果综合起来,形成对大学生网络文化特征的全面认识。
- 可以使用交互式数据可视化工具(如Dash、Plotly等)展示分析结果,方便用户交互和探索。
7、需要提供python原始代码,数据库要求使用mysql,数据可视化展示可以建立简单的网页进行展示(输入一些关键词检索)或使用python库进行展示也可。

信用行为

  • 发布项目
    2
  • 订单总数
    1
  • 退款单数
    0

完善简历

工程师完善技术能力和项目经验,更易接到订单

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信客服

需求方请加需求方端客服沟通需求,工程师请加工程师端客服浏览推送职位

需求方端客服
工程师端客服
联系需求方端客服