擅长python代码编写,爬虫,文本分析,数据分析;完成过微博评论的爬取以及文本分析,如情感分析,关键词分析,擅长使用文本分析的各种模型,最后生成可视化报表;数据分析方面则擅长机器学习的各种经典算法,如决策树,聚类分析,神经网络等等。
擅长python代码编写,爬虫,文本分析,数据分析;完成过微博评论的爬取以及文本分析,如情感分析,关键词分析,擅长使用文本分析的各种模型,最后生成可视化报表;数据分析方面则擅长机器学习的各种经典算法,如决策树,聚类分析,神经网络等等。
1 将 某年份蕴含有 instance segmentation 关键词的 论文题目逐行自动存储在一个excel文件中,每年一个表格 同时显示该关键词的每年论文数量 2 统计含这些这些关键词中其他单词的出现频率,并从高到低排序,输出到txt文章中,注意高频词需去掉
爬取微博评论然后进行情感文本分析,如情感河流图,关键词提取,tf-idf分析,情感河流图,词云可视化等
爬虫使用selenium+webdriver爬取,同时掌握多线程多进程爬取,能够爬取海量级别数据,然后进行文本分析等