项目简介 通过对文本难易程度的分析,面向用户推出个性化需求的儿童读物
核心技术 搭建 Hadoop HA 平台;Python 爬虫技术:数据采集;Python 数据处理技术: 数据挖掘;机器学习算法:Tf-Idf 算法进行关键词提取、使用信息熵处理特征, 信息增益计算文本难易度;Flask 框架:实现前端后台链接,进行数据可视化; 余弦相似度:实现智能对话功能
开发环境 macOS High Sierra+Python3.6.5+MySql+Flask+CentOS7+Windows 10
本人职责 主持、指导整个系统开发。实现数据挖掘、机器学习算法部分处理,实现文本
情感分析、关键词提取、文本难易度等功能 使用语言 Python、MySql、JavaScript、HTML、CSS