2019年2月–2020年12月 讲师——山东电子职业技术学院,计算机与软件工程系 研究方向 自然语言处理、机器翻译
主讲课程 Python 程序设计高级(机器学习)、大数据平台构建与开发 校级课题 基于电商竞品数据的女装流行元素预测(在研)
成果 《大数据平台搭建与维护》(机械工业出版社),2020 年 《数据仓库技术及应用》(机械工业出版社),2020 年 《Python 语言设计》(武汉大学出版社),2020 年
2018年4月-10月 机器学习算法工程师——韩都衣舍电商集团,商业智能中心
主要职责 参与电商活动销量预测系统开发、商品推荐系统开发
成果 实现 BI 系统中的服装搭配推荐功能
2019年6月–2020年9月 儿童读物智能对话系统
项目简介 通过对文本难易程度的分析,面向用户推出个性化需求的儿童读物
核心技术 搭建 Hadoop HA 平台;Python 爬虫技术:数据采集;Python 数据处理技术: 数据挖掘;机器学习算法:Tf-Idf 算法进行关键词提取、使用信息熵处理特征, 信息增益计算文本难易度;Flask 框架:实现前端后台链接,进行数据可视化; 余弦相似度:实现智能对话功能
开发环境 macOS High Sierra+Python3.6.5+MySql+Flask+CentOS7+Windows 10 本人职责 主持、指导整个系统开发。实现数据挖掘、机器学习算法部分处理,实现文本
情感分析、关键词提取、文本难易度等功能 使用语言 Python、MySql、JavaScript、HTML、CSS
2017年6月–12月 TransVis 翻译版本可视化系统
项目简介 DelightedBeauty是一个由Pr. Tom Cheesman发起的项目,主要为翻译和语言学 家提供多语种语料库以及可视化等技术支持。本项目旨在通过分析《奥赛罗》的 英文与 16 个德文翻译版本的词汇,探索一种合适的可视化方案。
核心技术 Java Swing:负责 GUI 实现;DeReKo 语料库:存储 10000 个最常用德语词语 原型及词形变化,负责实现德语词形还原功能;StanfordNLP API:英语词语的 词形还原功能;Google TranslationAPI:英德词语翻译
开发环境 Windows 10 + Eclipse + JDK1.8
本人职责 开发一款数据可视化软件(TransVis),对多篇翻译文章的词语进行词频计算、 权重计算、词形还原等数据处理,并提供多种可视化结果和用户交互功能,可 视化结果得到用户好评。
2018年6月-8月 商品推荐系统
项目简介 对商品特征进行分析,运用协同过滤、ALS 等机器学习算法生成基于历史购买
记录、内容搭配等推荐模型。
核心技术 pyspark:生成 spark dataframe 并进行 als 算法。Elasticsearch:创建 index 存储 结果以供外部查找及调用。ALS 算法:进行 ALS 算法的推荐模型,与 ES 交互 提高计算和查找速度。FPGrowth 算法:探索关联搭配的相关算法,基于 fp-tree 的算法速度较普通关联搭配的算法时间节省了一半。Nodejs:实现定时任务执 行
开发环境 macOS High Sierra+Apache Spark-2.2.0+Elasticsearch-5.3.0+python-3.6.4 本人职责 探索并使用基于物品的协同过滤、关联规则等算法进行商品推荐,并生成 python
API 供外部接口使用。
项目成果 对商品特征进行分析,运用协同过滤、ALS 等机器学习算法生成基于历史购买
记录、内容搭配等推荐模型。
项目简介 通过对文本难易程度的分析,面向用户推出个性化需求的儿童读物 核心技术 搭建 Hadoop HA 平台;Python 爬虫技术:数据采集;Python 数据处理技术: 数据挖掘;机器学习算法:Tf-Idf 算法进行关键词提取、使用信息熵处理特征, 信息增益计算文本难易度
项目简介 DelightedBeauty是一个由Pr. Tom Cheesman发起的项目,主要为翻译和语言学 家提供多语种语料库以及可视化等技术支持。本项目旨在通过分析《奥赛罗》的 英文与 16 个德文翻译版本的词汇,探索一种合适的可视化方案。 核心技术 Java Swing