擅长需求分析,把业务需求转为技术需求,主导过大型Web架构设计,数据库设计。
有前后端的分离的大型Web应用开发经历,全栈开发,侧重于后端开发,java,Python 开发经验丰富。
有大数据开发实践,为公司提供kylin OLAP 大数据解决方案
擅长爬虫技术,抓取和存储数据。
有自然语言处理经验,开发过单轮和多轮对话系统。
1. 北京来也网络科技公司 北京 AI 实习生
重构和优化原有对话系统,实现Saas化,为To B业务提供支持,接口自动化测试工具开发。
搭建基于tf-idf,LDA特征的对话语料层次聚类模型,ES检索知识库和对话语料挖掘分析。
搭建基于dual encoder的对话动作选择模型(recall@3达到90%)。
2. 北京交通研究院 北京 智能信息处理部
搭建spark集群+hbase集群+oracle的金字塔结构的北京市公交刷卡大数据分析平台。
基于rabbit-mq+java多线程的实时消息接收系统。
基于geomesa+hbase的交通实时数据平台,为海量打点数据和车辆轨迹数据提供支撑。
3. 中科院软件研究所 北京
金融数据的反爬虫环境下爬取,抓取10万个文档,利用word2vec建立金融领域词向量库。
CNN 网络模型实现中文言语碎片的情感识别,初始模型达到 85%准确率。
基于改进的三元组的知识表示,利用neo4j搭建中文常识知识库。
4. 中科院软件研究所 北京
利用redis对htk进行改造,基于词典和n-gram模式搭建增量式语音识别引擎。
语音引擎和java web服务的对接。
5. 阿里巴巴天池大数据 北京
“白云山机场 wifi 连接预测”竞赛,队长
基于ARIMA的时间序列模型,MLP回归模型和利用xgboost的回归模型