具备5年的机器学习,数据挖掘,图像识别,自然语言处理的工作经验,国内985院校本科毕业,在爱尔兰都柏林获得人工智能硕士学位并工作3年,曾在爱尔兰insight center for data analytics实验室实习,具有较强英文的阅读和理解能力,关注深度学习领域的最新学术研究。2018年初回国后至今在北京工作。有良好的数学背景和统计知识,掌握数据挖掘算法和深度学习算法,掌握sql、elasticserach,善于使用python,pandas,keras,tensorflow和scikit中的算法模型。
一、文字图像识别:
应用场景:医疗单据、收费单据、公安笔录等
项目介绍:传统人工录入单据、笔录数据,人力消耗大、人为因素高、手工录入错误率高、单据复查难度大。该项目可以自动检测并且识别扫描图片中的文字,运用深度学习算法优化检测模型,提取图片中的关键信息,使图片中文字的检测准确度在95%以上,利用Sequence to Sequence识别检测出图片中的文字,综合的准确度达到90%
二、语义信息匹配
应用场景:简历与招聘要求匹配
项目介绍:该项目方便HR、猎头从海量的简历中筛选出最佳人选。该项目根据简历信息中的学历,工作经验,工作经历等内容与招聘要求中的学历要求,岗位职责及任职资格等信息进行匹配,在语义层面上计算岗位要求与简历中的工作经历、项目经历的相似度,并结合信息抽取、标签提取、文本解析等NLP技术,根据候选人以往的工作内容,专业,所处行业,从多个维度评判简历与招聘要求的匹配得分。
三、舆论分析
应用场景:金融市场
项目介绍:该项目是根据上市公司的新闻数据预测其未来股价走势。利用lstm神经网络模型实现命名实体识别,根据检测出的新闻中提到的公司名字,人名及地点,精准匹配与上市公司相关的新闻。根据筛选出来的新闻,构建深度学习模型进行舆情分析,分析结果作为未来股票走势的一个指标。
四、数据挖掘
应用场景:生活日志
项目介绍:爱尔兰insight center实验室项目,目的是根据时间序列及图像分析,识别用户的行为次序。用户佩戴的便携相机会定时拍摄照片记录其生活场景,收集到的照片序列蕴含着大量潜在的信息。我们利用深度学习算法提识别照片中的物品,并把照片进行向量化。每天产生的大量照片组合成照片矩阵,并对矩降维并去除噪声,根据照片序列利用隐马尔科夫模型对用户的行为进行分类。