较为丰富的Python开发经验, 作为主力语言开发多个模型。
熟悉MySQL, ElasticSearch,Oracle等数据库语言
熟练使用docker容器、linux常用命令等
熟悉R语言、SPSS等常用数据分析软件,Power BI,Tableau等Bi可视化工具
熟悉Keras、Tensorflow等深度学习框架
熟悉线性回归、logistics、softmax、BN、Apriori、C4.5、Adaboost、K-means、ARIMA等机器学习算法
熟悉神经元模型、人工神经网络、BP、FC、RNN、LSTM、CNN、seq2seq、等深度学习算法
熟悉NLP相关算法:例如实体识别、文本分类、情感分析、关键词抽取、关键句抽取、文本纠错等
实体识别标注系统开发:
(1) 命名实体识别算法开发:
1. 通过采用xxx算法,识别文本中地点、人物及组织机构。数据进行定期训练及更新模型,并部署到服务器上。
2. 通过采用xxxx算法,识别文本中时间。并拉取docker镜像,部署到服务器上。
(2) 多文本分类算法构建:
采用xxxx算法,对报文数据集进行多文本分类,大致分为政治、经济、军事、科技、体育、游戏、医疗、教育等13个类别。并拉取docker镜像,部署到服务器上。
(3) 情感分析算法构建:
采用xxxx算法,对网民数据集进行情感分析,大致分为正面、负面2个类别。
地方交易所风险监测技术研究与实现
从mysql数据库中提取交易所数据,分别从经营主体、分支机构、关联APP、微信公众号、用户情况、舆情内容(涉及涉嫌诈骗、涉嫌群体事件、涉嫌失联和涉嫌违规操作)、ICP备案情况监测、有无注册、注册地与网站备案地址是否一致及网站IP地址情况监测等多角度进行分析。
角色 | 职位 |
负责人 | 算法工程师 |
队员 | 产品经理 |
队员 | 前端工程师 |
队员 | 后端工程师 |
网民对购买物品的情感分析,正面和负面 多文本分类大致分为政治、经济、军事、科技、体育、游戏、医疗、教育等13个类别 人物、地点、组织机构、职业的实体识别,时间命名实体识别 文本纠错 摘要提取
关键词是能够表达文档中心内容的词语,常用于计算机系统标引论文内容特征、信息检索、系统汇集以供读者检阅。关键词提取是文本挖掘领域的一个分支,是文本检索、文档比较、摘要生成、文档分类和聚类等文本挖掘研究的基础性工作。