熟练掌握C++,熟练应用C++的STL库,boost库;
熟练掌握python编程语言,在tensorflow平台下完成过项目,熟练掌握深度学习算法调参技巧;
可独立进行信息抽取,文本分类,知识图谱等自然语言处理相关项目,命名实体识别领域尤其擅长;
熟悉并进行应用的算法有SVM,xgboost,CRF,TextCNN,LSTM-CRF,BERT-LSTM-CRF等;
对于传统机器学习算法与深度学习算法均有涉猎。
智慧诊疗系统
负责其中的信息抽取工作,从非结构化文本中提取数据,比如疾病的症状,药品的用法等属性,使用CRF算法,结合规则进行抽取,基本准确率和召回率均在90%以上;
对该项目进行优化,使用BERT-LSTM-CRF算法进行信息抽取,BERT进行句子分类实验,目前未上线,测试效果信息抽取提升5%作用,分类提升3%左右。