编程能⼒:拥有良好的编程能⼒, 熟悉Python, 熟悉Linux开发环境 算法能⼒:熟悉常⻅深度学习模型结构(如BN、GAP等), 熟悉常⻅机器学习相关算法(如GBDT、XGBoost等) 熟悉常⻅搜索推荐相关算法(如TF-IDF、BM25、Word2Vec、DeepFM等)
华为技术服务有限公司 - AI算法⼯程师 搜索推荐开发部 2021.06 - ⾄今 在华为⾃研的搜索平台上, 针对搜索⼴告业务, 通过搜索、推荐算法实现及优化, 完成细粒度意图识别功能: 1)分析数据分布、物料关键词等, 并基于BM25算法实现检索模型的整体流程及商品数据预标注功能; 2)通过分级分类⽅法、域信息的使⽤、数据扩充、query优化、阈值截断等⽅法优化检索模型效果; 3)基于word embedding和余弦相似度检索的⽅法, 实现基于商品内容的相似性推荐功能。 成果:实现了搜索系统的意图识别及商品推荐的整体流程, 与现有基于规则的⽅案相⽐, 提升了⼴告类⽬分类效果:在使⽤ 千万级词库时, 识别效果为85%的top1准确率(提升15%以上), 99.4%的top5准确率, 搜索系统时延为0.05ms。 Cicada-Speech inc. - 算法⼯程师 2021.03 - 2021.06 针对于特定应⽤场景下, 实现智能对话客服系统, 主要负责关键词提取、稀疏检索器的实现及优化等⼯作: 1)对数据进⾏处理, 并使⽤TF-IDF、TextRank等⽅法进⾏关键词提取, 使⽤稀疏检索器实现搜索匹配; 2)通过层级信息的使⽤、数据扩充⽅法、基于PageRank思想的⽂档重要性评分等⽅法, 改进模型搜索效果; 成果:在有效防⽌较差回答的召回的同时, 搜索指标对⽐基准模型提升10%左右, 得到更优质的回答。
在华为⾃研的搜索平台上, 针对搜索⼴告业务, 通过搜索、推荐算法实现及优化, 完成细粒度意图识别功能: 1)分析数据分布、物料关键词等, 并基于BM25算法实现检索模型的整体流程及商品数据预标注功能; 2)通过分级分类⽅法、域信息的使⽤、数据扩充、query优化、阈值截断等⽅法优
针对于特定应⽤场景下, 实现智能对话客服系统, 主要负责关键词提取、稀疏检索器的实现及优化等⼯作: 1)对数据进⾏处理, 并使⽤TF-IDF、TextRank等⽅法进⾏关键词提取, 使⽤稀疏检索器实现搜索匹配; 2)通过层级信息的使⽤、数据扩充⽅法、基于PageRank思想的⽂档
在华为⾃研的搜索平台上, 针对搜索⼴告业务, 通过搜索、推荐算法实现及优化, 完成细粒度意图识别功能: 1)分析数据分布、物料关键词等, 并基于BM25算法实现检索模型的整体流程及商品数据预标注功能; 2)通过分级分类⽅法、域信息的使⽤、数据扩充、query优化、阈值截断等⽅法优
针对于特定应⽤场景下, 实现智能对话客服系统, 主要负责关键词提取、稀疏检索器的实现及优化等⼯作: 1)对数据进⾏处理, 并使⽤TF-IDF、TextRank等⽅法进⾏关键词提取, 使⽤稀疏检索器实现搜索匹配; 2)通过层级信息的使⽤、数据扩充⽅法、基于PageRank思想的⽂档