熟悉c++和python编程语言,熟练使用数据结构与算法
有基于阿里飞天的c++分布式开发经验
主导开发了多个基于python tornado的后台项目
刚转型nlp领域,熟悉transformer结构,已有两个相关项目落地中
目前担任架构师职位,能够针对用户需求,选择合适的技术架构实现
大规模人脸聚类服务
自研的人脸聚类算法,通过改写开源hnswlib代码实现算法,支持十亿级别人脸特征聚类;
通过float转int8大大提升了算法运行速度,减少内存占用,并采用avx512进一步加速运算速度;
通过binlog实现增量索引落地,从而是服务达到数据库级别稳定性,并提高了索引落地速度;
整套服务由核心算法模块(c++)、web服务(python tornado)、数据库(mysql)组成
京东多模态对话比赛
采用GPT模型实现,取得比赛第二名
自研的人脸聚类算法,通过改写开源hnswlib代码实现算法,支持十亿级别人脸特征聚类; 通过float转int8大大提升了算法运行速度,减少内存占用,并采用avx512进一步加速运算速度; 通过binlog实现增量索引落地,从而是服务达到数据库级别稳定性,并提高了索引落地速度
采用GPT模型实现,取得比赛第二名 方案:仅保留Transformer模型的Decoder端,参考Masked Self-Attention实现Masked Answer Labels。同时,通过结合数据层面滑动窗口方法以及Context + Question + Answer