熟练掌握数据结构及基础算法理论,并能熟练运用。
精通c/c++/java/python/javascript等编程语言。
精通linux操作系统, 精通linux环境下各语言编程环境。
熟练掌握操作系统原理及tcp/ip网络协议。
熟练掌握搜索引擎及推荐系统原理及系统设计。
熟悉机器学习理论,TensorFlow框架,并有实际算法实践经验。
能阅读领先技术论文。
微博实时搜索与推荐
负责微博实时数据采集框架的设计开发,负责实时搜索设计,负责推荐算法的设计及推荐系统的开发。本系
统提出一种基于混合过滤的实时推荐算法,试图利用从用户的搜索历史中找到用户的信息需求特征,并依此
给用户进行推荐。
拼写检查算法设计
设计一个高效的算法,根据用户输的检索词或者词组,在海量数据的词典(通常是 10GB 级别)中根据单词间的
编辑距离, 目标在 20ms时间内快速找到检索词或者词组中可能出现的错误,并找到与检索词或者词组最相近的
n 个词或者词组反馈给用户。通过给词典建索引,并辅助与前缀树和后缀树,目前可以实现在 100ms 内找到 10
个与检索词编辑距离最小的词或者词组返回给用户.