1.熟悉C/C++、shell脚本程序设计,python编程
2.熟悉STL标准库开发,并了解Boost开发库
3.多年的搜索引擎和自然语言处理(NLP)及其相关的开发经验
4.五年Linux服务器端系统开发经验,能熟练运用gcc、gdb、emacs、make等开源软件
5.丰富的Linux网络编程、系统编程经验,熟悉基本的数据结构和算法,拥有丰富的网络
方面的知识。熟悉多线程、进程间通信程序设计。
6.熟悉存储相关的知识,拥有较多的分布式文件系统开发经验
7.熟悉RPC、Select、epoll开发,熟悉TCP/IP和HTTP协议。
8.熟悉Mysql数据库,掌握常用的SQL命令
1、爬虫系统:从多个不同的渠道进行数据的抓包、下载、解析、存储。
2、搜索系统:分词、多种权重计算公式的设计(排序)等等。
3、新技术的开拓和预研等等。
4、使用NLP技术进行文本的分词、词性标注、句法语法分析、实体识别、关键词的抽取等等
5、负责过一款广告投放系统的研发工作。