以下均为我工作中掌握的技能
编程语言:Python/C/C++/shell
分布式计算:Hadoop
工作环境:Linux/Unix/Windows
版本管理:SVN/Git/CVS
测试相关:gtest/nose/valgrind
数据库相关:MySQL/MongoDB
Web框架:Django/Tornado/web.py
基于用户检索行为的新词挖掘(2016.05-2016.07)
项目角色:负责人
项目介绍:基于百度用户检索行为,挖掘高时效性新词,为浅层词法分析提供基础资源
主要工作:
1. 利用Hadoop平台处理query-相关query,query-title等检索行为数据,搭建数据处理流程
2. 研发无结构化新词挖掘的候选抽取、提纯等策略,产出高质量新词
项目收益:周级别挖掘新词2w+,准确率95%+,支持中文分词等应用模块
Python静态代码检查工具pylint改进(2012.06-2012.08)
项目角色:参与者
项目介绍:针对pylint的功能缺失,结合公司当时现状,分析整理出一批需要覆盖的检查点。通过编写
pylint插件的方式,丰富产品功能,提高产品代码质量
主要工作:参与其中两个插件的开发工作,独立完成从需求分析、功能开发、整体联调到产品维护全过程
项目收益:产品挂载到公司内网tools页面,供全部工程师使用,累计发现代码风险200+,嵌入研发流程