使用爬虫获取近万篇谷歌论文信息,对抗反爬虫机制有比较深刻的了解
CCF 中国好创意广告点击预测比赛第 1 名
关键词:LR randomForest GBDT
天翼大数据视频点击预测比赛初赛第 2 名
关键词:One-Hot 模型融合 多目标优化
CCF 中国好创意垃圾短信预测比赛第 4 名
关键词:文本特征 Liblinear XGBoost
Data Castle 职位预测比赛预测比赛第 4 名
关键词:样本扩充 多类问题 特征提取
第六届全国信息技术应用水平大赛 C 语言组一等奖 江苏省第十一届非理科专业高等数学竞赛本科一级组一等奖
KR 项目的数据监控和维护【百度工作】
• 关键词推荐各产品(被动推荐,主动推荐,冷热词)护航监控指标例行产出,保证指标的准确性, 并建立异常报警机制
• 支撑小流量实验核心指标的快速产出,方便查看实验效果,能够支持分时间段、分平台、分流量 等不同维度的对比分析
• 维护主动推荐的线下流程;支持检索端和 KR 线上开发;临时统计需求能够按时准确给出;
智能对抗系统的开发【腾讯实习】 2016.6 – 2016.8
实时预测 离线训练 打击恶意加好友 Q 盾数据分析
• 对恶意加好友行为进行实时预测,打击恶意 QQ 号量新增 2.1%,准确率 100%
• 对 Q 盾数据进行分析 (1) 提出建立用户画像新的角度 (2) 发现恶意模块的“城市聚集性”
软件 Bug 检测系统
独自完成 异常点检测 主动学习 无监督学习
• iForest 异常点检测算法,检测含有异常的软件
• FP-Growth 频繁项挖掘算法,获取频繁项,提取隐含的编程规则
南极科考项目的图像标注系统
独自完成 图片拐角检测 聚类
• Harries Corner Detection,检测图片中的拐点 • DBSCAN 聚类,找到经纬线的交点
• 采用递归算法,标记交点的经纬度
苏州大学程序设计在线考试系统
独自完成 数据库设计 前后台代码实现
• 学校期中、期末以及研究生入学考试都会使用该系统 • 考试难度系数控制,能自动生成不同难度的考试试卷
• 实现了 C、C++、Java 等多门语言同时在线考试功能