1. python: 10+年经验
2. c&c++: 10+年经验
3. 神经网络&深度学习: 网络结构优化, 参数优化, 数据预处理, 数据增强
4. NLP: 搜索引擎索引, 检索相关
5. 网络爬虫: 全网爬虫, 涉及页面抓取, 种子优先级调度, 全网覆盖率, 宽度覆盖, 深度覆盖策略等
====
1 深度学习, 图像识别, 目标定位模型改进, 基于Resnet152+YOLOv2, 针对anchor匹配规则改进, 以及反向传播的梯度比例优化超参数, mAP达到78.3%, 比论文结果76.8%提升1.5%(vocdata, 416x416)
2 深度学习, 细粒度用户评价情感分析, 基于用户评论, 采用GRU+Attention模型, 分析用户细粒度情感倾向, 作为电商平台的推荐引擎基础组件, 包括(商品效果)/(商品价格)/(服务态度)/(满意度)等多个指标, 综合准确度 > 92%
====
心量科技技术合伙人, 研究方向为心脏HRV金标准评估体系, 主要切入点为民用可穿戴设备, 包括心率带, 心率表, 手机摄像头等
1. 2015年, 通过PPG数据分析, 有效峰值识别, 低通滤波降噪, 异常点识别等手段, 研发基于手机摄像头的高精度HRV测试, 拿到天使轮融资100万
2. 2016年, 与阜外医院康复科, 联合研发心脏病前兆检测, 与术后恢复检测, 通过小波变换的基线漂移修正, 以及傅里叶变换的特征频率等数据处理方法, 心律不齐阴性检出率>99%, 阳性检出率>94%
3. 2016年, 与联想合作, 为zuk2pro手机研发心脏年龄, 心脏健康度检测模块
4. 2017年, 与乐课合作, 基于运动生理学, 通过能量消耗比例, 最大心率模型, EPOC消耗等, 基于多层神经网络, 研发AI私教, 15分钟的运动效果, 约等于慢跑2小时, 最大化”燃脂率”
5. PA16011734CD, PA16011735CD等8项发明专利(5项已授权, 1项公开, 2项二通)
====
1. LSA潜语义搜索模型
- 基于奇异值分解的潜在语义发现
- 搜索’苹果’, 潜在关联结果’乔布斯’ | ‘iphone’等等
2. 基于互信息熵的新词发现
- 基于每日新闻, 论坛, 社交网络等信息来源, 发现新词
- 比如在小说”盗墓笔记”中, 可以发现, ‘蛇眉铜鱼’, ‘徐阿琴’, ‘闷油瓶’等书籍专属名词
- 每日发现新词200-300
====
1. 全网爬虫, 涉及页面抓取, 种子优先级调度, 全网覆盖率, 宽度覆盖, 深度覆盖策略等, 涉及到以下数据
- 服务器240台
- 1500亿URL的存取, 更新, 合并
- 每日抓取约700万网页
2. 页面解析涉及面包屑信息提取, 垃圾信息识别, 标题正文等区域信息提取等
3. 实时爬虫调度
- 约20万新闻/天, 时效性5分钟内
- 用于舆情, 新闻
深度学习相关研发, 图像目标定位模型改进, 基于Resnet152+YOLOv2, 针对anchor匹配规则改进, 以及反向传播的梯度比例优化超参数, mAP达到78.3%, 比论文结果76.8%提升1.5%
对心脏健康度进行打分测试, 利用心率带, 心率表, 或手机摄像头等便携设备,通过PPG数据分析(手机摄像头), 有效峰值识别, 低通滤波降噪, 异常点识别等过滤方法, 得到高精度HRV检测, 可以进行房颤, 室早, 心律不齐等心脏病前期预防
基于互联网爬虫, 基于互信息熵的新词发现, 基于每日新闻, 论坛, 社交网络等信息来源, 发现新词 - 比如在小说”盗墓笔记”中, 可以发现, ‘蛇眉铜鱼’, ‘徐阿琴’, ‘闷油瓶’等书籍专属名词 - 每日发现新词200-300