1、传统机器学习算法,基于spark平台实现和使用
2、基于spark+streaming平台,用FTRL进行实时个性化推荐系统
3、基于TensorFlow的DNN个性化推荐
4、基于spark平台的数据挖掘、数据处理(包括hbase,hdfs,kafka)
5、基于caffe的图像分类,视频内容识别(熟练掌握 Inception、resnet系列)
6、基于python的爬虫技术,尤其是在图片抓取方面
7、基于spark和python搭建整个工程的框架,搭建数据流
8、基于python的高性能服务端开发
9、基于FFmpeg的软件视频编解码
1、某海外短视频个性化推荐
(1)FTRL算法基于spark平台用scala实现
(2)视频content profile,user profile构建,基于spark streaming实时更行,日志在kafka中
(3)GBDT选取特征,构建训练数据的pipeline
(4)构建实时数据pipeline,实时更新模型
效果:全量后,观看平均用户观看时长涨了200%
2、某海外直播个性化推荐
(1)在TensorFlow平台下,构建基于DNN的推荐系统
(2)基于TensorFlow Serving 对外提供打分功能
(3)特征主要是行为日志,直播实时数据、直播截图的图像特征
效果:比之前的LR推荐系统观看时长,打赏金额都涨了10%以上
3、某海外直播视频内容理解
(1)成人鉴黄模型构建,主要是基于inception v3和 resnet50 模型融合进行的
(2)小孩涉黄模型构建,主要是基于inception v3和 resnet50 模型融合进行的
(3)基于senet 视频内容中指定物品识别,比如钢琴,天空等
(4)图片下载中心、流量转发中心、cnnserver的构建
效果:小孩涉黄零举报,成人涉黄每周举报数降了50%
4、某海外直播的视频编解码优化
(1)基于FFmpeg对视频进行编码,压缩,解码
(2)基于mobileNet对视频进行无损压缩
效果:带宽节省了50%
角色 | 职位 |
负责人 | 高级算法工程师 |
队员 | UI设计师 |
队员 | 后端工程师 |