熟悉图像、视频、文本等多模态深度学习算法,包括不限于:目标检测、图片/视频多分类算法
熟悉OpenCV、xgb/lgb、sklearn等常用库
了解爬虫和推荐算法
主写Python,熟悉TensorFlow及Pytorch
熟悉sql和golang
拥有多年算法研发经验,对多模态算法研究深入,在国内知名比赛中获得前三。开发包括图片质量识别、ocr、视频多模态理解、目标检测等多个实用算法,并成功应用于业务。
基于FFmpeg以及OpenCV,生成训练数据 经由优化的目标检测模型,对抹除痕迹进行识别 通过IoU设计帧间结果融合策略,得到视频级别的识别结果
针对视频的多个模态(包括但不限于标题、视频帧、音频、OCR等模态),设计各个模态的特征提取算法,并优化多模态融合策略,达到5w级别的多标签识别,应用于实际业务替换人工,并在某知名大赛中获得前三(多家公司参加)