1、研究⽅向:数据挖掘和算法、机器学习与深度学习、计算机视觉、多媒体内容分析理解、物体和⼈物检测分割等。
2、编程能⼒:熟练使⽤Python(包括numpy/pandas/sklearn等库),熟悉C/C++/Matlab,拥有良好的数据结构和算法功底。
3、框架⼯具:熟悉Linux系统,熟练使⽤TensorFlow/Pytorch框架、OpenCV 算法库、Git/Vim/Shell/Docker/SQL/FFmpeg等⼯具。
视频智能拆分项目
1、深⼊分析⼴电媒体客⼾的需求,解决业界巨量综艺节⽬素材的拆分难题。
2、研究多模态表征学习、视频通⽤事件检测、视频时序切分点预测、OCR、ASR等算法⽅向,输出了两套算法框架⸺基于特定⼈物定位和报幕OCR
信息的规则拆条,基于声纹/报幕/⼈物特征的端到端拆条。后者是⼀种业界全新的解决⽅案,鲁棒性和泛化性得到显著的提升,⾃测数据中平均
Fscore可达85.6%,同时整体模型⼤小仅有100余M,处理⼀个5小时的视频仅需5-10分钟。