熟练使用opencv,pytorch等进行机器视觉相关开发,包括模型训练以及部署到pc、移动设备anroid/IOS。
熟练使用tensort、MNN、tnn等部署模型。
熟练使用obs\ffmpeg进行二次开发。
熟练使用opengl/vulkan/metal/cuda在pc和手机上进行算法加速。
使用较多的语言,c/c++/python
1、裸眼3D屏幕的缺陷检查
2、带眼球追踪裸眼3D显示算法开发,以及人眼、屏幕、3D视点的自动标定算法开发。使用opencv,ios/android原生开发。
3、基于ffmpeg的3D视频播放器开发。使用opengl\glsl进行3D加速渲染。
4、2D视频转3D视频,设计训练单目深度估计模型,方案一: 点云渲染/空洞填补。方案二:深度模型,生成新的立体视图。
5、2d视频转全息视频。 2d视频转40个视点的视频, 空洞部分通过搜索前后帧图像获取,完成补洞。
6、开发obs插件,拉直播流,实时转成3D图像,同时推流到服务器。实时将直播流转成3D直播流(1080p),直播延时3s。
开发OBS插件,实时将2D直播流转成3D流。画面无抖动,3D效果和出屏程度可以调节。只需单张4090d显卡
钛客全息手机,主要负责眼球追踪算法,全息显示算法,全息游戏引擎的开发。 深入cameraHal层,嵌入眼球追踪算法,极致的发挥手机的性能。