熟悉opencv中图像处理原理,并可以基于python语言实现图像处理的基本要求;
熟悉pytorch深度学习框架,可以实现包括但不限于目标检测,像素级图像分割,图像生成等需求;
熟悉语音识别等基础理论知识,能基于现有的语言模型,实现语音识别和翻译等功能。
强反射表面高光去除,我负责算法的开发和验证,首先对不同光源视角,相同相机下的三幅图像进行预处理,然后使用最小值算法将三种图像进行像素级融合,去除高光区域,最后使用同态滤波对hsv中的V通道进行调整,最后返回到RGB图像,调整图像的亮度和对比度。
主要负责CT违禁品(主要有12种)智能识别算法的开发和部署工作,包括二维CT图像的识别算法的开发和调试,通过二维算法检测出来的违禁品坐标,融合成三维空间坐标,使得在安检过程中,不仅能识别出行李或者箱体中的违禁品类别和数量,还能进行三位空间定位,我负责二维CT图像的识别算法的开发和调试以及三维空间坐标定位和显示。