熟悉机器学习常用算法,如线性回归,SVM,随机森林,聚类,GMM 等等。
熟悉计算机视觉核心技术,如图像处理中的滤波,对象处理,分割,纹理分析等;视频分析
中的摄像机模型和校准,立体视觉,深度估计等。
熟悉深度学习常用神经网络,如前馈神经网络,反向传播,卷积神经网络,循环神经网络(包
括LSTM 神经网络)等。
有扎实的编程基础,熟悉Java 和 Python 语言,以及相关常用库,如scikit-learn,numpy,
matplotlib 等。
熟练使用TensorFlow,Keras 平台,以及OpenCV。
有良好的数学基础,以及扎实的数据结构与算法功底。
熟悉MySQL 数据库基本原理以及增查改删等指令和常用函数。
了解Linux 开发环境以及基本操作指令。
具备优秀的英语听说读写能力,能熟练阅读英文文献以及流利地日常口语交流。
勤奋踏实,有较强的责任心,有探索精神,具备良好的团队合作意识和沟通表达能力。
1. 物体识别
项目描述:
该项目应用机器学习算法实现一个物体识别。
首先,从整个CIFAR-10 数据集中选择一个包含10 个物体类别的子集,每一个种类包含1000
个训练图像和100 个测试图像。然后运用HOG 算法提取数据对应的特征值,之后运用机器
学习中的监督学习算法如SVM,通过拟合训练数据的特征值,获取一个测试模型。最后,
运用获取的模型对测试数据进行分类,并提供预测值正确率以及混淆矩阵。另外,针对不同
的机器学习算法,需要调试其中相关的超参数,从而找到拟合最好的模型,即标签正确率最
高。
2. 脸部识别
项目描述:
该项目应用Haar 级联分类器实现对一个视频进行脸部和眼睛识别。
使用OpenCV 中的CascadeClassifier 函数,为脸部和眼睛分别创建一个Haar 级联分类器。然
后获得视频中的每一帧并转为灰度图,并对脸部进行识别,用一个边界框标识出来。在有识
别到脸部的每一帧中,再进行脸部的眼睛识别,并用一个不同颜色的边界框标识出来。
3. Pac-Man
项目描述:
该项目运用计算机视觉技术去进行一个3D 的Pac-Man(吃豆人)游戏。
首先,使用Kinect 系统收集一组具有外观特征(即RGB 值)的3D 点云。几个虚拟球体也位
于这些点云之间。运用HOG 技术从这些图片中提取出特征值,然后运用随机森林或者卷积
神经网络训练一个模型进行二分类,去判断某场景是否包含虚拟球体。
在游戏开始时,初始位置以及摄像机初始角度都在原点。之后进行一个循环:获得当前场景
的视角,提取特征,运用已训练好的模型获得分类预测结果的概率,如果有球体被发现,移
动到确定的坐标位置并更新场景;如果没有发现球体,则旋转摄像机以找到球体