⚫ 熟练掌握Python 编程语言,熟悉Python在图像处理中常用算法。
⚫ 熟练掌握常用机器学习算法,包括分类(逻辑回归,SVM 支持向量机,决策树),回归(线性回归,回归树),聚类(Kmeans),降维(PCA,LDA)等,并用 sklearn 实现。
⚫ 熟练掌握常见的深度神经网络模型,如 AlexNet,VGGNet,GoogleNet,ResNet等。
⚫ 熟悉目标检测和图像识别常用算法,有 Faster_RCNN、SSD 等识别网络框架使用经验,可以根据不同场景调节相关参数。
⚫ 熟练掌握OpenCV 在图像、视频方面的应用,如:图像变换,图像特效,人脸检测等,熟悉使用 Dlib 图像处理相关算法。
⚫ 熟练掌握对抗神经网络(GAN,DCGAN)在图像生成,图像风格迁移,图像补全,超分辨率重构方面的应用。
⚫ 熟练使用深度学习框架 Tensorflow 并实现自己设计的网络,熟悉Caffe 框架。
⚫ 熟悉网络爬虫技术,如 urllib,requests,bs4,Scrapy 等框架。
⚫ 熟悉常用数据库软件 MySQL 的使用。
⚫ 熟悉 Linux 操作系统的使用,掌握 Linux 常用命令,能够在该平台下进行相关开发工作
⚫ 熟悉C/C++编程语言
一:人脸认证网页登陆
在多个 BS 政务监管系统登录模块增加人脸认证方式,前期采用 python+openCV+Dlib 模式,后改进为 openCV+mtcnn+facenet+flask 模式。
1、Dlib 模式:预先存储好相关人员的人脸照片,opencv 调用摄像头获取照片后用 Dlib 对齐人脸,通过与数据库中人脸计算欧式距离检测相距最近的,将判断结果用ajax 传到前台。
2、mtcnn+facenet 模式:分为注册和登录两部分。注册用 openCV 实现从摄像头读取视频帧,对读取的视频帧采用 mtcnn 方法检测人脸,通过 facenet 对检测的人脸进行 embedding, 映射成 128 维度的特征向量,其中标签为人名,存储到数据库 csv 文件中。登录时对新读取的人脸数据与数据库 csv 文件中的 128 维度向量计算欧式距离,返回距离最小值对应的标签给前台。
二:园区智慧停车项目 车牌定位识别模块
配合智慧园区建设项目,改造部分停车点自动抬杆,使用 CPP+openCV+SVM+ANN 实现。
1、车牌定位:在视频帧中依次通过颜色筛选定位、高斯模糊、灰度化、Sobel 运算、二值化、闭操作、倾斜矫正并统一尺寸后得到包含车牌的若干个图块,分别使用 SVM 模型判断图块是否是真的车牌。
2、车牌识别:对上一步获得的车牌图块通过灰度化、二值化、取轮廓获取车牌中所有字符的二进制黑白小图块,依次用训练好的 ANN 的 MLP 模型预测相应字符,排序后即可。
三:基于对抗神经网络生成人脸图片
通过爬虫爬取百度图片中大约三千张人脸图片,用 mtcnn 对齐人脸并裁剪,交由生成器
generator 学习真实图像分布,再由判别器 discriminator 真假判别,最终判别起预测概率接近
0.5(相当于随机猜测)。
在实际训练中,使用 GTX1060 迭代一百次耗时 2 小时,D_loss 和 G_loss 均为 0.7 左右, 已达到不错效果。
四:爬取QQ音乐,百度图片,京东商品数据信息等。