1)熟悉Python视觉编程;
2)熟悉OpenCV/PCL等视觉开源库;
3)GUI开发和软件交互设计能力;
4)熟悉解决视觉问题常用的深度学习框架(Pytorch/TensorFlow/Keras);
5)跟进视觉领域的最新网络/模型;
6)良好的传统数字图像处理tricks/算法积累、经验和直觉;
手眼口疾病检测项目:
1、收集数据集
1.1 收集儿童红眼数据,因为其量极少,所以必须通过图像增强方式对其增量,手段有:旋转、裁剪、HSV色域变幻等、
1.2 收集蛀牙数据、手部疾病数据、通过上述方式进行数据增强
1.3 配置数据集,不合适的数据集会对训练结果产生较大影响,所以需要对数据集进行合理配置,如对正样本、负样本等样本的数量进行适量调整。
2、选择模型进行训练
2.1 针对业务进行模型选取,CNN、RNN、YOLO等
2.2 业务要求显示图像并且相应速度快,因此采用YOLOv5进行训练
2.3 进行模型部署,将其部署在云端。需要较好的配置,TeslaV100.
2.4 进行训练
2.5 验证结果,进行优化,通过调参、优化结构、遗传训练等技术手段进行优化
3、算法移植到嵌入式设备后预测
3.1 确定需要将算法移植到哪里,安卓、苹果,哪一种硬件平台。
3.2 进行移植,搭建环境、搭配驱动、调试,直到移植完成
3.3 进行预测
凡是公司机器人的视觉算法部分,全部由本人设计完成,本人已经申请了多个专利,产生十分丰厚的利润,创造了极大的价值!
虽然外形一样,但是其内部的算法功能很多,单单视觉部分就有4种检测算法,除此之外还有张口开合度等内置算法,是本人的得意之作。