语言:Python,C++,JAVA,C,HTML,Markdown,CSS,JS
操作系统:Linux(Ubuntu,Arch),Windows(11,10,7),macOS
框架:TensorFlow,PyTorch,Keras
开发工具:PyCharm,VS Code,Visual Studio,Android Studio,Jupiter
数据库:MangoDB,SQL Server
图像处理和计算机视觉算法:篡改检测,图像分类,图像分割,目标检测,语义分割
模型优化和调试:模型设计、超参数调整、模型微调
模型部署和推理:模型部署、服务器配置、性能优化等等。
1. 图像拼接篡改检测和定位
利用基于白盒方式的图像融合方法,直接学习应用在合成图片上的各项属性调整参数,生成了具有挑战性的图像拼接篡改数据集。基于此数据集,提出了端到端的RGB和噪声双通道多层次拼接篡改检测方法。
涉及到的技术:Python语言,PyTorch框架,Transformer网络结构,HRNet底层网络
2. 人脸识别系统
在使用OpenCV完成从网络爬取以及摄像头采集的人脸数据集预处理之后,使用DLIB库进行人脸检测,将保存的人脸送入卷积神经网络进行训练,得到最后的参数模型,同时,设计了用户友好交互的本地识别界面。
设计技术:Python语言,TensorFlow框架
3. 自动车牌识别
提出了使用U-net和CRNN结合的方法来进一步改善车牌的检测定位和字符识别的准确度,极大减少了训练集的样本数量,提升了模型生成速度。
我们将最后的检测和识别模型在公开的数据集CCPD上进行了评估,整体准确率比CCPD中提出的方法高了2.7%。