1 精通python,C++初级,熟悉pytorch、sklearn、numpy、pandas、matplotlib、flask、spacy、gensim、neo4j和huggingface 等;
2 熟悉用opencv进行常见的图片处理;
3 熟悉linux开发环境,vim、git、svn;
4 熟悉逻辑回归、kNN、k-means和模型集成,熟悉CNN、RNN、LSTM、Transformers的基本原理和实现;
5 熟悉神经网络的训练、调参,熟悉不同的优化方法,熟悉不同的神经网络组件;
6 熟悉图片分类、目标检测、图像分割、人群计数和模型压缩;
7 熟悉RCNN系列、Retinanet、Detnet、Centernet、Yolo,熟悉FCN、PSPNet、Unet及其改进,熟悉Mean-Teacher、Autoencoder、Vit;
8 熟悉一些NLP模型,TF-IDF、Word2vec、FastText、Transformer、Bert、Albert、Longformer等;
9 英语六级,能够在翻译软件帮助下阅读论文
1 金融实体NER;
2 词云;
3 文本摘要;
4 NLP工具Api;
5 烟盒缺陷检测;
6 门板缺陷检测;
7 密封环缺陷检测;
8 人群计数;
9 车辆行人检测。
对烟厂的烟盒包装进行缺陷检测。数据的特点的有大量的ok样本,少量ng样本,所以采用了无监督学习和监督学习结合的方法。无监督方法只用ok样本训练,能检测整个烟盒上的未知缺陷。用监督学习对烟盒开口处进行分类,区分翻边、 露白,并用cam进行热图可视化,用特定算法进行ood检测。
密封环缺陷检测是对密封环上的裂纹进行缺陷检测,采用语义分割的方法。数据特点是数据少,缺陷面积比较小,属于低层的语义,所以采用Unet,并对它进行改进,使其能很好的复用底层特征。Loss实验过CrossEnropyLoss、FocalLoss、IOULoss等。
板缺陷检测是对门板上的划痕、凸起、压痕进行检测,采用目标检测的方法,刚开始模型是用的开源detectron2框架,后来通过对retinanet论文的研究,自己实现了retinanet。
用改进后的CSRNet进行人群计数。