开发环境:Anaconda3,PyCharm,pytorch
项目背景:机器人作为人工智能发展的主要方向之一,服务型机器人是其中的重头戏。而机场、车站等场景下的服务型机器人需要对排队的或聚集的人群进行识别并且主动上前提供相应的服务,以加快旅客的通行,提升机场和车站的服务质量。所以本项目就是为了识别出机场中的队伍。
项目责任:该项目我主要负责模型的搭建和训练工作。本项目数据由我公司机器人现场拍摄,后由我部人员进行标注得到共得到6500多张图片其中包含多种形态的队伍,无队伍,一个队伍,多个队伍等多种图片。模型参考YOLO模型的设计采用end-to-end原理,将544*544的图片划成68*68个网格,然后预测每个单元格内是否有目标(该目标的中心代表该目标)每个单元格会预测2个边界框(bounding box),以及边界框的置信度(confidence score)。所谓置信度其实包含两个方面,一是这个边界框含有目标的可能性大小,二是这个边界框的准确度。从而得到人脸的位置。再用密度聚类的方法得到人群和队伍。本项目正在申请专利。