随着安防数据的增加,在各种视频、图像中进行检索成为越来越重要的问题,这其中基于特征的相似度检索应用最为广泛,例如,人脸检索、车辆检索、人体检索以及基于这些检索的大数据应用:轨迹检索、聚类、同行分析等。
k近邻搜索(k-NNS)是对图像特征检索的一个最好描述,即在数据库中查找与输入特征最近的k个特征并返回的过程。最简单完成这项任务的过程是“暴力搜索”,即将输入特征与数据库中所有的特征全部比对一遍,然后按照相似度(或距离)进行排序,取最相似的k个特征进行返回。
在大规模的数据库中进行图像特征的检索是一个公开的难题,难点在于图像特征不能像文本那样可以非常简单、方便的建立索引后进行快速检索。暴力搜索的时间在数据库非常大时,非常耗时,以256维浮点特征为例,在亿级库中进行一次暴力检索需要时间约10秒,在实时响应系统中很难达到实用。
本项目可以做到百亿级人脸向量数据实时响应的效果,同时具备将同一人的无标签数据自动识别归类。