一、需求描述:
0. 二维设计图案即指吉祥物、LOGO、图标、徽等类型的图片。
1. 实现一个百度或必应或谷歌图片的增量式爬虫,主要爬取二维设计图案,所谓增量式即在第一次全量爬取之后,能周期定时更新搜索引擎新增的图片,而不需要每次都再全量爬取一次。
2. 利用1的爬虫,建立一个十万量级的二维设计图案的图片数据集/库。
3. 设计针对二维设计图案的特征提取和相似度检索算法,实现相似度匹配,用户输入一张二维设计类图案,从2的数据库中返回近似的前K张图。可以利用已有的任何开源成果,但需要有创新之处,特征最好是传统特征+深度特征相结合,算法需要有至少三种针对二维设计图案这个类型的优化(一般的预训练的网络都是针对自然图像的,一定要有针对二维设计图案的优化),要求有一定的准确率,算法效果好可以再加价。
4. 简易的用户界面,输入图片展示返回结果。
5. 完整的实现文档。
3是重点,1、2也可以找公开的二维设计图案数据集(如果能找得到的话,例如LOGO的METU数据集),4只要能用就行。
详细情况还可以再沟通
相关内容和参考资料:关键词CBIR,基于内容的图像检索,https://github.com/willard-yuan/awesome-cbir-papers、METU数据集
二、人才要求:
熟悉CBIR的,有深度学习和计算机视觉相关经验的
三、参考产品:
https://github.com/pochih/CBIR
四、合作方式:
开发方式:远程开发。
开发周期:5天