一、项目需求
主要是采集微信公众平台的数据以及数据清洗:我们有自己的原创作品,需要监测微信公众平台哪些公众号转发的了我们作品,作品有文章(文字作品)、条漫(主要是长图片)以及视频。我们需要找出来哪些公众号在发布消息的使用使用了我们的原创作品的内容,最终至少形成含有如下信息的Excel表格:侵权公众号的名称、微信号、运营主体(若是同时能够抓取运营主体的社会统一信用代码、法定代表人、地址和联系方式就更好了)以及侵权链接、侵权文章字数(文字作品有)、使用的时间段(视频作品)等等。
二、工程师要求
至少有python爬虫经验,最好是有相关微信公众平台的爬取经验;对于文字对比分析、图像对比分析比较熟悉;若是能够具备一些前端开发技能就更完美了。
三、项目费用和周期
我们是初创公司,对于成本还是比较在意。我们是希望工程师能够给出性价比较高的方案,对于第三方的资源可以充分利用,以节省开发时间以及开发成本。