一、标讯数据库
1、基于全国全量公开市场政企信息化项目中标数据。
2、清洗、去重、去杂、校验、补全。
3、关键词提取和标签抽打。
4、招采文件采购需求解析和关键词提取。
二、政策文件库
1、全量收集中央人民政府及其组成部门的政策文件。
2、提取文件名称、发布单位、发布时间覆盖范围、有效时间、关键词频次、附件等。
三、其他公开数据
1、收集、整理、分析专项债、财报、舆情、工商信息等。
2、数据信息源杂、存储模态多、格式化困难,提供手工整理与分析。
四、商机及图谱库
1、组合统计分析招采单位、招采单位统称、行业标签等6个大类字段。
2、根据场景词出现的频次定义商机。
3、对商机要素做画像分析。
4、找出指定的时间和空间的热门场景词。
5、找出招采单位与中标单位之间的客情关系深浅。
6、筛选特定场景主要供应商信息。
7、将商机按照出现信息源的维度和关键词的频度进行打分分级。