利用熵值法计算各关键字对各分类的权重值的矩阵构造流程:
1、从6月份的数据中提取目标信息,主要包括:处理意见、在线办结意见、匹配大督查以及类别、匹配大督查二级类别、匹配大督查三级类别,共五个字段的内容。
2、对提取出的内容进行整理,剔除匹配大督查三级类别为空的记录。
3、对整理后的信息进行合并,合并规则:按照大督查三级类别的名称合并,也就是将匹配大督查三级类别相同的记录对应的处理意见+办结意见合并在一起。
4、使用所有的关键字对合并后的记录进行匹配,统计各关键字出现的次数,即为矩阵的的元素。