详细功能:舆情系统是智能化爬虫系统、NLP系统等多个系统的封装。智能化爬虫系统在传统的爬虫系统上,实现了与人工智能系统的结合。该系统能够自动分析目标站点及网页结构,在满足相应协议的基础上,确定目标信息的位置,并将信息进行提取;文本过滤系统根据对文本及语义的分析,自动识别包含财经信息的文本。对与财经无关的信息以及垃圾信息,自动进行过滤,以减少无效信息的干扰。在该领域表现远高于许多同类产品。敏感性分析系统克服了在财经领域,情感分析与舆情的敏感性并不存在显著的联系的特点,通过对训练集进行预处理,减少样本数据不均衡导致的偏差等问题,并通过聚类算法,判断与负面信息相应的文本特征,此外添加人工预设特征,提升准确率。