案例描述:针对用户面临的互联网舆情监管难题,无声信息根据互联网发展势态,自主研发了“飓风大数据舆情分析系统”(以下简称”飓风舆情系统”)。该产品通过收集与汇聚融合互联网各种重要新闻网站、社区门户、BLOG、搜索引擎等网络信息,然后通过大数据技术对相关内容进行分析挖掘,利用智能标签、智能聚类、自动垃圾过滤等技术,能够帮助相关监管部门及时有效地了解互联网舆情整体态势以及对专项舆情话题进行深入分析。具体包括,对互联网上重大、突发、敏感事件的出现、发展、演变动态进行监测,准确分析网络热点事件的脉络,把控舆情事件的网络扩散情况,以及传播、演变轨迹,识别舆情事件发展过程中的敏感人物,并建立重点人物信息库,方便后续跟踪并及时预警。
我的职责:1. 部署1101爬虫(Java环境) 2. 部署101爬虫(Python环境) 3. 部署1101的HDFS、HBase、Spark、Gplum主备节点,Neo4j服务器 4. 部署1101Solr集群服务器 5. 部署1101Web服务器 6. 将1101Web提供给测试组内其他同事进行测试 7. 配合开发人员更新WEB端代码/爬虫代码以修复BUG