自然语言处理、文本数据挖掘、图像分类、神经网络翻译、地名地址匹配、地名相似度计算与融合、数据可视化、数据空间化、地名爬取、网络相关信息爬虫、数据采集与存储、部分机器学习模型使用于测试、按照规范的数据处理工作等等。
1.互联网爬虫,爬取了人民日报1946年-今天的新闻报道数据。该网站限制ip、反爬虫机制较强。
2.数据挖掘,开发过公安领域的犯罪数据挖掘、可行性较好。
3.自然语言处理,利用机器学习或深度学习完成某项目对命名实体识别的要求
4.地名地址相关,可以对地名地址进修爬虫、补充、融合、标准化、计算空间位置等操作。
互联网爬虫,爬取了人民日报从发文开始到目前位置所有的新闻数据,爬虫为人民日报图文数据库,该数据库限制ip,限制访问次数等反爬虫机制,均被一一解决。
该系统通过对互联网上相关地名地址的获取并与公安内部标准地址进行比对,发现数据不一致、漏查、漏管的地方,可视化到地图上并通知相关片区进行查询。