使用网络爬虫技术,编制程序软件,实现线上服务事项信息自动生成线下电子文档功能,这一自动化处理方式,目前在我局已得到应用。
网上事项信息,已经极大方便群众和市场主体查询和办理事项,要想编印一套与网上内容一致的线下电子文档,通常做法是采用人工录入方式编辑,如果编辑几百或上千条事项电子档,会耗时耗力,一旦网上事项修改了,需要对电子档进行手工修改,信息很难在线上与线下之间进行同步和同源。今年,为编印高频事项服务指南,我局另辟蹊径,通过自编软件程序,实现了一键生成高频事项电子档。
该程序软件,按照功能模块进行设计,共设计了六个 细分模块,即:一个县(市)部门列表、每个部门事项列表、部门指南、各部门指南合并、目录索引、目录与指南合并。如果只编制高频事项,在部门列表中勾选高频事项部门,在部门事项列表中选择所需的高频事项条目,通过有选择地生成事项指南信息,就可将属高频范围的事项纳入电子档内容。
该软件程序采用python语言,其中应用到爬虫利器 Beautiful Soup ,电子档部分采用python-docx,浏览器驱动采用Selenium WebDriver,使用的IDE为 vs code。