案例ID:190840
技术顾问:DarkMoonSword - 6年经验 - 某上市建筑行业软件开发公司
联系沟通
项目名称:使用python 爬取并清洗某小说网站
所属行业:企业服务 - 数据服务
以脚本的形式,根据传入的小说页面链接,绕过网站的反爬机制,爬取小说的全部内容,并且将小说内的广告等多余文本清洗和整理,最后将小说进行分章节或者整本保存在本地。另外配套一个微服务器,对某本小说进行定时的检测,爬取最新内容。 个人设计并完成开发,分三个模块,第一个爬取模块根据传入的URL进行爬取内容,第二个模块为清洗模块,对爬取的内容根据设定的规则进行清洗,对目标文本进行文字反爬的操作,最终将文本保存到本地。
其他人才的相似案例推荐
项目描述:MAD WORLD是企业和广告公司的衔接中心,通过
项目描述: CoinHouse是首家面向全球用户专业的离岸银
1. 数据处理 2. echarts各类图标(直方图,柱
1. 导出表格修改导出后的样式 2. 百度地图点选 标点
a. 技术栈:Vue、jQuery、基于 antd、vant
项目介绍:办公自动化请假功能模块主要是通过请假报表来分析员工
通过python的request读取json信息爬取商家需要
通过调用腾讯云智能图片识别API对与输入的图片表格进行批量识
开发并完善类似钉钉的办公系统开发,后面使用同一套代码上架多个
该工具是一个企业应用,主要是用于工厂生产SSD时候对产品的各
此项目中主要负责大屏页面,设备运维流程,用户权限管理的开发
本软件是为了实现在工程建设中,方便施工方在实时建设中为了准确
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送