基本信息

案例ID:140856

技术顾问:大冶明鑫眼镜「电子科技」 - 2年经验 - 钰森熙电子科技有限公司

联系沟通

微信扫码,建群沟通

项目名称:Python爬去千千小说网并批量下载

所属行业:工具 - 办公软件

->查看更多案例

案例介绍

from fake_useragent import UserAgent
import requests
from lxml import etree

def takeurl():
headers={
'User-Agent':UserAgent().random
}
url='https://www.qqxsnew.com/95/95819/'
nodes=etree.HTML(requests.get(url,headers=headers).content)
data =nodes.xpath("/html/body/div[@id='wrapper']/div[@id='main']/div[@class='box_con'][2]/div[@id='list']/dl/dd[position()>12]")
for i in data:
title=i.xpath('./a/text()')[0]
newurl = 'https://www.qqxsnew.com'+i.xpath('./a/@href')[0]
print(title,newurl)
result=requests.get(newurl).content
response=etree.HTML(result).xpath("/html/body/div[@id='wrapper']/div[@id='main']/div[@class='content_read']/div[@class='box_con']/div[@id='content']/text()")
for x in response:
print(x)
path = "J:\study\小说\\" + title + '.text'
with open(path, 'a', encoding='UTF-8')as f:
f.write(x + '\n')
print("正在下载", title)
takeurl()

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服