1.Python 基础扎实, 有良好的编码习惯;
2.熟练基于 Requests, Scrapy, Selenium 各模块的数据抓取,利用Xpath, BeautifulSoup,Re 的数据清洗, 验证码,登录,js异步加密,等各种反爬措施的应对;
3.熟悉C,了解常用的数据结构与算法
4.熟练使用Python urllib、urllib2、requests等网络模块
5.熟练使用Python lxml、BeautifulSoup、re、json模块进行数据提取
6.熟悉XPath语法规则和各CSS Selector的使用
Python实现火车票查询工具:使用 Python3 抓取 12306 网站信息提供一个命令行的火车票查询工具
Python 实现英文新闻摘要自动提取:新闻摘要提取就是除去新闻中冗余的部分,只保留关键的语句。最近几年关于新闻摘要提取的相关算法发展迅速,本课程将通过两个实验来为大家介绍两个不同的提取摘要算法,并通过python语言完成英文新闻摘要的自动提取。