会易语言爬虫优先(如果其他语言能实现也可以),需要熟练HTML CSS JS PHP mysql等开发语言,对网站开发有一定基础
项目1.采集动态网页里的所有网站数据,需要将其保存为离线格式(比如HTML CSS JS及图片等,需要能在本地不联网打开,如果原网站有可以跳转的链接,保存下来的数据也需要一样能够跳转)
项目2. 在采集数据同时将列表里的文章层级关系以及文件路径通过数据库接口(该接口已经配置好 可以调用)上传至我们数据库中(上传后系统会自动在我们小程序前端把层级关系展示出来),如果对接数据库难度很大,也可以只采集数据到本地