需求描述
1. 从某网站导出excel文件,并将其重命名。路径格式同意;文件数量:网站分页82页,共计2455个excel文档
2. Excel文档的批量化处理;
单个流程操作如下:
1. 从某网站导出excel文件
1.1 登录网址http://cma.cnca.cn/cma/ 需登录名和密码(合作探讨后提供)
1.2 左侧目录 ,进入机构证书查询
1.3 证书编号(空格)机构名称为excel名称(爬取数据1)
1.4 点击查看,新弹出窗口如下,点击人员信息
1.5 出现下图,点击导出(爬取2),即可导出目标excel文件,将文件按照1.3命名;
2. 重复1.2-1.5,对余下数据进行爬取,总计2455个excel;
3. 批量编辑
3.1 所有excel文件格式统一如下,要求进行如下操作
3.2 删除第一行;
3.3 在第二列插入一列,内容为excel名称,行数与原有数据行数相同;
3.4 所有excel修改完成后,打包压缩,此为可交付成果1;
4. 将所有excel,除第一行(姓名、性别、出生日期等)外,所有内容合并到一个excel中;增加行;合并完成后为可交付成果2;
成果及质量
1. 可交付成果1:2455个excel压缩包
1.1 数量
1.2 命名
1.3 Excel内按照要求修改,删除原第一行、增加第二列
2. 可交付成果2:将可交付成果1中所有excel合并为一个excel
2.1 删除可交付成果1中excel的第一行
2.2 文件按列增加
2.3 若一个excel空间不够可多个excel
交付日期