一.通过运行程序脚本,采集某国外电商交易网站的WEB后台成交数据,后台成交数据为两层数据,第一层数据为成交列表,列表的单行信息为订单ID,商品名,成交价格,成交时间,客户名,付款状态。要求可设置采集日期范围,采集出指定日期范围的成交数据,也就是从成交列表中如果发现订单处于已付款状态,就根据当行的明细链接进入第二层数据页,采集更详细的信息也就是包括成交商品名称,订单ID,成交金额,客户姓名,地址,邮编等信息。采集结果生成为CSV文件或者EXCEL,最好转码为UTF-8。生成采集结果文件名应包括采集时间范围+分隔符+采集时间。
二.采集系统运行在国外VPS中,系统为Windows NT2008,不可以直接用中国IP登陆,只能远程登录国外VPS服务器调试测试。建议使用Java或者python等开发语言。要求程序具备通用性,不会因为换了一个交易账号就导致无法运行,开发结束后提供所有源码,源码中有适当备注,说明脚本运行方法,
三.正式开发前会对采集目标页面数据做出详细说明指导。因为是采集外语数据,在开发过程中可以随时提供翻译帮助和说明。沟通工具为微信或者腾讯会议。