离线建库项目
项目描述:
外派百度担任后端开发工程师一职位。负责日常运维、版本迭代与接口开发。
离线建库项目是一个基于百度paddle-cloud平台的一个定时抓取数据并对其建立索引发布的一个流式项目。
个人负责:
主要负责日常日志查看与分析。异常任务的处理与优化,需求开发,代码优化,版本迭代。
技术要点:
整体项目基于python+Hadoop+shell+paddle_cloud
基于paddle_cloud实现流式项目易于管理。
采用Hadoop集群,实现不同地区集群之间数据的快速传输
使用shell脚本来实现项目自动化
采用python来实现业务需求的处理