1. 8年后端编程经验,6年大厂工作经历。熟悉Java,Go,Python,Node.js开发语言。
2. 具备网络数据抓取经验,从事过大型的网络数据抓取相关的系统设计与开发,对headless(无头浏览器)的开发和应用有丰富的经验。
3. 具备丰富的大模型业务场景经验,具备独立微调大模型能力,熟练掌握大模型应用技术栈(langchain开发,langfuse运维,vLLM推理加速等)。
4. 具备丰富的后端系统架构设计与开发经验,从事过营销系统架构设计与开发,推送系统架构设计与开发,数据抓取系统架构设计与开发。
5. 具备顺畅的沟通协作能力
基于headless(无头浏览器)抓取系统:
- 背景:企业中有很多场景需要到网络上合法抓取数据,如模型训练,行业洞察等场景,因此需要统一的抓取平台来支撑。
- 工作内容:抓取平台设计与建设,支持各场景的数据抓取工作,研究各抓取框架,优化平台的性能和稳定性。
- 结果:支撑10万+QPS的抓取请求
基于大模型的智能外呼系统:
- 背景:智能外呼展业营销的重要手段,通过大模型进行拟人化的对话进行外呼,提升营销效果。
- 工作内容:完整项目系统架构设计,模型微调(对话数据加工,对话模型微调),模型运维,模型推理加速优化
- 结果:效果提升30%。
抓取中台: 主要负责承接公司内各场景的网络数据抓取功能,具有高性能,高可用性,高稳定性的特点,10万+QPS。 集成了puppeteer,chromedp,rod等框架,实现各种抓取能力 图片非平台图片,平台为公司内部系统,未对外。
智能外呼: 基于阿里云的语音服务链路,结合Qwen模型的对话能力进行微调,同时参考chattts原理训练拟人化的TTS模型,实现拟人化的智能外呼。 图片非平台图片,图片是应用的到的相关技术,系统为公司内部系统,未对外。
智能外呼: 基于阿里云的语音服务链路,结合Qwen模型的对话能力进行微调,同时参考chattts原理训练拟人化的TTS模型,实现拟人化的智能外呼。 图片非平台图片,图片是应用的到的相关技术,系统为公司内部系统,未对外。