拥有丰富的数据科学和深度学习经验,精通Python编程、数据采集、数据分析和可视化。熟练掌握多种大模型及其应用,擅长开发和优化深度学习算法。
领导机器学习模型开发,进行数据预处理和分析,创建数据可视化报告,并与跨职能团队合作。能够独立进行复杂数据处理和建模任务。擅长使用Pandas、NumPy、Matplotlib、Seaborn进行数据分析与可视化,熟练操作Jupyter Notebook、Git等工具。致力于通过数据驱动的决策和技术创新推动业务发展。
数据采集:
各大电商网站采集,区块链相关网站采集。期货数据采集。YouTube等视频网站采集。
多线程 多进程 异步 重在效率
数仓:
大型数据etl处理 海豚调度器进行数据清洗自动化流程
算法:
深度学习相关 主要是实体识别方面的nlp,cv方向较少
大模型:
各种大模型api接入
批量采集youtube网站某领域相关博主的作品标题,通过多线程和异步进行采集,提高采集效率。使用redis作为中间件,进行分布式搭建
项目通过采集学校官网和部分招聘网站招聘信息,通过flask ,react进行网站的搭建。提供学生进行招聘信息的查看,使用faiss进行岗位推荐。学生的技术匹配岗位的要求实现推荐