作为人工智能专业大模型方向的顾问,我在技术层面有深厚积累。在模型架构理解上,深入掌握 Transformer 架构及其在大语言模型中的应用,熟悉诸如 GPT 系列、BERT 等经典大模型的原理与优化策略。
编程实操中,熟练运用 Python 进行模型开发与训练,灵活驾驭 PyTorch、TensorFlow 等深度学习框架。数据处理方面,擅长数据清洗、标注和增强,能构建高质量的数据集。同时,具备分布式训练的实践经验,可借助多 GPU 或集群提升大模型训练效率,还能通过模型压缩与量化技术,实现模型的高效部署与应用 。
参与华为大语言模型训练、对齐等任务。曾参与公司内部的智能写作大模型研发项目。负责数据预处理模块,从海量文本中筛选、清洗出高质量语料,构建了超百万条的训练数据集。还参与模型的微调工作,针对特定领域的写作风格进行优化,最终实现模型生成内容的流畅度和专业性大幅提升,该模型已成功应用于智能写作辅助工具中,为用户创作效率提升约 30% 。
我主要参与的作品是一款智能问答大模型。在项目中,我负责模型训练与推理相关任务。训练阶段,精心筛选和预处理大规模问答数据,运用 PyTorch 框架搭建训练环境,对模型进行多轮迭代优化,有效提升模型对问题的理解和回答准确性。推理环节,优化推理算法,降低延迟,让模型能快速响应提问。经
我参与的多模态大模型训练项目,聚焦于融合图像与文本信息的智能助手开发。 在预训练阶段,为实现跨模态特征对齐,我们采集了大规模的图像 - 文本对数据。图像涵盖各类场景、物体,文本则是对图像的详细描述、相关问题等。利用诸如 CLIP 等基础模型作为骨干,去除部分模块后,将图像编码器