ID:328609

BY 身份已认证

AI工程师

  • 公司信息:
  • 华为技术有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 上海
  • 浦东

技术能力

熟练使用Python编程、深度学习框架Pytorch,熟悉Java编程;
熟悉经典机器学习模型(K-Means、决策树、隐马尔可夫模型等);
熟悉基本的神经网络结构(MLP、CNN、RNN、LSTM等);
熟悉常见的自然语言处理模型(Word2Vec、Transformer、GPT系列、BERT);
了解目前使用广泛的大模型微调技术(LoRA、Adapter、P-tuning等);
熟悉数组、链表、二叉树等常用的数据结构,熟悉回溯、贪心等算法。

项目经验

一、社媒数据舆情分析项目
1、项目描述
为了提高对互联网海量源声中舆情的分析能力,本项目构建了一个社媒数据的热点挖掘与观点提取系统。系统的主要目标为:
(1)对于海量互联网源声进行过滤,保留相关数据;
(2)基于过滤结果,对源声进行事件抽取与编码,聚类形成业务热榜;
(3)对于各业务热榜进行观点分类,得到热点事件的用户舆情。
2、主要工作
(1)根据任务特点,从零训练了中文GPT-2模型用于源声数据的事件生成,通过三个阶段分别训练模型的中文语言建模能力,通用摘要能力和针对任务的事件生成能力;
(2)分别训练了用于领域过滤,观点分类的模型,引入Prompt Learning,对比学习等技术提升模型性能;
(3)尝试使用中文大模型对热点事件模块进行优化,提升热榜准确率和可读性;
(4)完成服务的工程代码开发,各功能模块解耦,满足业务方的实际使用场景,部署服务到MLOPs平台。
3、项目成果
(1)截至目前,文本过滤模块和观点分类模块准确率均达到90%以上;
(2)舆论热榜模块聚类簇准确率达到87%,相较于原服务准确率提升20%;
(3)服务交付相关业务使用。
4、个人收获
(1)深度参与构建真实场景下的NLP应用系统,完整地进行了"数据准备-模型构建-训练调优-工程开发-测试验收服务上线"的过程;
(2)通过本项目,对预训练语言模型的应用能力和不同任务的综合能力得到进一步锻炼;对企业中的模型开发流程和工具平台有一定了解。

案例展示

  • 社媒数据舆情分析项目

    社媒数据舆情分析项目

    社媒数据舆情分析项目 1、项目描述 为了提高对互联网海量源声中舆情的分析能力,本项目构建了一个社媒数据的热点挖掘与观点提取系统。系统的主要目标为: (1)对于海量互联网源声进行过滤,保留相关数据; (2)基于过滤结果,对源声进行事件抽取与编码,聚类形成业务热榜; (3)

  • 结合对比学习的神经主题模型(论文)

    结合对比学习的神经主题模型(论文)

    结合对比学习的神经主题模型 1、研究概述 在以Cycle-GAN为基准的神经主题模型中,引入对比学习, 直接对生成器部分产生作用,使模型训练与模型评估对齐,获得一致性更好的“主题-单词”分布。 2、主要工作 采用Cycle-GAN作为基准模型,使对比学习能够直接作用于“

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服