ID:386216

奶茶Julie

后端工程师

  • 公司信息:
  • 平安产险
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 深圳
  • 南山

技术能力

领域:搜索引擎、推荐系统、智能问答、大模型
语言:精通python、了解scala
--常用框架:
建模:pytorch/deepspeed/peft/pyMC3/sklearn/spark ml
数据处理:dask/vaex/pandas/pyspark
矩阵分析:cupy/numpy
图数据处理:spark graphx/neo4j algo
算法工程化:vllm/kafka/fastAPI/flask/Django/streamlit/gradio
算法加速:optimum/GPTQ/flash attention/vllm/xformers
数据库:mysql/hive/pg/mongo/neo4j
个人实验:sympy/Autograd/jax
--常用算法:
DL: CNN、RNN(LSTM/GRU)、Attention/transformer
ML: LSA/PLAS/LDA、fasttext/word2vector、CRF
LM:BERT/ALBERT/simcse/robert/T5/GPT/llama/bloom/GLM
rank:lambdaRank/ListNet
CTR: LR/FM/FFM/D&W/DeepFM
xgboost/lightgbm/catboost

项目经验

【自研大模型】
模型迭代预训练:
1. 一期:足量训练deepspeed+megatron,llama 7B-65B、bloom 7B
2. 二期:训练加速:flash attention triton 适应attention mask && alibi attention bias
3. 三期:采样优化:样本学科分类、模型弱势学科分析
多任务微调SFT:
1. 一期:deepspeed,包含收集的分任务语料以及克隆数据
2. 二期:采样优化,分析任务转移矩阵,根据下游任务决定采样
下游应用:协作客户端群聊摘要,LoRA+deepspeed,时间段抽取+总结(可主题筛选)
应用部署:合并权重,利用ray/vllm分布式部署

【智能问答中台】
算法研发
--检索式:
召回:BM25/fasttext/simcse
排序:bert cls (Interaction)
--任务型:
话题识别:与检索式相同
会话记忆:打断话题进行记忆,完成一个话题进行遗忘
会话管理:利用有向无环图数据结构管理
--知识图谱:
实体识别:bert+CRF
实体链接:fasttext
意图识别:与检索式相同
--文档问答:
段落分割:segmentation
文本向量化:M3E
数据库:ES、Milvus
长度延申:Interpolation

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服