团队成员来自bat在职或离职优秀人才。有丰富的人工智能开发经验,可胜任工作内容包括但不限于自然语言处理、图像理解、视频理解、数据挖掘。
团队目前自有GPU集群、数据集群等丰富的开发资源,可完成大规模模型的训练与大样本集的预测。可以提供人工智能领域一站式服务。
技能标签:TensorFlow、自然语言处理、图像理解、视频理解、深度学习
项目一:内容推荐
1. 内容画像:topic挖掘、实体标注、扩散特征(ctr、时长、属性倾向...)、质量预估
2. 用户画像:包括正向兴趣、迁移兴趣、即时兴趣、负向兴趣、兴趣预测
3. Embedding体系:构建从细粒度到粗粒度的embedding体系,包括word、tag、news和user等维度,综合运用了稀疏编码,attention机制,side-info等技术
4. 召回策略
基于准确性:正向兴趣、即时兴趣、负向兴趣、用户向量、协同召回(item cf)
基于多样性:基础属性召回、热门召回、迁移兴趣
5. 排序策略:基于deepfm+attention
6. 后排策略:基于次模函数+bandit,兼顾推荐列表的准确性与多样性
项目二:应用市场搜索
1. app理解:包括三级分类挖掘、关键词提取、实体识别、名称切词权重自动标注
2. 检索词理解:包括关键词提取、实体识别、切词权重自动标注、点击基尼、游戏性、匹配占比
3. 召回:基于文本召回和语义召回
4. 排序:基于DeepFM
一方面通过内容理解(基于文本、图片、视频)完整刻画内容信息。另一方面通过用户理解(基于行为,属性)完整刻画用户兴趣与习惯。然后通过精准推荐算法将内容信息推荐给用户,提升用户的阅读时长与点击率。等到右一定用户规模或进行广告插播实现流量变现
通过app理解(基于图片,文本描述,用户使用信息)完整刻画app详细信息。通过检索词理解可以检索词隐藏的语义信息与用户意图,结合相关算法实现两者的精准匹配,从而使用户可以在应用市场快速找到所需的app,提高场景的转化率与用户量。同时通过用户行为理解发掘潜在的app需求,推荐高价值