猿急送>

北京其它兼职程序员

ID：289395

🌾

强化学习算法工程师

公司信息：
腾讯科技有限公司

工作经验：
1年

兼职日薪：
1000元/8小时

兼职时间：
下班后
周六
周日
可工作日远程

所在区域：
北京
海淀

技术能力

强化学习
机器学习
数据挖掘
数据分析
• 编程语言: Python,C/C++,R,MATLAB,LATEX，STM32
• 软件: 熟练使用 Excel,Word,PPT,Photoshop,After Effects 等
• 证书：普通话二级甲等，计算机二级证书，英语四级 (512)，英语六级 (449)

项目经验

1、强化学习在游戏领域的研究
• 配置 Moba 游戏环境，生成完备的一套 Docker 镜像。
• 使用实验设计的方法调试强化学习参数，比对实验结果，选出最优参数。
2、强化学习在组合优化中的应用
• 对调度问题进行建模，以满足马尔科夫性质；通过强化学习 PPO 算法学习最优策略提升调度性能。
• 已录用一篇 EI 检索 DDCLS2020 会议论文和一篇SCI I区论文。
3、外汇交易与 AI 辅助决策
• 利用深度强化学习结合市场情绪和宏观经济数据（通货膨胀、GDP、就业增长、央行基准利率等），
预测长期和短期的外汇走势，构建选股策略进行回测。

案例展示

强化学习

 对全自动生产流水线中的组合优化问题进行建模，通过强化学习 PPO 算法学习最优策略提升调度性能，与传统优化算法相比效能提升 10%左右；  研究适用于异构问题的混合整数线性规划模型，提出一种基于 Transformer 的机器学习方法加速分支定界的求解过程，并在公
强化学习

 对全自动生产流水线中的组合优化问题进行建模，通过强化学习 PPO 算法学习最优策略提升调度性能，与传统优化算法相比效能提升 10%左右；  研究适用于异构问题的混合整数线性规划模型，提出一种基于 Transformer 的机器学习方法加速分支定界的求解过程，并在公
强化学习

 对全自动生产流水线中的组合优化问题进行建模，通过强化学习 PPO 算法学习最优策略提升调度性能，与传统优化算法相比效能提升 10%左右；  研究适用于异构问题的混合整数线性规划模型，提出一种基于 Transformer 的机器学习方法加速分支定界的求解过程，并在公