理论:
·了解深度学习、机器学习相关理论知识;
·熟悉、掌握运筹学相关知识;
·掌握相关启发式算法:遗传算法、邻域搜索、模拟退火、粒子群算法等;
·掌握相关精确求解算法:单纯性、分支定界、列生成等;
·具备良好数学能力;
·具备一定业务抽象、数学建模能力;
·掌握强化学习理论知识;
工程:
·了解linux系统;
·了解pytorch等深度学习框架;
·了解MySQL、Redis等数据库操作;
·熟练使用pycharm等开发工具;
·掌握启发式算法代码实现;
·掌握求解器实现代码规范;
·掌握强化学习相关代码实现能力;
项目一(电动公交充电行为优化算法)
在节能减排的号召下,**集团大多公交已换为电动公交,对于电动公交而言充电费用是不容小觑的成本。而决定充电费用高低的原因可以概括为:公交什么时候进站、哪次进站需要充电、充多久电,以及全天不同时段的尖峰平谷电价。业务分析:只要决策了车辆的行为(发车时刻以及是否补电),就能够控制充电费用。由此进行数学抽象:1、决策变量:公交发车时刻;2、优化目标:全部车辆补电费用;3、约束:a)公交运营时空约束、b)电量能够保证后续任务;4、优化求解算法改进遗传算法;5、充电时长以及耗电量预测:XGBoost 预测模型。开发完成后,使用算法优化结果进行运营,通过测算可以节省 12%左右的补电费用。
项目二(基于强化学习的机场特车保障算法)
在**机场,每天会有若干航班到达机场,停留一段时间后离开。在此停留时间内,会有特车对其进行保障,如何决策不同车辆在不同时间保障不同航班,是一个非常有趣的问题。我利用强化学习框架,对该问题进行了求解。具体为对地面车辆保障算法场景进行建模(调研论文,目前没有使用此方法解决该场景问题),并使用学界、工业界都较为领先的深度神经网络(Actor-Critic框架)拟合车辆的状态、动作,完全自主实现智能体类、环境类、交互过程、策略/价值迭代优化等难度较高程序模块,并最终实现理论预计效果;