1. 带领3人团队,使用Python面向对象编程 和 OpenAI Gym完成了《璀璨宝石》游戏agent的开发,并在团队比赛中获得前10名
2. 应用蒙特卡洛树搜索(MCTS)算法和强化学习(RL)算法写了600多行Python代码
3. 通过实现多线程技术实现MCTS 4步任务(选择、展开、模拟、反向传播)的并发运行,利用信号量解决线程间的竞态问题
4. 通过合理修剪分支因子(展开时采用哈希表,模拟时采用MiniMax算法),调整时间成本较高的函数(ex. deepcopy),提高MCTS算法的性能(将整体时间复杂度和空间复杂度从O(2^n)降至O(nlogn))