1.熟悉Linux下现代C++/Python编程;
2.了解Linux下程序性能优化的一般手段;
3.了解Linux下编译链接过程,二进制文件结构;
4.有深度学习框架(Caffe/Tensorflow)修改的经验;
5.了解基于MPI的分布式训练的流程。
6.能熟练使用Git和Linux命令行工具。
7.有对象存储优化,二次开发的经验。
8.有Django/Flask/MySQL/MongoDB/Redis后端开发经验。
9.计算机系本科毕业1年,有两年实习经验和1年工作经验,编程基础扎实,思维严谨。
10.自学过一些乱七八糟的玩意,比如Ruby,Rails,C#,NodeJS,Electron,Scrapy爬虫;编译器开发(LLVM),x86流水线优化;Unity3D,Android App开发;ext4文件系统等。但这些没有什么实际项目经验。
1.基于内存或文件,提供FUSE以及动态链接库接口的,支持多深度学习框架的,分布式训练数据读取缓存方案设计实现(C++)。
2.基于Caffe的训练数据缓存方案。
3.数据标注系统任务分发后端开发(Django)。
4.数据自动审核系统的开发(Flask)。
5.基于开源对象存储的二次开发,针对小文件情况下的IOPS性能做优化(Golang)。
6.基于LLVM实现,对C语言扩展,实现NVM事务原语(类STM)支持(C++,毕设)。