1、Linux服务器远程登录。环境搭建、开源项目在服务器的部署。
2、掌握并行计算技术,了解并行编程,常用CUDA、OpenMP、MPI等编程框架。
3、异构计算环境下遥感图像并行变化检测技术
4、掌握C/C++、Python等开发语言,掌握常见的算法和数据结构。
5、熟悉计算机体系结构
6、深入了解一种深度学习框架(Caffe)。
7、了解GPU体系结构。
1、ChatGLM2-6B、Baichuan-13B、文生图Stable-diffusion等开源大模型在Linux服务器上的部署。
2、基于OpenMP与循环展开技术的GEMM性能优化。
3、基于CUDA的二维卷积(Conv2)算子的实现。
ChatGLM2-6B大模型服务器的部署。包括环境安装、基础代码调用、网页版Demo部署等。并且进行了一系列对话测试。
本 作品实现了基于OpenMP的并行化矩阵乘法算法,并结合循环展开、调整循环次序等手段进一步实现了程序性能的提升,与标准串行算法进行了对比,证明了并行算法的正确性。 实验使用的并行线程数为4。 实验结论:1、并行化+循环展开+循环次序调整能够极大提升矩阵乘法程序性能,性能约