机器学习系统(MLsys)学习路线总结

System

  1. 工程基础:C/C++,阅读源码。
  2. 操作系统。
  3. 分布式系统
  4. 编译原理。特别是编译器优化技术、LLVM、memory optimization。
  5. 计算机体系结构。另外还需要了解:
    • 1.GPU架构,例如显存分配机制、CPU与GPU交互。
    • 2.CPU、存储系统相关的新技术。
    • 3.深度学习专用硬件。
  6. 常见的并行计算框架,例如MPI/OpenMP/CUDA。
  7. ML framework的底层原理,扒源码。
    工业界的一些新东西:例如k8s、KubeFlow

ML:

  1. 机器学习基础。
  2. 常见的分布式机器学习算法、DL模型压缩、模型加速方法。
  3. 数理基础。