Llama系列模型
参考网站
https://syhya.github.io/zh/posts/2025-04-06-llama/
关键技术解析
以下是对 LLaMA 系列中广泛采用的关键技术的解析。
- RMS Normalization (RMSNorm)
- FFN_SwiGLU
- Grouped Query Attention (GQA)
- Rotary Positional Embeddings (RoPE)
- Mixture-of-Experts (MoE)
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 一只大笨熊!
评论