前言
模型结构
Transformer 架构与模型
Transformer 可视化解释
土猛的员外-Transformer 架构的整体指南
Encoder 模型
Decoder 模型
Encoder-Decoder 模型
注意力机制
Lilian-Attention?Attention!
缓存优化与效果-KV
训练技术
分布式训练
数据并行
流水线并行
张量并行
MoE 并行
有监督微调
关于微调的讨论
强化学习
蒸馏和压缩
知识蒸馏
剪枝和量化
Prompt 工程
Prompt 技术
宝玉老师-如何写好提示词?
应用场景
OpenAI-生成提示词的提示词
推理与优化
LLM 推理过程
OpenAI O1 相关进展
推理加速
多模态处理
图像-文本模型
跨模态注意力机制
内容与计算优化
应用方向
文本生成与摘要
自然语言生成
文本摘要
问答与对话技术
Chatbot 技术
问答系统与检索增强生成
代码生成与分析
编程助手
自动代码补全
Published with GitBook
训练技术
1.
训练技术
1. 训练技术
results matching "
"
No results matching "
"