前沿专题
深入原理与安全
评估与模型
多模态
主题
系统整理大模型八股文与高频面试题,覆盖大模型基础、Transformer、预训练、微调、RLHF、Prompt、RAG、Agent、推理优化与部署、评估与多模态。
零基础导引、术语速查表、必备数学基础。完全没接触过 AI 也能找到清晰起点,先上手再深入。
Transformer 架构、Attention 及其变体、位置编码(RoPE/ALiBi)、Tokenizer 与分词,把底层原理一次讲透。
预训练目标与数据、缩放定律与涌现能力、SFT/PEFT、LoRA/QLoRA、RLHF/DPO 对齐,覆盖训练全链路。
Zero-shot / Few-shot、CoT、ReAct、Prompt 注入与防护,掌握让模型"听话"的核心技巧。
从切分、Embedding、向量检索到重排与生成,再到多路召回、查询改写等进阶优化策略。
Agent 设计范式、规划与记忆、Function Calling、MCP 协议、多 Agent 协作,看懂智能体落地。
KV Cache、量化(GPTQ/AWQ)、FlashAttention、vLLM、投机解码、并行策略,搞定工程化落地。
困惑度、BLEU/ROUGE、人评与 LLM-as-a-Judge、幻觉成因与缓解,建立科学的评测体系。
CLIP、ViT、多模态对齐与 LLaVA 架构,以及 GPT/LLaMA/BERT/Qwen/DeepSeek(MLA/GRPO)等经典模型盘点。
LangChain/LlamaIndex、流式输出、Function Calling、结构化输出、服务化与成本控制,把模型做成可上线的服务。
高频面试题速记、分岗位面试真题、系统化学习路线、精选学习资源,面试前快速过一遍。
FlashAttention、Mamba/SSM、训练优化器与稳定性、推理模型与慢思考、大模型安全,给进阶开发者的深水区。
无论你处在哪个阶段,都能在这里找到适合自己的学习与备战路径
完整路线见 大模型学习路线,资源清单见 学习资源汇总。
本项目仅用于学习交流,内容持续更新维护。欢迎在 GitHub 提 Issue / PR 一起完善。
本项目完全开源免费,持续更新维护。欢迎 Star、提 Issue 或 PR 一起完善。