Skip to content

学习资源汇总

精选大模型学习的优质课程、书籍、博客、开源项目与实验平台。按「先看哪个」的优先级整理,避免在信息海洋里迷路。

必学课程(按优先级)

优先级课程平台说明
⭐⭐⭐ChatGPT Prompt Engineering for DevelopersDeepLearning.AIPrompt 入门,免费、短小
⭐⭐⭐Building Systems with the ChatGPT APIDeepLearning.AI用 API 搭系统
⭐⭐⭐LangChain for LLM Application DevelopmentDeepLearning.AI框架入门
⭐⭐⭐Building and Evaluating Advanced RAGDeepLearning.AIRAG 核心
⭐⭐⭐AI Agents in LangGraphDeepLearning.AIAgent 实战
⭐⭐Finetuning Large Language ModelsDeepLearning.AI微调入门
⭐⭐动手学深度学习(李沐)B站中文、免费、理论+代码
⭐⭐跟李沐学 AI(论文精读)B站Transformer 等经典论文精讲
⭐⭐Neural Networks: Zero to Hero(Karpathy)YouTube从零手写,含 "Let's build GPT",理解底层神器
⭐⭐Karpathy《Let's build the GPT Tokenizer》YouTube彻底搞懂分词器
Machine Learning Specialization(吴恩达)CourseraML 基础,可旁听
Hugging Face LLM / NLP Coursehuggingface.co/learn免费、实操,配套 Transformers

必读书籍

书名说明
《Build a Large Language Model (From Scratch)》Sebastian Raschka,从零实现 LLM,理解原理首选
《Hands-On Large Language Models》LLM 应用实战
《Natural Language Processing with Transformers》HuggingFace 官方书
《Designing Machine Learning Systems》Chip Huyen,ML 系统设计
《动手学深度学习》李沐,中文免费在线

必读论文(经典 + 前沿)

  • Attention Is All You Need(Transformer 开山)
  • GPT-3: Language Models are Few-Shot Learners(涌现 / in-context learning)
  • LoRA: Low-Rank Adaptation(参数高效微调)
  • InstructGPT / RLHF(对齐)
  • ReActChain-of-Thought(推理与 Agent)
  • RAG(检索增强生成原始论文)、RAGAS(RAG 评估)
  • DeepSeek-V3 / R1 技术报告(MLA、MoE、GRPO,必读前沿)
  • LLaMA / Qwen 技术报告(现代开源架构)

论文读法:先读摘要 + 架构图 + 结论,结合李沐精读视频,不必逐行啃公式。

优质博客 / 社区

资源内容
Lilian Weng 博客(lilianweng.github.io)Agent、Prompt、对齐等深度长文,质量极高
Sebastian RaschkaLLM 原理与训练技术
Jay Alammar(The Illustrated Transformer)图解 Transformer,入门神作
Hugging Face Blog实用工程技术
量子位 / 机器之心中文 AI 资讯

优质开源项目(学产品设计)

项目价值
Dify开源 LLMOps 平台,学习 RAG/Agent 产品化设计
FastGPT开源知识库问答,RAG 工程参考
LangChain / LlamaIndex应用开发框架,读源码学抽象设计
LLaMA-Factory一站式微调工具,微调实战首选
vLLM高性能推理框架,学 PagedAttention/连续批处理
Transformers(HuggingFace)模型生态基石
RAGFlow / Ollama分别是 RAG 引擎与本地部署的代表

实验平台

平台用途费用
Google Colab免费 GPU 实验免费 / Pro 付费
AutoDL国内 GPU 租用按小时,经济
Hugging Face Spaces模型部署展示免费额度
国内大模型 API(通义/智谱/文心)调用练手价格约为 OpenAI 的 1/5~1/10

提示:学习阶段优先用国内大模型 API 和免费额度,成本可控。微调实验可用 Colab 免费 GPU 或 AutoDL 低价租卡。

🛠️ 工具与框架速览

按用途整理常用开源工具,覆盖大模型工程全链路:

方向代表工具
应用开发框架LangChain、LlamaIndex、LangGraph、Haystack、Spring AI(Java)
微调LLaMA-Factory、Hugging Face PEFT、Unsloth、TRL、Axolotl
推理部署vLLM、SGLang、TGI、TensorRT-LLM、Ollama、llama.cpp、LMDeploy
向量数据库Milvus、Qdrant、Chroma、Weaviate、pgvector、Faiss
RAG / 知识库Dify、FastGPT、RAGFlow、QAnything、LangChain
Agent / 多 AgentLangGraph、AutoGen、CrewAI、MetaGPT、OpenAI Agents SDK
评估RAGAS、TruLens、OpenCompass、lm-evaluation-harness、EvalScope
可观测 / LLMOpsLangSmith、Langfuse、Phoenix(Arize)
结构化输出 / 约束解码Outlines、XGrammar、Instructor、Guidance
本地 / 端侧Ollama、LM Studio、llama.cpp、MLX(Apple)

工具迭代极快,记住「每类的代表 + 它解决什么问题」即可,别死记版本。

中文社区与专栏

中文一手资讯和实战经验的高质量来源:

渠道内容
掘金(juejin.cn)大量大模型实战、面经、源码解析专栏
知乎算法原理深度讨论、论文解读、行业观察
CSDN教程、踩坑记录、环境配置实操
公众号:机器之心 / 量子位 / 新智元中文 AI 资讯与技术报道
公众号:李rumor / 真中合欢 / 关于NLP那些你不知道的事NLP / 大模型技术干货
B 站李沐、Karpathy 搬运、各类大模型实战课

同类优秀开源指南(致敬 & 延伸阅读)

本项目站在巨人的肩膀上,也推荐这些优秀的开源学习/面试资源:

项目特点
JavaGuide后端面试指南标杆,本项目的形式灵感来源
JavaGuide - AI 应用开发面试指南JavaGuide 的 AI 面试专栏,质量很高
LLMForEverybody体系化的大模型原理 + 面试系列文章
awesome-LLM-resources极全的大模型资源/工具索引
AgentGuide聚焦 Agent 的学习与面试指南
happy-llmDatawhale 出品,从原理到实践
llm-cookbook吴恩达 LLM 系列课程中文版

跟踪前沿的渠道

  • Hugging Face Trending / Papers:看最新模型和论文热度。
  • arXiv cs.CL / cs.LG:最新论文。
  • X(Twitter)/ 知乎 / 即刻:关注 AI 研究者和工程师。
  • GitHub Trending:发现新工具和项目。

本页持续更新。欢迎在 GitHub 提 PR 补充你认为值得推荐的优质资源。

基于 MIT 许可发布