大模型能做什么、不能做什么（能力边界与误区）

用好大模型的第一步，是知道它擅长什么、不擅长什么、容易在哪翻车。这一页帮新手建立正确预期，避开最常见的坑。工作原理见大模型是怎么工作的。

一、它擅长的事

共同点：这些任务以语言为核心、容错性较高、答案不唯一——正好是「文字接龙」的舒适区。

幻觉指模型生成看似合理、实则错误或虚构的内容。这是新手最容易踩的坑，因为它错得很自信。

典型场景：

为什么会这样：模型的目标是「生成像样的文字」，不是「说真话」，它分不清自己在回忆还是在编。所以：凡是事实性、后果严重的内容，必须自己核查，别把 LLM 当权威信源。

任务以语言为核心？     ── 否 ──► 大模型不是最佳选择
   │是
容错性高 / 有人复核？  ── 否 ──► 谨慎，加核查或工具兜底
   │是
不依赖私有/实时事实？  ── 否 ──► 配 RAG / 联网 / 工具
   │是
      ✅ 大模型的舒适区，放心用

Q：大模型会取代我的工作吗？ 更可能是「会用 AI 的人取代不会用的人」。它擅长把人从重复性语言劳动里解放出来，但缺乏判断力、责任主体、真实世界经验。把它当强力助手而非替代者，学会驾驭它是当下最实际的策略。

Q：怎么减少幻觉？ ① 让它基于你提供的资料回答（RAG）；② 提示「不确定就说不知道」；③ 要求给出处和推理过程；④ 重要事实交叉核查；⑤ 事实性任务降低随机性（低 temperature）。但无法根除，核查心态要常在。

Q：免费版和付费版差别大吗？ 通常付费版用更强的模型、更长上下文、更高速率，复杂任务差距明显；简单任务可能够用。选型本质是「任务难度 vs 成本」的权衡（见 SLM 的模型分级思路）。

Q：我应该信任它的医疗/法律/投资建议吗？ 当作信息参考和思路启发，绝不当专业决策依据。这些领域错误代价高、且模型可能过时或幻觉，务必咨询持牌专业人士。

Q：为什么有时它会「拒绝」回答？ 出于安全对齐，模型被训练拒绝有害请求；但也会「误伤」正常问题（过度拒绝）。换个说法、补充正当背景往往能解决；真正的违规请求则不应绕过。详见大模型安全。