Skip to content

大模型能做什么、不能做什么(能力边界与误区)

用好大模型的第一步,是知道它擅长什么、不擅长什么、容易在哪翻车。这一页帮新手建立正确预期,避开最常见的坑。工作原理见 大模型是怎么工作的

一、它擅长的事

能力例子
文本生成写邮件、文案、报告、润色、改写风格
总结提炼长文档/会议纪要浓缩成要点
翻译多语言互译,质量接近专业水平
改写转换改语气、转格式、提取结构化信息
代码写函数、解释代码、找 bug、写测试
问答与解释解释概念、头脑风暴、当学习助手
分类与抽取情感分析、意图识别、从文本抽字段

共同点:这些任务以语言为核心、容错性较高、答案不唯一——正好是「文字接龙」的舒适区。

二、它不擅长 / 容易翻车的事

短板为什么
精确计算它是「续写」不是「运算」,多位数乘法、复杂数学容易错
最新信息有知识截止日期,之后的事不知道(除非联网)
私有/专业事实没见过你公司的内部资料,会编(需要 RAG)
严格事实准确会「幻觉」——自信地编造不存在的事实、引用、数据
长链严密推理多步逻辑/规划容易中途出错(推理模型有改善)
真正的「记忆」默认不记得你之前说过什么(跨会话)
可控性/确定性同样输入可能给不同输出,难 100% 复现

三、最该警惕的:幻觉

幻觉指模型生成看似合理、实则错误或虚构的内容。这是新手最容易踩的坑,因为它错得很自信

典型场景:

  • 编造不存在的论文、书籍、链接、法条、API;
  • 把人物、时间、数据张冠李戴;
  • 你诱导它(「请引用三篇支持的研究」),它就编三篇出来。

为什么会这样:模型的目标是「生成像样的文字」,不是「说真话」,它分不清自己在回忆还是在编。所以:凡是事实性、后果严重的内容,必须自己核查,别把 LLM 当权威信源。

四、新手十大误区

  1. 以为它什么都知道 → 它有知识截止日期,且会编不知道的内容。
  2. 以为它说的都是真的 → 幻觉普遍,事实要核查。
  3. 以为它会算数 → 复杂计算让它调工具,别信口算。
  4. 以为它记得你 → 默认无长期记忆,重要背景每次要给。
  5. 以为它能上网 → 默认不能,除非应用接了搜索。
  6. 指令太模糊还怪它笨 → 它没有读心术,说清楚要什么(见 Prompt 工程)。
  7. 把敏感数据随便贴进去 → 注意隐私与合规,公司机密别乱传。
  8. 一次让它干太复杂的事 → 拆成小步,分步引导更可靠。
  9. 完全照搬它的代码/建议 → 当草稿和助手,不当最终决策者。
  10. 以为它有立场/情感 → 它没有意识,输出会迎合你的提问方式。

五、怎么扬长避短(实用建议)

  • 给足上下文:背景、目标、格式、约束都说清楚,输出质量天差地别。
  • 复杂任务拆步:先让它列提纲,再逐段展开,比一步到位更稳。
  • 事实用 RAG 兜底:让它「基于你给的资料回答」,比让它凭记忆答可靠得多(见 RAG 基础)。
  • 算数/查实时用工具:接计算器、搜索、数据库,让模型「会调工具」而不是「硬扛」。
  • 保持人在回路:高风险决策(医疗、法律、财务、上线代码)必须人工复核。
  • 要求给依据:让它附上推理过程或出处,方便你判断可信度。

六、什么任务适合交给大模型?一个判断口诀

任务以语言为核心?     ── 否 ──► 大模型不是最佳选择
   │是
容错性高 / 有人复核?  ── 否 ──► 谨慎,加核查或工具兜底
   │是
不依赖私有/实时事实?  ── 否 ──► 配 RAG / 联网 / 工具
   │是
      ✅ 大模型的舒适区,放心用

高频追问(面向新手)

Q:大模型会取代我的工作吗? 更可能是「会用 AI 的人取代不会用的人」。它擅长把人从重复性语言劳动里解放出来,但缺乏判断力、责任主体、真实世界经验。把它当强力助手而非替代者,学会驾驭它是当下最实际的策略。

Q:怎么减少幻觉? ① 让它基于你提供的资料回答(RAG);② 提示「不确定就说不知道」;③ 要求给出处和推理过程;④ 重要事实交叉核查;⑤ 事实性任务降低随机性(低 temperature)。但无法根除,核查心态要常在。

Q:免费版和付费版差别大吗? 通常付费版用更强的模型、更长上下文、更高速率,复杂任务差距明显;简单任务可能够用。选型本质是「任务难度 vs 成本」的权衡(见 SLM 的模型分级思路)。

Q:我应该信任它的医疗/法律/投资建议吗? 当作信息参考和思路启发,绝不当专业决策依据。这些领域错误代价高、且模型可能过时或幻觉,务必咨询持牌专业人士。

Q:为什么有时它会「拒绝」回答? 出于安全对齐,模型被训练拒绝有害请求;但也会「误伤」正常问题(过度拒绝)。换个说法、补充正当背景往往能解决;真正的违规请求则不应绕过。详见 大模型安全

基于 MIT 许可发布