大模型能做什么、不能做什么(能力边界与误区)
用好大模型的第一步,是知道它擅长什么、不擅长什么、容易在哪翻车。这一页帮新手建立正确预期,避开最常见的坑。工作原理见 大模型是怎么工作的。
一、它擅长的事
| 能力 | 例子 |
|---|---|
| 文本生成 | 写邮件、文案、报告、润色、改写风格 |
| 总结提炼 | 长文档/会议纪要浓缩成要点 |
| 翻译 | 多语言互译,质量接近专业水平 |
| 改写转换 | 改语气、转格式、提取结构化信息 |
| 代码 | 写函数、解释代码、找 bug、写测试 |
| 问答与解释 | 解释概念、头脑风暴、当学习助手 |
| 分类与抽取 | 情感分析、意图识别、从文本抽字段 |
共同点:这些任务以语言为核心、容错性较高、答案不唯一——正好是「文字接龙」的舒适区。
二、它不擅长 / 容易翻车的事
| 短板 | 为什么 |
|---|---|
| 精确计算 | 它是「续写」不是「运算」,多位数乘法、复杂数学容易错 |
| 最新信息 | 有知识截止日期,之后的事不知道(除非联网) |
| 私有/专业事实 | 没见过你公司的内部资料,会编(需要 RAG) |
| 严格事实准确 | 会「幻觉」——自信地编造不存在的事实、引用、数据 |
| 长链严密推理 | 多步逻辑/规划容易中途出错(推理模型有改善) |
| 真正的「记忆」 | 默认不记得你之前说过什么(跨会话) |
| 可控性/确定性 | 同样输入可能给不同输出,难 100% 复现 |
三、最该警惕的:幻觉
幻觉指模型生成看似合理、实则错误或虚构的内容。这是新手最容易踩的坑,因为它错得很自信。
典型场景:
- 编造不存在的论文、书籍、链接、法条、API;
- 把人物、时间、数据张冠李戴;
- 你诱导它(「请引用三篇支持的研究」),它就编三篇出来。
为什么会这样:模型的目标是「生成像样的文字」,不是「说真话」,它分不清自己在回忆还是在编。所以:凡是事实性、后果严重的内容,必须自己核查,别把 LLM 当权威信源。
四、新手十大误区
- 以为它什么都知道 → 它有知识截止日期,且会编不知道的内容。
- 以为它说的都是真的 → 幻觉普遍,事实要核查。
- 以为它会算数 → 复杂计算让它调工具,别信口算。
- 以为它记得你 → 默认无长期记忆,重要背景每次要给。
- 以为它能上网 → 默认不能,除非应用接了搜索。
- 指令太模糊还怪它笨 → 它没有读心术,说清楚要什么(见 Prompt 工程)。
- 把敏感数据随便贴进去 → 注意隐私与合规,公司机密别乱传。
- 一次让它干太复杂的事 → 拆成小步,分步引导更可靠。
- 完全照搬它的代码/建议 → 当草稿和助手,不当最终决策者。
- 以为它有立场/情感 → 它没有意识,输出会迎合你的提问方式。
五、怎么扬长避短(实用建议)
- 给足上下文:背景、目标、格式、约束都说清楚,输出质量天差地别。
- 复杂任务拆步:先让它列提纲,再逐段展开,比一步到位更稳。
- 事实用 RAG 兜底:让它「基于你给的资料回答」,比让它凭记忆答可靠得多(见 RAG 基础)。
- 算数/查实时用工具:接计算器、搜索、数据库,让模型「会调工具」而不是「硬扛」。
- 保持人在回路:高风险决策(医疗、法律、财务、上线代码)必须人工复核。
- 要求给依据:让它附上推理过程或出处,方便你判断可信度。
六、什么任务适合交给大模型?一个判断口诀
任务以语言为核心? ── 否 ──► 大模型不是最佳选择
│是
容错性高 / 有人复核? ── 否 ──► 谨慎,加核查或工具兜底
│是
不依赖私有/实时事实? ── 否 ──► 配 RAG / 联网 / 工具
│是
✅ 大模型的舒适区,放心用高频追问(面向新手)
Q:大模型会取代我的工作吗? 更可能是「会用 AI 的人取代不会用的人」。它擅长把人从重复性语言劳动里解放出来,但缺乏判断力、责任主体、真实世界经验。把它当强力助手而非替代者,学会驾驭它是当下最实际的策略。
Q:怎么减少幻觉? ① 让它基于你提供的资料回答(RAG);② 提示「不确定就说不知道」;③ 要求给出处和推理过程;④ 重要事实交叉核查;⑤ 事实性任务降低随机性(低 temperature)。但无法根除,核查心态要常在。
Q:免费版和付费版差别大吗? 通常付费版用更强的模型、更长上下文、更高速率,复杂任务差距明显;简单任务可能够用。选型本质是「任务难度 vs 成本」的权衡(见 SLM 的模型分级思路)。
Q:我应该信任它的医疗/法律/投资建议吗? 当作信息参考和思路启发,绝不当专业决策依据。这些领域错误代价高、且模型可能过时或幻觉,务必咨询持牌专业人士。
Q:为什么有时它会「拒绝」回答? 出于安全对齐,模型被训练拒绝有害请求;但也会「误伤」正常问题(过度拒绝)。换个说法、补充正当背景往往能解决;真正的违规请求则不应绕过。详见 大模型安全。