从GPT到Claude再到Gemini:我切换三个主力模型的教训
去年十月到今年四月,我换了三次主力AI模型。
最早是GPT-4,用了好几个月。后来切到Claude,觉得”终于找到一个懂我的”。再后来Gemini出来了,又切了一半过去。
不是因为喜新厌旧,是每个模型在不同场景下真的不一样。写下来给犹豫”该用哪个”的人参考。
我用GPT的阶段
最开始用GPT-4,是因为它当时确实最强。大部分场景都能用,也没什么可挑剔的。
但用久了发现几个问题:
第一,它太”客气”了。 问它”这个方案好不好”,它通常会说两边都好各有优劣,然后列一堆对仗工整的要点。这对做决策没什么帮助——我想知道的是”哪个好”,不是”各有千秋”。
第二,代码能力有时候不太稳定。 同一段代码,让它改两次,可能一次改得很好,一次引入了新bug。不是它能力不够,是它有时候会”过度理解”——你想让它修一个bug,它顺手把周围的代码也”优化”了。
但它有一个强项:指令跟随。 你说”只要JSON”,它基本不会给你加废话。这在自动化脚本里很重要。
切换到Claude
后来切到Claude,是因为同事推荐说”写代码比GPT强”。
试了之后确实有感觉不一样。
最大的区别是:Claude更像一个有经验的合作者,而不是一个听话的助手。
你给它一段代码让它改,它不会只改你指定的那行。它会看上下文,理解你的意图,然后给出一个更全面的方案。有时候它还会指出你没意识到的问题——“你这里想处理X,但Y场景下会出问题”。
写代码的时候,这种”多想一步”的能力很有价值。
但它也有明显的弱点:
- 有时候”想太多”。你只需要它格式化一段数据,它非要重构整个函数
- 回答偏长。同样是回答一个问题,Claude的篇幅通常是GPT的1.5到2倍
- 中文能力比GPT弱一些。虽然能流畅输出中文,但偶尔用词不太地道
后来引入Gemini
Gemini出来之后我试了两周,然后把它加入了日常工具箱。
它最让我意外的地方是:长文档处理能力。
有一次我需要让AI读一份80多页的技术文档,然后回答几个具体问题。GPT和Claude都处理不了这么长的输入——要么截断,要么读到后面忘了前面。
Gemini的上下文窗口够大,而且它对长文档的理解确实比另外两个好。不是”能读完”,而是”读完之后真的能回答细节问题”。
但它的问题也很明显:
- 中文输出的”机械感”比GPT和Claude都重
- 有时会编造文档里没有的信息(幻觉问题在长文档场景更明显)
- API的稳定性和速度不如GPT
我现在的分工
折腾了一圈之后,我现在不是”用一个模型”,而是”按场景分工”:
| 场景 | 主力模型 | 原因 |
|---|---|---|
| 代码编写和重构 | Claude | 理解意图,多想一步 |
| 自动化脚本/格式转换 | GPT | 指令跟随最好,输出干净 |
| 长文档分析 | Gemini | 上下文窗口大,长文档理解强 |
| 日常问答/翻译 | GPT | 中文自然,速度快 |
| 写文章/文案 | Claude | 文字表达最流畅 |
这个分工不完美,偶尔也会乱——比如着急的时候不管三七二十一直接用当前打开的那个模型。但大体上,这样用下来每个模型都在做它擅长的事。
一个不成熟的结论
没有最好的模型,只有最适合你当前任务的模型。
很多人花很多时间争论”哪个模型最强”。但如果你的使用场景比较固定,答案其实很简单——哪个模型在你最常用的那个场景下表现最好,它就是你的主力。
对我来说,代码用Claude,脚本用GPT,长文档用Gemini。这不是什么权威推荐,只是我个人的使用习惯。你试了可能会有不同的结论。
你目前用哪个模型最多?为什么选它?