1169 字
6 分钟
从GPT到Claude再到Gemini:我切换三个主力模型的教训

从GPT到Claude再到Gemini:我切换三个主力模型的教训#

去年十月到今年四月,我换了三次主力AI模型。

最早是GPT-4,用了好几个月。后来切到Claude,觉得”终于找到一个懂我的”。再后来Gemini出来了,又切了一半过去。

不是因为喜新厌旧,是每个模型在不同场景下真的不一样。写下来给犹豫”该用哪个”的人参考。

我用GPT的阶段#

最开始用GPT-4,是因为它当时确实最强。大部分场景都能用,也没什么可挑剔的。

但用久了发现几个问题:

第一,它太”客气”了。 问它”这个方案好不好”,它通常会说两边都好各有优劣,然后列一堆对仗工整的要点。这对做决策没什么帮助——我想知道的是”哪个好”,不是”各有千秋”。

第二,代码能力有时候不太稳定。 同一段代码,让它改两次,可能一次改得很好,一次引入了新bug。不是它能力不够,是它有时候会”过度理解”——你想让它修一个bug,它顺手把周围的代码也”优化”了。

但它有一个强项:指令跟随。 你说”只要JSON”,它基本不会给你加废话。这在自动化脚本里很重要。

切换到Claude#

后来切到Claude,是因为同事推荐说”写代码比GPT强”。

试了之后确实有感觉不一样。

最大的区别是:Claude更像一个有经验的合作者,而不是一个听话的助手。

你给它一段代码让它改,它不会只改你指定的那行。它会看上下文,理解你的意图,然后给出一个更全面的方案。有时候它还会指出你没意识到的问题——“你这里想处理X,但Y场景下会出问题”。

写代码的时候,这种”多想一步”的能力很有价值。

但它也有明显的弱点:

  • 有时候”想太多”。你只需要它格式化一段数据,它非要重构整个函数
  • 回答偏长。同样是回答一个问题,Claude的篇幅通常是GPT的1.5到2倍
  • 中文能力比GPT弱一些。虽然能流畅输出中文,但偶尔用词不太地道

后来引入Gemini#

Gemini出来之后我试了两周,然后把它加入了日常工具箱。

它最让我意外的地方是:长文档处理能力。

有一次我需要让AI读一份80多页的技术文档,然后回答几个具体问题。GPT和Claude都处理不了这么长的输入——要么截断,要么读到后面忘了前面。

Gemini的上下文窗口够大,而且它对长文档的理解确实比另外两个好。不是”能读完”,而是”读完之后真的能回答细节问题”。

但它的问题也很明显:

  • 中文输出的”机械感”比GPT和Claude都重
  • 有时会编造文档里没有的信息(幻觉问题在长文档场景更明显)
  • API的稳定性和速度不如GPT

我现在的分工#

折腾了一圈之后,我现在不是”用一个模型”,而是”按场景分工”:

场景主力模型原因
代码编写和重构Claude理解意图,多想一步
自动化脚本/格式转换GPT指令跟随最好,输出干净
长文档分析Gemini上下文窗口大,长文档理解强
日常问答/翻译GPT中文自然,速度快
写文章/文案Claude文字表达最流畅

这个分工不完美,偶尔也会乱——比如着急的时候不管三七二十一直接用当前打开的那个模型。但大体上,这样用下来每个模型都在做它擅长的事。

一个不成熟的结论#

没有最好的模型,只有最适合你当前任务的模型。

很多人花很多时间争论”哪个模型最强”。但如果你的使用场景比较固定,答案其实很简单——哪个模型在你最常用的那个场景下表现最好,它就是你的主力。

对我来说,代码用Claude,脚本用GPT,长文档用Gemini。这不是什么权威推荐,只是我个人的使用习惯。你试了可能会有不同的结论。

你目前用哪个模型最多?为什么选它?