从GPT到Claude再到Gemini：我切换三个主力模型的教训#

去年十月到今年四月，我换了三次主力AI模型。

最早是GPT-4，用了好几个月。后来切到Claude，觉得”终于找到一个懂我的”。再后来Gemini出来了，又切了一半过去。

不是因为喜新厌旧，是每个模型在不同场景下真的不一样。写下来给犹豫”该用哪个”的人参考。

我用GPT的阶段#

最开始用GPT-4，是因为它当时确实最强。大部分场景都能用，也没什么可挑剔的。

但用久了发现几个问题：

第一，它太”客气”了。 问它”这个方案好不好”，它通常会说两边都好各有优劣，然后列一堆对仗工整的要点。这对做决策没什么帮助——我想知道的是”哪个好”，不是”各有千秋”。

第二，代码能力有时候不太稳定。 同一段代码，让它改两次，可能一次改得很好，一次引入了新bug。不是它能力不够，是它有时候会”过度理解”——你想让它修一个bug，它顺手把周围的代码也”优化”了。

但它有一个强项：指令跟随。 你说”只要JSON”，它基本不会给你加废话。这在自动化脚本里很重要。

后来切到Claude，是因为同事推荐说”写代码比GPT强”。

试了之后确实有感觉不一样。

最大的区别是：Claude更像一个有经验的合作者，而不是一个听话的助手。

你给它一段代码让它改，它不会只改你指定的那行。它会看上下文，理解你的意图，然后给出一个更全面的方案。有时候它还会指出你没意识到的问题——“你这里想处理X，但Y场景下会出问题”。

写代码的时候，这种”多想一步”的能力很有价值。

但它也有明显的弱点：

Gemini出来之后我试了两周，然后把它加入了日常工具箱。

它最让我意外的地方是：长文档处理能力。

有一次我需要让AI读一份80多页的技术文档，然后回答几个具体问题。GPT和Claude都处理不了这么长的输入——要么截断，要么读到后面忘了前面。

Gemini的上下文窗口够大，而且它对长文档的理解确实比另外两个好。不是”能读完”，而是”读完之后真的能回答细节问题”。

但它的问题也很明显：

折腾了一圈之后，我现在不是”用一个模型”，而是”按场景分工”：