今年做了一些产品,大量的使用了 ai,特别是 claude code。

在 8,9 月份,claude 周限很高,opus4.1 几乎可以无限制的使用,那个阶段真是美好,额度一天绝对用不完的,只要你付出四五百块钱,随便用,甚至我给组内也都使用,我付费,根本用不完。

我把 claude code 内置到我的产品中,直接在产品里面调用 claude code,去编辑代码,让用户去 vibe coding,我们的用户是非技术人员。

在 10 月后,A 社给 claude opus 添加了周限,200 刀的账户,密集使用,1 天就能消耗掉一周的额度,悲惨的故事开始了,sonnet4.5 明显是不如 opus4.1的,用户开始抱怨,经过一系列的努力,各种规则的新增,但是并没有太好,顶着压力,给每个用户手动去维护出问题的代码。基础模型的能力,会严重的限制我们这类产品。

gemini3 发布之后,claude 应该明显是有压力了,把opus4.5移除了周限,反而把 sonnet4.5 加入了周限,简单说,基本上sonnet4.5退位,opus4.5是正位/主力模型。我们在第二天就立刻更新了产品把opus4.5作为默认模型,用户反馈,明显变的更聪明了。

我不想去画天气图,而是切实的感觉到了模型能力的上升。甚至,即使不是opus4.5,而是 opus4.1我都会非常满意。

ops4.5 价格虽然还是比 sonnet4.5 贵一点,但是不重要了,贵那么一点,他的能力是值的,特别是它几乎没有周限。严谨来说,opus4.5更快,废话更少,消耗的token也更少,整体成本应该持平 sonnet4.5

能力确认变强了,在一个复杂业务场景下,我想通过claude agent sdk 实现claude code 的复用,提升响应速度,之前 opus4.1写了很多复杂的代码,但是最终没有实现,这次 opus4.5讨论了一个上午,很快就实现了,并且没有严重的 bug,整体功能基本可用。

先进的模型,还是不一样的,在愿意承担成本的情况下,会有质的变化。