Claude Sonnet 4.5 发布, 登顶编程测试, 可连续工作超 30 小时

2025-09-30 13:58:32
819

Anthropic发布ClaudeSonnet4.5，性能大幅提升。在SWE-benchVerified测试中，ClaudeSonnet4.5登顶业界第一，且能连续专注工作超30小时。它可一次性敲出约1.1万行代码，构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在OSWorld测试中拿下61.4%的成绩。

ClaudeChrome插件可像真人一样在浏览器里操作任务。ClaudeCode新增「检查点」功能，终端界面翻新，发布原生VSCode插件。ClaudeAPI增加上下文编辑功能和记忆工具，代码执行和文件创建整合到对话里。Anthropic还开放了ClaudeAgentSDK，供开发者构建自己的产品。

ClaudeSonnet4.5定价与ClaudeSonnet4一致，每百万tokens3/15美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor认为其在处理长周期任务时提升明显，DanShipper表示新版本响应速度更快、可控性更强、更稳定。

ClaudeSonnet4.5是Anthropic到目前为止对齐度最高的前沿模型，减少了不良行为，在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「ImaginewithClaude」临时研究预览功能，但仅对Max订阅用户开放五天。

Anthropic估值达1830亿美元，8月年化营收50亿美元，但面临OpenAI和GoogleGemini的竞争压力。此前Claude系列模型曾经历「降智」风波，此次发布ClaudeSonnet4.5是为挽回用户，其实际表现还需后续观察。

国民男神是男神发布网,提供国民男神是男神发布信息,第一时间发布列表及资讯,国民男神!是国民男神是女生小说免费阅读_国民男神!首选资讯平台。