Claude Sonnet 4.5 发布, 登顶编程测试, 可连续工作超 30 小时
- 2025-09-30 13:58:32
- 819
Anthropic发布ClaudeSonnet4.5,性能大幅提升。在SWE-benchVerified测试中,ClaudeSonnet4.5登顶业界第一,且能连续专注工作超30小时。它可一次性敲出约1.1万行代码,构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在OSWorld测试中拿下61.4%的成绩。
ClaudeChrome插件可像真人一样在浏览器里操作任务。ClaudeCode新增「检查点」功能,终端界面翻新,发布原生VSCode插件。ClaudeAPI增加上下文编辑功能和记忆工具,代码执行和文件创建整合到对话里。Anthropic还开放了ClaudeAgentSDK,供开发者构建自己的产品。
ClaudeSonnet4.5定价与ClaudeSonnet4一致,每百万tokens3/15美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor认为其在处理长周期任务时提升明显,DanShipper表示新版本响应速度更快、可控性更强、更稳定。
ClaudeSonnet4.5是Anthropic到目前为止对齐度最高的前沿模型,减少了不良行为,在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「ImaginewithClaude」临时研究预览功能,但仅对Max订阅用户开放五天。
Anthropic估值达1830亿美元,8月年化营收50亿美元,但面临OpenAI和GoogleGemini的竞争压力。此前Claude系列模型曾经历「降智」风波,此次发布ClaudeSonnet4.5是为挽回用户,其实际表现还需后续观察。
- 上一篇:老人回应女大学生干完农活就跑
- 下一篇:老人回应女大学生干完农活就跑