Anthropic 发布 Claude Opus 4.6,具有编码进步和自主代理
Anthropic 于本周四 (5) 宣布推出其最先进版本的人工智能模型 Claude Opus 4.6。新模型在编码、复杂任务规划和维护长上下文的能力方面带来了显着改进,从而提高了企业和开发应用程序的性能。 Opus 4.6 立即向付费订阅者开放,巩固了该公司在生成人工智能市场的地位。
此次更新为 API 用户提供了最多 100 万个令牌的上下文窗口,这使得在单次交互中处理大量数据变得更加容易。该公司强调,该模型可以更长时间地维持代理任务并并行执行子任务,从而优化编程和财务分析等领域的工作流程。
主要进展包括:
- 即使在广泛的基础上,代码生成和审查也更加精确。
- 提高了在协作项目中协调人工智能代理团队的能力。
- 平衡分析速度、成本和深度的自适应思维能力。
Principais melhorias em codificação
Claude Opus 4.6 在生成接近生产质量的更可靠代码方面取得了显着的进步。该模型在执行命令之前更仔细地计划步骤,减少了以前版本中的常见错误。开发人员报告说,该系统可以更有效地识别大型存储库中的问题。
与 Claude Code 等工具集成允许多个代理同时处理同一任务。此功能加速了复杂软件的开发,自主划分职责。内部测试表明 Opus 4.6 在软件工程基准测试中优于前代产品。
Anthropic、「Claude Opus 4.6」を発表https://t.co/nUJ8Zuq6wf pic.twitter.com/CqyRM4mvBl
— 窓の杜 (@madonomori)2026 年 2 月 5 日
代理任务的进展
维持长期任务的能力是新模型的区别之一。 Opus 4.6 协调独立的子任务并并行使用工具,在扩展会话中保持一致性。此功能特别有利于需要连续性的业务工作流程。
自适应思维功能允许模型根据请求的复杂程度自动调整推理水平。用户可以更好地控制智能、速度和运营成本之间的平衡。该功能减少了响应中不必要的令牌,优化了资源消耗。
加强安全和道德
Anthropic 在 Opus 4.6 的开发过程中始终注重道德一致性。该模型记录了该公司最低的不当行为发生率,例如操纵反应或滥用合作。内部评估表明不遵守指示的情况显着减少。
已实施新的检测方法来识别非法活动的应用程序。该公司加强了针对新兴风险的防范措施,包括网络攻击中的滥用。 Opus 4.6 在安全性和逻辑测试中得分很高。
与企业工具集成
Claude Opus 4.6 中与电子表格和演示文稿的集成得到了显着改进。 Claude 对 Excel 的支持变得更加强大,允许直接在模型中进行高级数据操作。还推出了 PowerPoint 中 Claude 的早期版本,扩展了企业环境中的可能性。
这些工具可以轻松地根据大型数据集自动生成报告和演示文稿。公司可以自动化以前需要多个手动步骤的流程。与并行代理相结合可提高复杂工作流程中的生产力。
专业基准测试的性能
Opus 4.6 在代理编程和逻辑推理评估方面取得了优异的成绩。 Anthropic 的财务绩效测试和在线研究也创下了创纪录的分数。该模型展示了在不损失准确性的情况下处理大量信息的能力。
在内部实验中,系统发现了开源库中数百个以前未知的漏洞。这种能力增强了模型在自动化安全审计中的潜力。这些收益反映了在培训和协调方面的持续投资。
模型可用性和访问
Claude Opus 4.6 可通过官方聊天机器人、API 和合作伙伴云平台获取。完全访问需要付费订阅,计划从 Pro 开始。 100 万个代币窗口仍然仅限于特定的 API 许可证。
开发人员和感兴趣的公司可以从以前的版本迁移,只需进行少量调整。 Anthropic 建议升级以利用新的智能和准确性功能。微软和谷歌云等合作伙伴已经将该模型集成到他们的产品中。
业务工作流程中的应用
公司采用 Opus 4.6 来自动化涉及分析大量文档和生成结构化内容的流程。并行协调代理的能力可以加快编译财务报告和软件开发等任务的速度。该模型在高需求环境中每小时处理数百万个代币。
长背景和适应性思维的结合优化了大规模运营的成本。各组织报告称,实现最终结果所需的审查数量有所减少。对精度的关注提高了关键应用的可靠性。

















