Anthropic推出了 Claude 3.5 Sonnet,这是即将推出的 Claude 3.5 型号系列中的第一款产品。Claude 3.5 Sonnet 提高了行业智能标准,在各种评估中均优于竞争对手的型号和 Claude 3 Opus,同时速度和成本与我们的中端型号 Claude 3 Sonnet 相当。
Claude 3.5 Sonnet 现已在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订阅者可以以更高的速率限制访问它。它也可以通过 Anthropic API、Amazon Bedrock和Google Cloud 的 Vertex AI获得。该模型每百万输入令牌的成本为 3 美元,每百万输出令牌的成本为 15 美元,具有 200K 令牌上下文窗口。
以 2 倍速度获取前沿情报
Claude 3.5 Sonnet 为研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 设定了新的行业基准。它在掌握细微差别、幽默和复杂指令方面表现出显著的进步,并且擅长以自然、亲切的语气撰写高质量的内容。
Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能提升加上经济实惠的价格,使 Claude 3.5 Sonnet 成为复杂任务的理想选择,例如上下文相关的客户支持和协调多步骤工作流程。
在内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus(解决了 38%)。我们的评估测试了模型修复错误或向开源代码库添加功能的能力,前提是给出了所需改进的自然语言描述。在得到指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。它可以轻松处理代码转换,使其特别适合更新旧版应用程序和迁移代码库。
最先进的视觉
Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准上超越了 Claude 3 Opus。这些重大改进对于需要视觉推理的任务最为明显,例如解释图表和图形。Claude 3.5 Sonnet 还可以准确地从不完美的图像中转录文本 - 这是零售、物流和金融服务的核心功能,在这些服务中,AI 可以从图像、图形或插图中获得比仅从文本中更多的见解。
即将推出
我们的目标是每隔几个月就大幅改善智能、速度和成本之间的权衡曲线。为了完善 Claude 3.5 型号系列,我们将在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.5 Opus。
除了开发下一代模型系列外,我们还在开发新模式和功能,以支持更多企业用例,包括与企业应用程序集成。我们的团队还在探索诸如 Memory 之类的功能,该功能将使 Claude 能够记住用户的偏好和指定的交互历史记录,从而使他们的体验更加个性化和高效。
我们一直在努力改进 Claude,并乐于听取用户的反馈。您可以直接在产品内提交有关 Claude 3.5 Sonnet 的反馈,以告知我们的开发路线图并帮助我们的团队改善您的体验。与往常一样,我们期待看到您使用 Claude 构建、创建和发现的内容。