美国Anthropic发布人工智能新模型 能解决更复杂问题

Anthropic 正式发布首个“混合推理模型” Claude 3.7 Sonnet。(图:TechCrunch)

新功能!

听新闻,按这里!

我要听,按这里!

美国人工智能初创公司Anthropic 正式发布首个“混合推理模型” Claude 3.7 Sonnet,能够解决更复杂的问题,并在数学和编程等领域的表现,超越了其之前的模型。

综合美国科技新闻网站The Verge及TechCrunch报道,Claude 3.7 Sonnet是一个既能提供实时回答,又能给出经过深思熟虑答案的单一模型。用户可以选择是否激活人工智能模型的推理能力,从而让它在短时间或较长时间内进行思考,以回答问题。

Claude 3.7 Sonnet 从周一开始在 Claude 应用程序中提供,开发人员可以通过 Anthropic 的 API、美国亚马孙的Amazon Bedrock 和谷歌云端( Google Cloud) 的 Vertex AI 使用。

该模型的运行成本与其前身 3.5 Sonnet 相同,每百万输入token 3 美元(约4新元),每百万输出token 15 美元(约20新元)。

除了新模型,Anthropic 还发布了代理编码工具 Claude Code。虽然 Anthropic 已经为代码编辑器 Cursor 等人工智能编码工具提供支持,但 Claude Code 意在成为一个活跃的协作伙伴,具备搜索和阅读代码、编辑文件、编写和运行测试、提交和推送代码至代码托管平台 GitHub,以及使用命令行工具的能力。

尽管开放人工智能研究中心OpenAI 等公司提供独立的推理模型,但Anthropic 产品研究负责人黛安·佩恩 (Dianne Penn) 在受访时表示,该公司希望简化人工智能使用体验。

她说:“我们坚信推理是 人工智能的一个特性,而不是一个完全分开的功能。”她举例称,Claude 在回答‘现在几点了’这种简单问题时,不应耗费太多时间,而要回答更复杂提问如‘考虑三月下旬天气的两周意大利旅行’,则需要更深入的推理能力。

她也说,Claude 3.7 Sonnet 在代理编码、金融和法律任务方面表现明显提升。虽然 Claude 仍不具备像其他 人工智能模型的实时网络搜索功能,但其知识截止日期为 2024 年 10 月,信息相对更为更新。

此外,Anthropic 还允许开发者通过其暂存器帮助控制模型的思考方式,甚至可以精确指示响应所需的时间。

Anthropic 产品副总裁 迈克尔·格斯滕哈贝尔(Michael Gerstenhaber) 说:“有时候,开发者需要明确说,回答这个问题的答案不应超过 200 毫秒。这也是产品决策的一部分。”

在 Anthropic 内部,员工使用 Claude 3.7 Sonnet 进行前端网页设计、构建互动游戏,甚至投入 45 分钟进行编程任务。

佩恩也透露,Anthropi还通过将模型的API映射到控制器方案,测试模型在经典视频游戏“宝可梦”(Pokémon)游戏中的表现。在该测试中,Claude 3.5 Sonnet在游戏开始时无法离开“真新镇”(Pallet Town),而 3.7 版本却能击败多个健身馆馆主

相关标签
  • Anthropic
  • Claude 3.7 Sonnet
  • 人工智能
  • Artificial Intelligence
  • Advertisement

    Advertisement