美国Anthropic发布人工智能新模型能解决更复杂问题

美国人工智能初创公司Anthropic 正式发布首个“混合推理模型” Claude 3.7 Sonnet，能够解决更复杂的问题，并在数学和编程等领域的表现，超越了其之前的模型。

综合美国科技新闻网站The Verge及TechCrunch报道，Claude 3.7 Sonnet是一个既能提供实时回答，又能给出经过深思熟虑答案的单一模型。用户可以选择是否激活人工智能模型的推理能力，从而让它在短时间或较长时间内进行思考，以回答问题。

Claude 3.7 Sonnet 从周一开始在 Claude 应用程序中提供，开发人员可以通过 Anthropic 的 API、美国亚马孙的Amazon Bedrock 和谷歌云端（ Google Cloud）的 Vertex AI 使用。

该模型的运行成本与其前身 3.5 Sonnet 相同，每百万输入token 3 美元（约4新元），每百万输出token 15 美元（约20新元）。

除了新模型，Anthropic 还发布了代理编码工具 Claude Code。虽然 Anthropic 已经为代码编辑器 Cursor 等人工智能编码工具提供支持，但 Claude Code 意在成为一个活跃的协作伙伴，具备搜索和阅读代码、编辑文件、编写和运行测试、提交和推送代码至代码托管平台 GitHub，以及使用命令行工具的能力。

尽管开放人工智能研究中心OpenAI 等公司提供独立的推理模型，但Anthropic 产品研究负责人黛安·佩恩（Dianne Penn）在受访时表示，该公司希望简化人工智能使用体验。

她说：“我们坚信推理是人工智能的一个特性，而不是一个完全分开的功能。”她举例称，Claude 在回答‘现在几点了’这种简单问题时，不应耗费太多时间，而要回答更复杂提问如‘考虑三月下旬天气的两周意大利旅行’，则需要更深入的推理能力。

她也说，Claude 3.7 Sonnet 在代理编码、金融和法律任务方面表现明显提升。虽然 Claude 仍不具备像其他人工智能模型的实时网络搜索功能，但其知识截止日期为 2024 年 10 月，信息相对更为更新。

此外，Anthropic 还允许开发者通过其暂存器帮助控制模型的思考方式，甚至可以精确指示响应所需的时间。

Anthropic 产品副总裁迈克尔·格斯滕哈贝尔（Michael Gerstenhaber）说：“有时候，开发者需要明确说，回答这个问题的答案不应超过 200 毫秒。这也是产品决策的一部分。”

在 Anthropic 内部，员工使用 Claude 3.7 Sonnet 进行前端网页设计、构建互动游戏，甚至投入 45 分钟进行编程任务。

佩恩也透露，Anthropi还通过将模型的API映射到控制器方案，测试模型在经典视频游戏“宝可梦”（Pokémon）游戏中的表现。在该测试中，Claude 3.5 Sonnet在游戏开始时无法离开“真新镇”（Pallet Town），而 3.7 版本却能击败多个健身馆馆主

美国Anthropic发布人工智能新模型能解决更复杂问题

Advertisement

美国Anthropic发布人工智能新模型能解决更复杂问题

Advertisement

Advertisement

下载《8视界》应用程序

Advertisement

Advertisement

Advertisement

订阅《SO YOUNG》电邮简报

下载《8视界》应用程序