独立指南。最后核对:2026-06-22。
Sakana Fugu:像调用单个模型一样使用多智能体 AI 编排
Sakana Fugu 是一种全新的 AI 产品形态:一个 API,背后协调一组专家模型。你不用纠结选哪个模型、哪个供应商、用什么兜底策略,Sakana Fugu 会自己判断每个任务找谁做、做完怎么验证、最后怎么汇总。本指南用大白话讲清楚 Sakana Fugu 是什么、怎么用、多少钱、值不值得。
Sakana Fugu 速览
Sakana Fugu 是什么?
Sakana Fugu 是东京 AI 研究实验室 Sakana AI 的旗舰产品。说白了,Sakana Fugu 就是一个以单一模型形态出现的多智能体编排系统。你不用手动挑选模型、供应商和兜底策略,Sakana Fugu 给你一个 API,背后自动协调一组专家 AI 代理来完成工作。
打个比方:Sakana Fugu 就像一个聪明的项目经理。你把任务交给它,它自己判断是直接搞定,还是拆成小任务分给最擅长的专家。做完之后还要检查、合并,最后给你一个打磨好的答案。所有这些复杂的后台操作,都被隐藏在一个你熟悉的 API 后面。
一个会调用其他模型的模型
Sakana Fugu 本身就是一个训练过的语言模型,学会了何时委派、调用谁、怎么合并结果。
一个 API,一个 endpoint
把现有工具指向 Sakana Fugu endpoint,配上 API key 就行,不需要迁移 SDK。
不是简单的路由器
Fugu 的协调是通过训练学会的,不是开发者手写的 if-else 规则。
Sakana Fugu 编排如何工作
每个 Sakana Fugu 请求都经过一个智能决策流程。下面是从你的 prompt 到最终答案的全过程。
你的请求到达
一个请求打到一个 OpenAI 兼容 endpoint,跟调用其他模型一模一样。
Fugu 做判断
编排器读取你的任务并决定:直接回答,还是拆成子任务。
组建团队
如果任务复杂,Fugu 为每个子任务选最合适的专家模型,兼顾质量和成本。
协调验证
Fugu 分配工作、检查结果,发现不对还可以重来一遍。
一个打磨好的答案
所有专家的工作被合成一个可靠的最终回复。
Sakana Fugu 背后的技术来自 Sakana AI 两篇 ICLR 2026 论文:Trinity(进化式 LLM 协调器)和 The Conductor(用强化学习学会编排代理)。Fugu 还能读自己的输出,判断要不要换个更好的协调策略。这个能力叫递归编排,不需要重新训练模型就能做到。
Fugu 和 Fugu Ultra 怎么选
Sakana Fugu 有两种模型,同一个 API,改一个参数就能切换。
Fugu 平衡型
Fugu 在强性能和低延迟之间取得平衡,是日常工作的安全默认选项。写代码、交互式聊天、code review 都能胜任。你还可以为合规需求排除特定的代理。
- 日常编程和交互式工作
- 更低的延迟,更快的响应
- 在长上下文推理任务上表现领先
- 可为合规需求排除特定代理
Fugu Ultra 极致质量
Fugu Ultra 追求高难度、多步骤问题上的最大答案质量。它会协调更深的专家代理池,当准确度和深度比速度更重要时使用。早期用户用它做 AI 研究、安全分析和专利调查。
- 高难度、多步骤推理任务
- 更深的专家代理协调
- 研究、安全和专利工作
- 与顶级前沿模型比肩
经验法则:日常工作、在意延迟先用 Fugu。正确性和深度压倒速度时用 Fugu Ultra。两种模型都包含在所有订阅方案里。
Sakana Fugu 价格
Sakana Fugu 提供月订阅和按量计费两种方式。所有方案都包含 Fugu 和 Fugu Ultra。官方价格可能调整,购买前请确认最新费率。
Standard
$20/月
轻度个人使用。Fugu 和 Fugu Ultra 都包含在内。适合个人探索和实验。
Pro
$100/月
Standard 的 10 倍用量。适合每周固定进行编码、审查和研究会话。
Max
$200/月
Standard 的 20 倍用量。为长时间、重负载、高频使用而设计。
按量计费 token 价格(Fugu Ultra)
多个代理同时活跃时,费用不叠加:你只需按参与的最高级模型付一种费率。
| 每 100 万 token | 标准上下文 | 超过 272K 上下文 |
|---|---|---|
| 输入 | $5.00 | $10.00 |
| 输出 | $30.00 | $45.00 |
| 缓存输入 | $0.50 | $1.00 |
估算按官方 Fugu Ultra 每百万 token 价格计算。订阅额度另算。
首发优惠:根据 Sakana AI 公告,2026 年 7 月底前订阅可在初始方案下免费获得第二个月。购买前请在官网确认。
Sakana Fugu Benchmark 解读
Sakana AI 将 Fugu Ultra 与最好的公开可访问前沿模型对标,声称它与受出口管制模型(Fable 5 和 Mythos Preview)比肩。这些数据来自厂商,作为方向性参考,不是担保。
| Benchmark | 测试内容 | Fugu | Fugu Ultra |
|---|---|---|---|
| SWE Bench Pro | 真实软件工程任务 | 59.0 | 73.7 |
| LiveCodeBench v6 | 代码能力评估 | 92.9 | 93.2 |
| GPQA Diamond | 研究生级科学推理 | 95.5 | 95.5 |
| Humanity's Last Exam | 高难通用推理 | 47.2 | 50.0 |
| AutoResearch (BPB) | 自主 ML 研究(越低越好) | - | 0.9774 |
理性看待 benchmark。独立评论者指出对比有时混合评估框架,且 Fugu 的代理池包含未公开的闭源和开源模型组合。把首页数字当起点,用自己的真实任务测过再做决定。
如何使用 Sakana Fugu API
因为 Sakana Fugu 讲的是标准 OpenAI Chat Completions 格式,已经在用 GPT、Claude 或 Gemini 的人,换个 Fugu endpoint 就能用,改动极小。官方把它描述为 OpenAI 兼容。
- 从 Sakana AI console 获取访问权限并生成 API key。
- 把 base URL 配成 console 显示的值,别从旧博文里抄。
- 日常先用 Fugu,高难度任务再升级到 Fugu Ultra。
- 记录 token、延迟、失败率和答案质量,再逐步扩大使用。
- 如果有数据、隐私或合规约束,用 agent opt-out 功能排除特定代理。
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["SAKANA_API_KEY"],
base_url=os.environ["SAKANA_BASE_URL"],
)
response = client.chat.completions.create(
model="fugu-ultra-20260615",
messages=[
{"role": "user", "content": "Review this pull request and list risks."}
],
)
print(response.choices[0].message.content)
Sakana Fugu 使用场景
根据 Sakana AI 的发布材料和开发者报告,早期用户主要在以下场景使用。
代码审查和编程
大 diff、多文件推理、回归风险检测和测试建议。有工程师反馈 Fugu Ultra 在一次审查中发现了 20 多个问题,而常规工具只能找到约 3 个。
AI 研究和论文复现
复现论文、运行自主 ML 研究循环、实验规划及深度验证。
安全分析
协调多模型推理进行漏洞调查,深度比速度更重要。
文献和专利检索
跨文档的深度、多步骤调查,需要仔细推理而非快速回答。
聊天机器人和代理产品
长会话中保持稳定的角色一致性,适合需要稳定行为的代理产品。
成本敏感的多步骤流程
当你事先不确定每个子任务该用哪个模型,且对多次调用的成本敏感时最合适。
为什么多智能体编排很重要
Sakana Fugu 不仅是性能牌。它的核心主张是摆脱对单一 AI 供应商的依赖。最近的现实教训:当某些前沿模型被施加出口管制时,访问权限一夜之间因法规变化而改变。
Sakana Fugu 构建在完全可替换的代理池之上。如果一个供应商限制访问,Fugu 动态绕过中断。随着时间的推移,随着更新、更强的模型加入,池子会越来越大。通过编排众多模型,Sakana AI 论证了一种现实的 AI 灵活性蓝图:不依赖任何单一供应商的前沿能力。
无门户限制
新的强大模型可以加入代理池,无需任何单一供应商批准。
绕过服务中断
如果一个供应商宕机或被限制,Fugu 自动将工作重新分配给可用代理。
面向未来的访问
获得前沿水平的结果,而不把关键工作流押在一家公司上。
Sakana Fugu 对比 OpenRouter
核心问题是:你想买现成的编排,还是自己搭路由和 agent workflow?
Sakana Fugu
像一个模型一样的编排 API,学会自动路由。适合想要一个 endpoint 拿到协调多代理结果的人。
OpenRouter
多模型统一入口,适合想明确选择供应商和比较价格的人。
LangGraph、CrewAI、AutoGen
自己搭建 agent workflow 的框架,适合需要完全控制和可观测性的人。
单一前沿模型
简单、可预测、容易审计。适合一个模型就够用的简单任务。
| 方案 | 路由如何决定 | 可见性 | 最适合 |
|---|---|---|---|
| Sakana Fugu | 学习型协调器 LLM(训练、递归) | 黑盒 | 想要前沿结果却不想被单一供应商锁死 |
| 手动 / 单一模型 | 你选一个模型祈祷 | 完全 | 治理要求单一供应商 |
| if-else 路由器 | 手写规则 | 完全 | 简单、可预测的路由 |
| Agent 框架 | 人工设计的代理图 | 完全 | 已有手工调优的工作流 |
| OpenRouter 类 | 市场加价格和延迟路由 | 部分 | 想要广泛模型访问和兜底 |
Sakana Fugu 安全、隐私与合规
重要的问题不是"Sakana Fugu 是企业级的吗?",而是:你能控制哪些代理和供应商参与吗?什么数据被发送了?日志怎么处理?当请求需要受限内容时会发生什么?
Sakana Fugu 在公开定位中强调了代理选择的灵活性,包括排除特定供应商或模型的能力。这对受监管的团队很重要 -- 医疗、金融、法律、国防和教育领域可能需要排除某些供应商,或将敏感工作负载保持在获批边界内。
- 哪些供应商或代理可以从模型池中排除?
- 敏感 prompt 能否按环境隔离?
- 哪些日志被保留?保留多久?
- API key 如何轮换和作用域控制?
- 能复现重要输出以通过审计吗?
- 高风险决策需要什么样的人工审查?
递归编排:Fugu 如何自我改进
Sakana Fugu 最独特的能力之一是递归。因为 Fugu 本身就是一个语言模型,它可以调用自己的实例 -- 读取中间输出、判断第一次协调策略是否有效、必要时发起修正轮次。
这就是 Sakana Fugu 测试时扩展的机制。一个相对较小的协调器,通过迭代自己刚产生的内容并重新委派,能达到它自己和任何一个单独工人都无法在单次运行中达到的答案。坦率地说,代价也是清楚的:递归扩展意味着递归成本。对简单任务,Fugu 可以直接便宜地回答。对困难任务,它可以升级深度。关键在于 Fugu 学会了什么时候升级是值得的。
为什么这很重要:这种架构会随时间复利。每个进入开放生态的新强大模型都可以加入 Fugu 的代理池。不像单体模型需要昂贵的重新训练才能改进,Fugu 随着更广泛生态的进步而递增地变强。
Sakana Fugu 上手指南
从零到第一次编排请求的实操路径。
创建账号并获取 API key
通过 Sakana AI console 注册并生成 Sakana Fugu API key。根据预期用量选择订阅方案或按量计费。
把客户端指向 Fugu endpoint
把你的 OpenAI 兼容客户端的 base URL 设为 Fugu endpoint 并配上 key。不需要迁移 SDK。
选择模型
交互式工作先用 Fugu,高难度多步骤任务用 Fugu Ultra。以后切换只需改一个参数。
发送真实任务并测量
跑一个有代表性的工作负载 -- code review、研究问题、流程步骤 -- 对比质量、延迟和成本。
调优代理池并扩展
如果有合规需求,从池中排除特定代理。然后根据实际用量调整方案。
Sakana Fugu 词汇表
理解 Sakana Fugu 和多智能体 AI 编排所需的关键概念。
Sakana Fugu 局限
别光看发布稿就接入。像买车一样,参数漂亮不代表适合你的路。以下是需要诚实权衡的取舍。
- 底层路由细节不像自建 agent graph 那样透明,路由是黑盒。
- Fugu Ultra 可能用更多协调换更高质量,延迟因请求而异。
- EU 和 EEA 暂不可用,合规团队要先确认区域支持。
- 简单任务可能直接调用便宜模型更划算,编排会带来额外开销。
- 厂商 benchmark 需要用你的真实任务验证才能信任。
- 每次请求成本比固定单一模型调用更难预测,动态路由使成本波动。
- Fugu 是年轻的商业产品,SLA、正常运行时间和数据驻留需直接确认。
Sakana Fugu 的发展历程
Fugu 是 Sakana AI 长期研究线的产品形态,从进化式模型合并和自主 AI 研究发展而来。
进化式模型合并
展示了多样化开源模型可以组合产生单个模型所不具备的能力。
The AI Scientist 和 ShinkaEvolve
展示了协调的 AI 代理执行完整科研周期和进化搜索 LLM 生成程序。
AB-MCTS
展示了多个前沿模型通过树搜索协作可以显著超越任何单个模型。
2026 年 4 月:Fugu beta 开放
Sakana AI 开放 Sakana Fugu beta 申请,作为 OpenAI 兼容 API 提供。
ICLR 2026:Trinity 和 Conductor 发表
两篇论文正式确立了学习型编排的学术基础。
发布:Fugu 和 Fugu Ultra 正式 GA
Sakana 发布 Fugu Ultra,声称与受出口管制的前沿模型比肩。
哪个 Sakana Fugu 方案适合你?
匹配你的真实使用模式。从小开始,测完再扩展。
个人 / 爱好者
Standard - $20/月
每周实验几次、做点副项目、想亲手体验编排。两种模型都包含。
在职专业人士
Pro - $100/月
每周固定编程、审查和研究会话,需要 Standard 10 倍的余量。
重度 / 团队
Max - $200/月
长、重、频繁的工作负载,想要 Standard 20 倍的用量和可预测的月账单。
波峰型 / 企业
按量计费
用量波动或非常大。Token 计费随需求弹性,按参与的最高级模型付一种费率。
为什么叫 Fugu?河豚背后的故事
Sakana 在日语里是"鱼"的意思,对东京实验室来说很贴切。Fugu 是日本河豚 -- 一道以需要专业厨师才能安全烹饪而闻名的美食。这个比喻很妙:河豚通过吸纳周围的东西来膨胀自己,Sakana Fugu 通过吸纳周边模型池来膨胀自己的能力。
一个平静的表面 -- 一个 API -- 背后藏着能在任务需要时急剧扩展的东西。这品牌传达了 Sakana AI 的核心理念:强大的 AI 将是协作的生态系统,而不是孤立的庞然大物。
一个表面,多个部分
像河豚一样,Fugu 向世界展示单一的表面,同时协调众多内部系统。
按需扩展
简单任务时保持精简。复杂任务时,通过拉入更多代理来膨胀能力。
Sakana Fugu:谣言与真相
谣言:它就是个 if-else 路由器
真相:Fugu 是一个训练过的语言模型,学会了协调策略,而不是手写路由逻辑。这正是 Trinity 和 Conductor 研究的全部意义。
谣言:要拿到顶级结果必须有 Fable 5 权限
真相:Sakana 声称 Fugu Ultra 通过编排公开可访问的模型达到可比结果,尽管 Fable 5 和 Mythos 不在它的代理池里。
谣言:更多代理就意味着费用叠加
真相:按量计费时,多个代理活跃你只需付一种费率,按参与的最高级模型计算,不叠加。
谣言:它总是比单一模型便宜
真相:省钱的主张取决于它多久递归一次。递归扩展意味着递归成本,用你自己的负载测试后再相信省钱的说法。
Sakana Fugu 路线图
根据 Sakana AI 发布声明,以下是 Fugu 的未来方向。路线图项目是声明性意图,可能变化。
- 扩展专家代理池,包括开源模型和 Sakana AI 自有模型,以加强长运行任务的协调。
- 快速模型刷新,Sakana 目标是在新前沿模型公开发布后约两周内训练并评估更新的 Fugu 模型。
- 更多的用户控制,超越今天的 agent opt-out,让你对 Fugu 的工作方式有更多发言权。
- 递增改进,因为 Fugu 使用学习型编排,随着生态系统的进步而变强,无需昂贵的单体重新训练。
Sakana Fugu 核心要点
Sakana Fugu 是一个学习型编排模型,表现得像一个单一模型,背后通过一个 OpenAI 兼容 API 协调一群前沿 LLM。
它提供Fugu(平衡型)和Fugu Ultra(极致质量)两种模型,一个参数切换,支持订阅和按量计费。
Sakana 声称 Fugu Ultra 达到前沿级性能,可与受出口管制的模型媲美,同时没有单一供应商锁定风险。
权衡在于黑盒路由、可变成本和延迟开销,在投入生产前用自己的负载验证。
Sakana Fugu 适合谁
AI 工程师和开发者
构建编程助手、代理或流程,想要前沿结果又不想管理多个供应商 key。
ML 研究员
运行自主研究循环、论文复现和高难度推理任务,协调多模型能超越任何单一模型。
企业和 CTO
关心出口管制和单一供应商风险,需要弹性、可替换的代理池对冲方案。
技术创始人
发布 AI 产品,想要一个随着模型生态进步而改进的稳定 API 接口。
安全团队
将多模型推理应用于漏洞分析,深度胜过速度。
分析师和 IP 专业人士
进行需要仔细多步推理的文献和专利调查。
对 Sakana Fugu 的评语
Sakana Fugu 是 2026 年最有趣的产品押注之一,因为它重新定义了前沿问题。不是"我们怎么构建更大的模型",而是"我们怎么构建更聪明的协调器"。如果学习型编排理论在生产规模上成立,它指向一个未来:能力来自协调而非原始规模,且没有任何单一供应商的限制能完全切断你的访问。
诚实的保留意见仍然存在:无法完全审计的路由、随递归波动的成本、编排必然增加的延迟,以及一个年轻产品需要独立测试验证的营销主张。但方向确实新颖,研究基础真实可靠,弹性论证也恰逢其时。
谁应该先尝试:已经在用多个模型做多步骤编程、推理和研究任务的开发者和研究员,想要一个随着生态系统进步而改进的稳定 API。
Sakana Fugu 评估清单
发布 benchmark 只能帮你决定测什么,最终要用自己的生产型任务判断 Sakana Fugu 是否值得接入。
先定义任务类型
把代码审查、研究总结、安全分析、专利检索和聊天机器人分开测,不要混成一个平均分。
选真实基线
拿 Fugu 和 Fugu Ultra 对比你现在用的单模型、手写路由器或 agent 框架,而不是只看榜单。
喂复杂 prompt
加入长上下文、缺文件、矛盾指令和追问纠错。Fugu 的价值主要在复杂多步骤任务。
量四个数
记录答案质量、延迟、token 成本和人工修正率。答案更好但太慢,也可能不适合线上交互。
核对治理要求
生产前确认 provider opt-out、数据使用设置、地区可用性、日志和采购流程。
先灰度
先让一小部分真实任务经过 Fugu,只有质量收益能覆盖延迟和成本时再扩大。
Sakana Fugu 企业清单
企业价值不只看 benchmark,更看控制能力、可重复性和出问题时的行为。
| 问题 | 为什么重要 | 决策信号 |
|---|---|---|
| 你所在地区能用吗? | 官方 FAQ 说欧盟和欧洲经济区暂不支持。 | EU 生产环境先别上,等可用性变化。 |
| 能排除底层 provider 吗? | 有些团队不能把数据发给特定供应商。 | Fugu 支持 opt-out,Fugu Ultra 使用固定池。 |
| 能审计路由吗? | 安全和监管团队可能需要知道数据由谁处理。 | Fugu 当前不暴露完整路由细节。 |
| 延迟波动怎么办? | 更深的编排可能提高质量,也会拉长响应时间。 | 交互场景用 Fugu,高难批处理再用 Ultra。 |
| 成本怎么封顶? | 递归编排可能增加 token 量。 | 给每类工作流设预算,并记录实际输入输出 token。 |
| 谁负责事故支持? | AI 平台事故需要明确 owner,不只是一个模型 API key。 | 接用户流量前先定升级路径。 |
Sakana Fugu 搜索意图地图
这些是本指南要承接的用户意图,来自源文件和 Sakana Fugu 发布后的真实主题结构。
信息型
Sakana Fugu、Sakana Fugu 是什么、Sakana AI Fugu、多智能体编排 API、学习型模型编排。
开发者型
Sakana Fugu API、OpenAI-compatible Fugu endpoint、Fugu Ultra model name、Sakana Fugu quickstart、代码审查工作流。
商业型
Sakana Fugu pricing、Fugu Ultra token cost、订阅方案、按量计费、Fugu Ultra 每百万 token 价格。
技术型
TRINITY、Conductor、agent pool、model routing、递归编排、test-time scaling、provider opt-out。
对比型
Sakana Fugu vs OpenRouter、Sakana Fugu vs LangGraph、Sakana Fugu vs CrewAI、Sakana Fugu vs AutoGen。
购买决策型
Sakana Fugu 值不值得、最佳使用场景、限制、企业清单、隐私和合规问题。
Sakana Fugu 使用技巧
好的编排系统也需要好的使用纪律。
- 默认先用 Fugu,必要时升级 Ultra,尤其是质量比响应时间更重要的任务。
- 用自己的任务测成本,因为递归调用和验证步骤会改变 token 用量。
- 谨慎使用 provider opt-out,它能满足合规,但每排除一个 provider 都可能降低编排灵活性。
- 把路由当黑盒设计,围绕可观察输出做日志、回退和 QA 检查。
- 简单任务保持简单。短而干净的 prompt 可能用便宜本地模型或单一前沿模型更划算。
- 保存 benchmark prompt,以后 Fugu 更新时可以用同一套决策集复测。
Sakana Fugu 来源说明
这是独立指南,所以要把官方事实、分析判断和不可验证内容分开。
官方产品事实
价格、模型名、OpenAI 兼容 API、可用地区和 provider 控制,应以 Sakana AI 官方产品页和控制台为准。
Benchmark 注意事项
本页 benchmark 表整理的是公开发布说法。它适合当测试计划输入,不等于你的代码库或研究流程一定复现同样效果。
不编造信任信号
本页不写假评论、假评分、假办公室、假用户数,也不冒充官方。这样 schema 和页面文案才站得住。
浏览本 Sakana Fugu 指南
跳转到本完整参考指南的任意部分。
Sakana Fugu 常见问题
Sakana Fugu 是什么,用大白话说?
Sakana Fugu 是一个多智能体 AI 编排系统,表现得像一个单一模型。它是一个训练来调用其他模型的语言模型,每个请求都自己判断是直接回答还是协调团队,全部通过一个 OpenAI 兼容的 API 完成。
Sakana Fugu 多少钱?
订阅方案:$20/月(Standard)、$100/月(Pro,10 倍用量)、$200/月(Max,20 倍用量),每个方案都包含 Fugu 和 Fugu Ultra。按量计费按 token 算:Fugu Ultra 输入 $5、输出 $30、缓存输入 $0.50 每百万 token,超过 272K 上下文后费率更高。
Fugu 和 Fugu Ultra 有什么区别?
Fugu 在日常工作中平衡性能和延迟。Fugu Ultra 在高难度、多步骤推理上优先答案质量,协调更深的代理池,代价是速度。两者之间切换只需改一个参数。
Sakana Fugu API 是 OpenAI 兼容的吗?
是的。你把现有的 OpenAI 格式客户端指向 Fugu endpoint 配上 API key 就行,不需要迁移 SDK。
Sakana Fugu 和 Fable 5、Mythos 比怎么样?
Sakana 声称 Fugu Ultra 在严格 benchmark 上与 Fable 5 和 Mythos Preview 比肩,同时规避了出口管制风险。Fable 5 和 Mythos 不在 Fugu 的代理池中,因为它们不是公开可访问的。
Sakana Fugu 值不值得?
对想要前沿结果又不想被单一供应商锁死的团队来说值得,适合编程、推理或研究负载,且能接受黑盒路由。对需要完全可审计路由、低于 100ms 延迟或单一供应商治理的负载不太合适。
能为合规排除特定模型吗?
可以。Fugu 让你从池中排除特定代理,以满足数据、隐私和合规约束。这会牺牲一些灵活性换取治理控制。
谁开发的 Sakana Fugu?
Sakana AI,一家东京的 AI 研究实验室。Fugu 是其模型合并、自主 AI 和学习型编排研究的产物(Trinity 和 Conductor,ICLR 2026)。
SakanaFugu.com 是官网吗?
不是。SakanaFugu.com 是独立指南,与 Sakana AI 无关。请始终在官方渠道确认最新价格、模型 ID 和可用性。
Sakana Fugu 相关话题
与 Sakana Fugu 和多智能体 AI 编排最相关的概念。
理解 Sakana Fugu 的成本模型
如何在实践中理解 Sakana Fugu 的实际成本。
Sakana 的经济论点是:编排可以比为所有事情调用最贵模型更便宜 -- 用一个小协调器分解任务,只在难的子任务上调用前沿模型,只在不确定性高时并行运行工人和投票,避免不必要的昂贵模型。诚实的但书:递归会增加成本。省钱与否取决于 Ultra 多久需要递归一次才能打败底层模型。
便宜分解
一个小协调器在任何昂贵调用之前先将任务拆分。
选择性升级
前沿模型只在真正需要的子任务中被调用。
单费率计费
多个代理运行时,按最高级模型付一种费率,费用不叠加。