个人开发者
买了多个 Coding Plan、Token Plan 或 Agent 订阅,却要维护一堆不同的 Base URL 和 API Key?OctaFuse 把上游供应商汇总到 一个网关,客户端只改一处配置即可切换模型、做降级或备份路由。
OctaFuse 是开源 AI Gateway:把分散在不同供应商、不同计划里的模型能力,汇总成一个统一的调用入口。
无论你是个人开发者管理多个 plan 与密钥,还是团队需要为部门或客户单独发 Key 并做预算与审计,OctaFuse 都能在同一套网关上承载。
个人开发者
买了多个 Coding Plan、Token Plan 或 Agent 订阅,却要维护一堆不同的 Base URL 和 API Key?OctaFuse 把上游供应商汇总到 一个网关,客户端只改一处配置即可切换模型、做降级或备份路由。
团队与企业
在一个地方统一接入不同 Provider,为下游部门、项目或外部客户分别创建 API Key,并配套预算上限、计费口径、请求日志与审计轨迹——把模型调用的治理从业务代码里抽离出来。
模型供应越来越碎片化——调用入口、API Key、额度、账单和日志分散在不同供应商与工具里,切换模型或排查问题都要改多处配置。
在调研多个开源与商业方案后,我们反复看到几类共性痛点:
OctaFuse 作为可自主部署、可持续演进的网关层来应对上述问题:
统一接入入口
客户端只需一个 Base URL 和一个 API Key。网关兼容 OpenAI、Anthropic、Gemini 等常用协议形态,背后可路由到任意已配置的上游。
密钥与预算管理
为用户或下游场景单独创建 API Key,设置预算上限与周期重置;客户端可通过 GET /v1/me 查询额度状态。
智能路由与容错
Provider / Model / Route 分层管理;支持 route group 与按优先级的 failover,在上游异常时自动切换。
计费与对账
metered_cost、standard_cost、charged_cost 三套成本口径——供给侧计量、目录价与实际对用户扣费可分别对齐。
审计与观测
全局与 按 Key 的请求日志,以及用户级审计轨迹,便于追溯调用链路与排查问题。
错误告警
管理台可配置 飞书、企业微信 机器人 Webhook;Proxy 转发失败时主动推送,及时发现上游异常、限流或 Key 欠费。
用量分析
管理台按时间范围汇总模型、供应商、用户用量及可靠性概况,便于成本感知与上游稳定性对比。
联调与自检
Playground 对单条路由试调用(不占用户额度);Simulator 在浏览器内用真实 Key 模拟客户端调用,验收鉴权、选路、计费与日志。
灵活部署
Cloudflare(Worker + Pages + D1)或自托管(Docker / Node + Postgres / MySQL)。本地 Docker 数分钟即可跑通。
Admin API 集成
通过 /api/admin/* 与门户、业务系统对接——自动开通用户、创建 Key、同步预算,让应用层专注 AI 能力本身。
可按 合规、延迟、运维习惯与数据落点 在下述形态中取舍:
更多选型说明见 文档首页 中的线上部署章节。开源协议为 GNU AGPL v3,许可全文见 LICENSE。
本地 Docker 是最快的体验路径——配置上游 Provider,拿到统一 Base URL 与 API Key,即可在 Cursor、CLI 或自研应用中接入。