多协议兼容
/v1/chat/completions(OpenAI)、/v1/messages(Anthropic)、/v1beta/*(Gemini)等推理入口形态。
OctaFuse 是面向团队与企业的 AI Gateway:在上游 AI 供应商与各条产品线之间架起一层统一的接入基础设施。
适合同时对接 多家 AI 供应商、驱动 多条产品线,并希望把稳定性、成本与合规留痕从业务代码中抽离出来的团队与平台组。
创建 OctaFuse 的初衷,是为了构建一套 可自主掌控、可持续演进 的 AI 网关能力,服务内部不同 SaaS 系统。
在调研过多个开源和商业方案后,我们发现几类共性痛点:
OctaFuse 希望通过更高自由度解决上述问题:
多协议兼容
/v1/chat/completions(OpenAI)、/v1/messages(Anthropic)、/v1beta/*(Gemini)等推理入口形态。
统一密钥与预算体系
用户 / Key 管理,预算上限与周期重置;客户端可用 GET /v1/me 查询预算等状态。
模型路由治理
Provider / Model / Route 管理;支持 route group 与按优先级的 failover。
分层计费与对账
metered_cost / standard_cost / charged_cost 三套成本口径,便于供给侧计量、目录价与实际对用户扣费的对齐。
审计与观测
全局与 按 Key 的请求日志,以及用户级审计轨迹,便于追溯与问题排查。
Proxy 错误告警
管理台可配置 飞书、企业微信 机器人 Webhook;Proxy 转发错误时主动推送,便于发现上游异常、额度/限流压力及上游 API Key 欠费、需充值等信号。
Analytics(用量与可靠性)
管理台按时间范围汇总模型、供应商、用户用量及可靠性概况,便于容量观察、成本感知与上游稳定性对比。
Playground(试调用)
针对单条模型路由发起试请求,确认能否连上供应商与配置是否正确;不占用用户额度,也不产生与真实业务调用相同的计费与用量记录,适合排错与上线前自检。
Simulator(客户端模拟)
浏览器内携带真实用户 API Key,按 OpenAI / Anthropic / Gemini 方式调用已部署网关,联调与验收鉴权、选路、计费、日志是否与线上一致。
多运行时部署
Cloudflare(Worker + Pages + D1)或自托管(Docker / Node + Postgres / MySQL)。选型与命令见站内部署文档。
业务系统解耦
通过 Admin API(/api/admin/*) 与上层 SaaS 对接,让业务更专注 AI 应用本身。
可按 合规、延迟、运维习惯与数据落点 在下述形态中取舍;逐步命令与排障见 文档首页 部署相关章节。
更多选型说明见 文档首页 中的线上部署章节,上手步骤见 快速开始。开源协议为 GNU AGPL v3,许可全文见 LICENSE。