LLM Gateway

产品简介

LLM Gateway 是一个大模型 API 中转聚合平台,为开发者和企业提供统一、稳定、高效的 AI 模型调用服务。

🔌

统一 API 接口

提供 OpenAI 兼容的标准 API 接口,一套代码接入所有模型。

🏢

9 家厂商支持

支持 OpenAI、Anthropic、Google、DeepSeek、智谱、火山引擎、阿里百炼、Moonshot、MiniMax。

智能负载均衡

多渠道智能负载均衡和自动故障转移,保障服务高可用。

💰

精确计费

内置计费系统,按 Token 精确计费,支持预扣费和实际用量结算。

🔑

API Key 管理

灵活的 API Key 管理和速率限制,保障账户安全。

📊

日志与统计

完整的请求日志和用量统计,随时掌握调用情况。

产品计费

💡 计费模式:预充值 + 按量计费

采用预充值模式,先充值后使用,按实际 Token 用量精确计费。

  • 采用预充值模式,先充值后使用
  • 按实际 Token 用量计费(区分输入 / 输出 Token)
  • 请求时预扣费,完成后按实际用量精确结算
  • 不同模型价格不同,可在"模型列表"页面查看实时定价
  • 管理员可配置每个模型的单价(元 / 千 Token

快速入门

使用步骤

1

注册账号

使用邮箱 + 密码完成注册

2

创建 API Key

登录后在"API Keys"页面创建 API Key

3

充值余额

联系管理员充值余额

4

调用接口

使用 API Key 调用接口,开始使用

调用示例

API 基础地址:https://llm.ruiqiu.cc

cURL

bash
curl https://llm.ruiqiu.cc/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "你好"}],
    "stream": true
  }'

Python

python
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.ruiqiu.cc/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "你好"}],
    stream=True
)

for chunk in response:
    print(chunk.choices[0].delta.content or "", end="")

Node.js

javascript
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_API_KEY',
  baseURL: 'https://llm.ruiqiu.cc/v1'
});

const stream = await client.chat.completions.create({
  model: 'gpt-4o',
  messages: [{ role: 'user', content: '你好' }],
  stream: true
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

支持的模型

目前支持 9 家主流大模型厂商,涵盖对话、推理、向量化等多种场景。

厂商 代表模型
OpenAI gpt-4o gpt-4o-mini gpt-4-turbo o1 o1-mini
Anthropic claude-sonnet-4-20250514 claude-3.5-sonnet claude-3-haiku
Google gemini-2.0-flash gemini-1.5-pro gemini-1.5-flash
DeepSeek deepseek-chat deepseek-reasoner
智谱 AI glm-4-plus glm-4-flash glm-4-long
火山引擎 doubao-pro-32k doubao-lite-32k
阿里百炼 qwen-max qwen-plus qwen-turbo
Moonshot moonshot-v1-8k moonshot-v1-32k moonshot-v1-128k
MiniMax abab6.5s-chat abab5.5-chat

API 参考

主要接口

POST /v1/chat/completions — 对话补全(支持流式 SSE)
POST /v1/embeddings — 文本向量化
GET /v1/models — 获取可用模型列表

请求头

HTTP Header
Authorization: Bearer <API_KEY>

Chat Completions 请求体参数

参数 类型 必填 说明
model string 必填 模型名称
messages array 必填 消息列表
stream boolean 可选 是否流式输出
temperature number 可选 温度参数 0-2
max_tokens integer 可选 最大生成 token 数

常见问题