产品简介
LLM Gateway 是一个大模型 API 中转聚合平台,为开发者和企业提供统一、稳定、高效的 AI 模型调用服务。
🔌
统一 API 接口
提供 OpenAI 兼容的标准 API 接口,一套代码接入所有模型。
🏢
9 家厂商支持
支持 OpenAI、Anthropic、Google、DeepSeek、智谱、火山引擎、阿里百炼、Moonshot、MiniMax。
⚡
智能负载均衡
多渠道智能负载均衡和自动故障转移,保障服务高可用。
💰
精确计费
内置计费系统,按 Token 精确计费,支持预扣费和实际用量结算。
🔑
API Key 管理
灵活的 API Key 管理和速率限制,保障账户安全。
📊
日志与统计
完整的请求日志和用量统计,随时掌握调用情况。
产品计费
💡 计费模式:预充值 + 按量计费
采用预充值模式,先充值后使用,按实际 Token 用量精确计费。
- 采用预充值模式,先充值后使用
- 按实际 Token 用量计费(区分输入 / 输出 Token)
- 请求时预扣费,完成后按实际用量精确结算
- 不同模型价格不同,可在"模型列表"页面查看实时定价
- 管理员可配置每个模型的单价(元 / 千 Token)
快速入门
使用步骤
1
注册账号
使用邮箱 + 密码完成注册
2
创建 API Key
登录后在"API Keys"页面创建 API Key
3
充值余额
联系管理员充值余额
4
调用接口
使用 API Key 调用接口,开始使用
调用示例
API 基础地址:https://llm.ruiqiu.cc
cURL
bash
curl https://llm.ruiqiu.cc/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4o",
"messages": [{"role": "user", "content": "你好"}],
"stream": true
}'
Python
python
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.ruiqiu.cc/v1"
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "你好"}],
stream=True
)
for chunk in response:
print(chunk.choices[0].delta.content or "", end="")
Node.js
javascript
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: 'YOUR_API_KEY',
baseURL: 'https://llm.ruiqiu.cc/v1'
});
const stream = await client.chat.completions.create({
model: 'gpt-4o',
messages: [{ role: 'user', content: '你好' }],
stream: true
});
for await (const chunk of stream) {
process.stdout.write(chunk.choices[0]?.delta?.content || '');
}
支持的模型
目前支持 9 家主流大模型厂商,涵盖对话、推理、向量化等多种场景。
| 厂商 | 代表模型 |
|---|---|
| OpenAI | gpt-4o gpt-4o-mini gpt-4-turbo o1 o1-mini |
| Anthropic | claude-sonnet-4-20250514 claude-3.5-sonnet claude-3-haiku |
gemini-2.0-flash gemini-1.5-pro gemini-1.5-flash |
|
| DeepSeek | deepseek-chat deepseek-reasoner |
| 智谱 AI | glm-4-plus glm-4-flash glm-4-long |
| 火山引擎 | doubao-pro-32k doubao-lite-32k |
| 阿里百炼 | qwen-max qwen-plus qwen-turbo |
| Moonshot | moonshot-v1-8k moonshot-v1-32k moonshot-v1-128k |
| MiniMax | abab6.5s-chat abab5.5-chat |
API 参考
主要接口
POST
/v1/chat/completions
— 对话补全(支持流式 SSE)
POST
/v1/embeddings
— 文本向量化
GET
/v1/models
— 获取可用模型列表
请求头
HTTP Header
Authorization: Bearer <API_KEY>
Chat Completions 请求体参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model |
string | 必填 | 模型名称 |
messages |
array | 必填 | 消息列表 |
stream |
boolean | 可选 | 是否流式输出 |
temperature |
number | 可选 | 温度参数 0-2 |
max_tokens |
integer | 可选 | 最大生成 token 数 |