1. 对话
Nebula-API操作文档
🇨🇳中文
  • 🇨🇳中文
  • 🇺🇸English
  • 对话
    • 通用文本对话接口文档
    • 通义千问通用对话接口文档
    • GPT-Chat通用对话文档
    • DeepSeek通用对话文档
    • Grok 模型(xAI)通用对话接口文档
    • Gemini通用对话文档
  • 视频
    • 通用视频生成接口文档
    • sora-2接口文档
    • 阿里万相wan2.5图生视频接口文档
    • 谷歌Veo视频模型接口文档
  • 图像
    • 通用图片生成接口文档
    • Nano Banana图片生成接口文档
    • 通义千问文生图模型接口文档
    • 通义千问图像编辑模型接口文档
  • AI应用
    • Claude Code等客户端集成指南
    • Cherry Studio集成指南
    • Cursor代码编辑器集成指南
    • LangChain开发框架集成指南
    • 沉浸式翻译集成指南
    • Cline (VS Code) AI 编程助手集成指南
  • 实时对话
    • Realtime实时对话文档
    • gemini LiveSteam实时对话文档
  • AIOT对话接口文档
  1. 对话

Gemini通用对话文档

概述#

本文档介绍如何通过 Nebula API 的 OpenAI 兼容接口调用 Google Gemini 通用对话模型(含思考模式与搜索)。

基础信息#

项目内容
Base URLhttps://llm.ai-nebula.com/v1/chat/completions
认证方式API Key (Token)
请求头Authorization: Bearer sk-xxxx、Content-Type: application/json

支持的模型(示例)#

gemini-2.5-flash / gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-pro
gemini-3-pro-preview(默认开启思考,使用 thinking_level)
gemini-3-pro-preview-thinking-low
gemini-3-pro-preview-thinking-high
以路由配置为准,如有疑问请咨询管理员。

API 接口#

1. 最小示例(非流式)#

2. 流式 SSE 示例#

3. 常用参数#

采样与控制:temperature、top_p、max_tokens、stop
结构化输出:response_format/json_schema
工具调用:tools/tool_choice(OpenAI 兼容格式)
思考模式:thinking_budget(2.5 系列)或 thinking_level(3 Pro Preview)
搜索:googleSearch 工具

4. 工具调用(Functions / Tools)#

OpenAI 兼容写法:
原生搜索透传(可选,二选一或并存):
"extra_body": {
  "google": {
    "tools": [
      { "googleSearch": {} }
    ]
  }
}

5. 思考能力(Thinking)#

2.5 系列:使用 thinking_budget(数字)。-1 自动,0 关闭,>0 指定预算。
3 Pro Preview:使用 thinking_level(LOW/HIGH),默认 HIGH,无需数字预算。
示例:2.5 系列指定预算
示例:3 Pro Preview 指定思考级别并开启搜索(推荐写法)

响应与用量#

非流式:一次性返回 choices、usage
流式:SSE 分片返回;若渠道支持 stream_options.include_usage=true,可在分片内返回实时用量

常见问题(FAQ)#

1.
与 OpenAI 兼容程度?
使用 OpenAI Chat Completions 格式;少数字段可能因渠道差异被忽略。
2.
思考模式如何开启?
2.5:thinking_budget 或模型后缀 -thinking/-thinking-<数字>,-nothinking 关闭。
3 Pro Preview:thinking_level(LOW/HIGH),或后缀 -thinking-low/-thinking-high(如 gemini-3-pro-preview-thinking-low),默认 HIGH。
3.
搜索如何开启?
推荐 tools 函数 googleSearch(兼容格式);或 extra_body.google.tools 透传原生。
4.
会计费吗?
思考消耗计入输出 token;搜索按渠道策略计费。

最佳实践#

使用流式提升首字时间与交互体验。
结构化/确定性输出时降低 temperature,控制 max_tokens。
工具调用做好超时与重试;搜索结果可做兜底校验。
修改于 2025-12-15 07:42:04
上一页
Grok 模型(xAI)通用对话接口文档
下一页
通用视频生成接口文档
Built with