强曰为道
与天地相似,故不违。知周乎万物,而道济天下,故不过。旁行而不流,乐天知命,故不忧.
文档目录

OpenAI API 接口对接完全教程 / 01 - OpenAI API 概述

第 01 章 · OpenAI API 概述

了解 OpenAI 提供的完整 API 能力、模型体系、定价结构与能力边界,为后续对接打下基础。


1.1 OpenAI API 能力全景

OpenAI 提供的 API 可分为以下几大类:

类别 API 典型用途
文本生成 Chat Completions 对话、写作、摘要、翻译
图像理解 Vision 图片描述、OCR、图表分析
函数调用 Function Calling 结构化输出、工具集成
向量嵌入 Embeddings 语义搜索、RAG、聚类
助手平台 Assistants 多轮对话、文件检索、代码执行
语音转文字 Whisper 音频转录、字幕生成
文字转语音 TTS 语音播报、有声读物
图像生成 DALL-E 创意图片、设计素材
内容审核 Moderation 内容安全、合规检测

1.2 模型体系

1.2.1 GPT 系列模型

模型 Model ID 上下文窗口 特点 定价 (输入/输出)
GPT-4o gpt-4o 128K 多模态旗舰,速度快 $2.50 / $10.00 per 1M tokens
GPT-4o mini gpt-4o-mini 128K 高性价比,日常任务首选 $0.15 / $0.60 per 1M tokens
GPT-4.1 gpt-4.1 1M 超长上下文,编码能力强 $2.00 / $8.00 per 1M tokens
GPT-4.1 mini gpt-4.1-mini 1M GPT-4.1 轻量版 $0.40 / $1.60 per 1M tokens
GPT-4.1 nano gpt-4.1-nano 1M 极速低成本 $0.10 / $0.40 per 1M tokens
o3 o3 200K 推理模型旗舰 $2.00 / $8.00 per 1M tokens
o4-mini o4-mini 200K 高效推理模型 $1.10 / $4.40 per 1M tokens

注意:模型定价会随时间调整,请以 OpenAI 官方定价页 为准。

1.2.2 专用模型

模型 Model ID 用途
DALL-E 3 dall-e-3 图片生成
DALL-E 2 dall-e-2 图片生成/编辑/变体
Whisper whisper-1 语音转文字
TTS tts-1 / tts-1-hd 文字转语音
Text Embedding 3 Large text-embedding-3-large 向量嵌入 (3072维)
Text Embedding 3 Small text-embedding-3-small 向量嵌入 (1536维)
Moderation omni-moderation-latest 内容审核

1.3 如何选择模型

                    需要什么能力?
                         │
         ┌───────────────┼───────────────┐
         │               │               │
      文本生成         图像/音频       向量/搜索
         │               │               │
    ┌────┴────┐     ┌────┴────┐     Embeddings
    │         │     │         │
  日常任务  复杂推理  理解  生成
    │         │     │         │
  4o-mini   o3/   Vision  DALL-E
  4.1-nano  o4-mini Whisper  TTS

选型决策表

需求场景 推荐模型 理由
日常对话/客服 GPT-4o mini 低成本、低延迟
复杂分析/写作 GPT-4o 质量最佳
超长文档处理 GPT-4.1 1M 上下文窗口
数学/编程推理 o3 / o4-mini 深度推理能力
图片理解 GPT-4o (Vision) 多模态原生支持
语音转录 Whisper 多语言、高准确率
语义搜索 text-embedding-3-large 3072维高精度

1.4 API 调用基础

所有 API 共享统一的 REST 风格接口:

Base URL: https://api.openai.com/v1
认证方式: Bearer Token (API Key)
内容格式: application/json

基本请求示例

curl https://api.openai.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "你好,请做个自我介绍"}
    ]
  }'

响应格式

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1717000000,
  "model": "gpt-4o-mini-2024-07-18",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好!我是一个AI助手..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 50,
    "total_tokens": 62
  }
}

1.5 能力边界

擅长的领域

  • ✅ 自然语言理解与生成
  • ✅ 多语言翻译
  • ✅ 代码生成与解释
  • ✅ 数据分析与总结
  • ✅ 创意写作
  • ✅ 图像/音频理解

局限性

  • 知识有时效性:训练数据有截止日期,不了解最新事件
  • 可能产生幻觉:会"编造"看似合理但错误的信息
  • 不擅长精确计算:复杂数学建议使用 Code Interpreter
  • 无持久记忆:每次请求独立,需自行管理上下文
  • 不能访问互联网:无法获取实时数据(除非通过 Function Calling 扩展)

重要约束

约束项 说明
上下文窗口 超出会截断,需控制 token 用量
速率限制 按 Tier 分级,新账户限制较严
内容策略 禁止生成违法/有害内容
并发限制 同时请求数有上限

1.6 定价与成本控制

Token 计算规则

  • 英文:约 1 token ≈ 4 个字符 / 0.75 个单词
  • 中文:约 1 token ≈ 1-2 个汉字
  • 图片:根据分辨率和 detail 参数计算

成本估算示例

假设每天 10,000 次 API 调用,平均每次 1000 input + 500 output tokens:

模型 日成本 月成本
GPT-4o mini $1.50 ~$45
GPT-4o $25.00 ~$750
GPT-4.1 $20.00 ~$600
o4-mini $11.00 ~$330

提示:善用 gpt-4o-minigpt-4.1-nano 处理简单任务,可大幅降低成本。


1.7 速率限制 (Rate Limits)

OpenAI 根据账户 Tier 分级限流:

Tier 等级 RPM (请求/分钟) TPM (tokens/分钟)
Free 免费 3 40,000
Tier 1 $5 充值 500 40,000
Tier 2 $50 充值 5,000 80,000
Tier 3 $100 充值 5,000 160,000
Tier 4 $250 充值 10,000 1,000,000
Tier 5 $1,000 充值 10,000 2,000,000

1.8 业务场景示例

场景一:智能客服系统

  • 模型:GPT-4o mini
  • 日调用量:50,000 次
  • 月成本估算:~$225

场景二:文档智能分析

  • 模型:GPT-4.1(利用 1M 上下文)
  • 单次分析 500 页 PDF
  • 按需调用,成本可控

场景三:内容创作平台

  • 模型:GPT-4o(质量优先)
  • 结合 DALL-E 生成配图
  • 流式输出提升用户体验

1.9 扩展阅读


下一章02 - 环境搭建与配置 — 获取 API Key、安装 SDK、初始化项目。