Vertex AI 价格

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

本页面介绍了 Vertex AI 上的生成式 AI 的价格。如需了解所有其他 Vertex AI 价格(包括机器学习平台和 MLOps 服务),请参阅 Vertex AI 价格页面

Google 基础模型

多模态

借助 Vertex AI 中的多模态模型,您可以输入文本或媒体(图片、视频)。文本输入按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。系统会按 UTF-8 代码点对字符数进行计数,并排除了空格,因此每个令牌大约有 4 个字符。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。媒体输入按图片数量或秒数(视频)收费。

模型 特征 类型 价格
( =< 128,000 上下文窗口)
价格
(> 128,000 个上下文窗口)
Gemini 1.5 Flash 多模态 图像输入
视频输入
文本输入
音频输入
$0.0001315 / 图片
$0.0001315 / 秒
$0.000125 / 1000 个字符
$0.0000125 / 秒
$0.000263 / 图片
$0.000263 / 秒
$0.00025 / 1,000 个字符
$0.000025 / 秒
文本输出 $0.000375/1000 个字符 $0.00075 / 1,000 个字符
Gemini 1.5 Pro 多模态 图像输入
视频输入
文本输入
音频输入
$0.001315 / 图片
$0.001315 / 秒
$0.00125 / 1,000 个字符
$0.000125 / 秒
$0.00263 / 图片
$0.00263 / 秒
$0.0025 / 1000 个字符
$0.00025 / 秒
文本输出 $0.00375 / 1,000 个字符 $0.0075 / 1,000 个字符
Gemini 1.0 Pro 多模态 图片输入
视频输入
文本输入
$0.0025/图片
$0.002/秒
$0.000125/1000 个字符
文本输出 $0.000375/1000 个字符
使用 Google 搜索建立依据 文本 依据请求 每 1,000 个请求 $35(每天最多 100 万个请求)。
如果您每天需要的请求数超过 100 万,
请与您的客户支持团队联系。

* 所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 如果查询上下文超过 128K,则所有令牌均按长上下文费率计费。
* Gemini 模型采用批处理模式提供 5 折优惠。
* Gemini 1.0 Pro 最多仅支持 32K 上下文窗口。
* PDF 文件按图片输入收费,一个 PDF 页面相当于一张图片

模型 特征 类型 价格
Gemini 1.5 Pro 多模态 图像输入
视频输入
文本输入
音频输入
$0.00265 / 图片
$0.00265 / 秒
$0.0025 / 1000 个字符
$0.00025 / 秒
文本输出 $0.0075 / 1,000 个字符

上下文缓存

借助上下文缓存,您可以将输入文本或媒体的上下文部分缓存到 Gemini 模型,从而降低内容生成的成本和延迟时间。数据在缓存中存储的时长(可以由用户控制)决定了“上下文缓存存储空间”费用。输入数据的缓存命中按优惠费率(即“缓存输入”)收费,而不是正常的输入成本。数据存储和输入数据大小的计算方式与 Gemini 输入价格相同。

模型 特征 类型 价格
( =< 128,000 上下文窗口)
长上下文的价格
(> 128K 上下文窗口)
Gemini 1.5 Pro 缓存的
输入
图像输入
视频输入
文本输入
音频输入
0.0006575 / 图片
0.0006575 / 秒
0.000625 / 1,000 个字符
0.0000625 / 秒
0.001315 / 图片
0.001315 / 秒
0.00125 / 1,000 个字符
0.000125 / 秒
上下文
缓存
存储
图像输入
视频输入
文本输入
音频输入
0.0011835 / 图片 / 小时
0.0011835 / 秒 / 小时
0.001125 / 1,000 个字符 / 小时
0.0001125 / 秒 / 小时

* 所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 如果查询上下文超过 128K,则所有令牌均按长上下文费率计费。
* 模型输出按非缓存费率计费。
* PDF 文件按图片输入收费,一个 PDF 页面相当于一张图片

图片生成

借助 Vertex AI 的图片生成功能,您可以生成新图片并根据您提供的文本提示修改图片,或使用您定义的遮盖区域以及许多其他功能仅修改图片的某些部分。

模型 功能 说明 输入 输出 Price
Imagen 图片生成 生成图片 文本提示 映像 每个图片 $0.020
图片修改 使用无蒙版或蒙版方法修改图片 图片/文字提示 映像 每个图片 $0.020
提升 将生成的图片的分辨率提高到 2K 和 4K 映像 映像 每个映像 $0.003
微调 启用用户提供的“主题”以用于 Imagen 提示(少样本训练) 带有文本标识符的主题,每个主题 4-8 张图片 微调后的模型(使用用户提供的主题进行训练后) 每节点时 $(Vertex AI 自定义训练价格)
视觉标注 为图片生成短文本或长文本字幕 映像 文本字幕 $0.0015/图片
视觉问答 根据引用图片的问题提供回答 图片/文字提示 文本回答 $0.0015/图片

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

Multimodal Embeddings API

模型 功能 说明 输入 输出 价格
多模态嵌入 Embeddings for Multimodal:文本 使用文本作为输入来生成嵌入 文本 Embeddings $0.0002/1,000 个字符输入
Embeddings for Multimodal:图片 使用图片作为输入来生成嵌入 映像 Embeddings $0.0001/图片输入
Embeddings for Multimodal:视频 Video Plus 视频 嵌入(每分钟视频最多 15 项嵌入) 每秒视频 $0.0020
Embeddings for Multimodal:视频 Video Standard 视频 嵌入(每分钟视频最多 8 项嵌入) 每秒视频 $0.0010
Embeddings for Multimodal:视频 Video Essential 视频 嵌入(每分钟视频最多 4 项嵌入) 每秒视频 $0.0005

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

文本生成

Vertex AI 上的生成式 AI 按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格。在预览版阶段,费用享受 100% 的折扣。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。

模型 类型 区域 每 1,000 个字符的价格
PaLM 2 for Text (Text Bison) 输入 Global
  • 在线请求:$0.00025
  • 批量请求:$0.00020
输出 全球
  • 在线请求:$0.0005
  • 批量请求:$0.0004
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
基于人类反馈的强化学习 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
PaLM 2 for Text 32k (Text Bison 32k) 输入 Global
  • 在线请求:$0.00025
  • 批量请求:$0.00020
输出 全球
  • 在线请求:$0.0005
  • 批量请求:$0.0004
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
PaLM 2 for Text
(Text Unicorn)
输入 Global
  • 在线请求:$0.0025
  • 批量请求:$0.0020
输出 全球
  • 在线请求:$0.0075
  • 批量请求:$0.0060
PaLM 2 for Chat (Chat Bison) 输入 Global
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
基于人类反馈的强化学习 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
PaLM 2 for Chat 32k (Chat Bison 32k) 输入 Global
  • 在线请求:$0.00025*
输出 Global
  • 在线请求:$0.0005*
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
Embeddings for Text 输入 Global
  • 在线请求:$0.000025
  • 批量请求:$0.00002
输出 全球
  • 在线请求:免费
  • 批量请求:免费
Codey for Code Generation 输入 Global
  • 在线请求:$0.00025
  • 批量请求:$0.00020
输出 全球
  • 在线请求:$0.0005
  • 批量请求:$0.0004
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
Codey for Code Generation 32k 输入 Global
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
Codey for Code Chat 输入 Global
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
Codey for Code Chat 32k 输入 Global
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005
监督式调优 us-central1
europe-west4
每节点时 $ Vertex AI 自定义训练价格
Codey for Code Completion 输入 Global
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

费用计算示例

如果用户向 PaLM Text Bison 模型发送五个单独的请求,并且每个请求包含 200 个字符的输入和 400 个字符的输出,则总费用的计算方式如下:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

合作伙伴模型

合作伙伴模型是由 Google 合作伙伴开发的一系列精选生成式 AI 模型。合作伙伴模式以代管式 API 的形式提供。如需了解详情,请参阅合作伙伴模式概览。下表列出了 Google 合作伙伴模式的价格详情:

Anthropic 的 Claude 3 模型

模型 价格
克劳德·3·奥普斯 (Claude 3 Opus) 输入:$15 / 100 万个令牌
输出:$75 / 百万令牌
Claude 3 Sonnet 输入:$3 / 00 万个令牌
输出:$15 / 00 万个令牌
Claude 3 Haiku 输入:$0.25 / 100 万个令牌
输出:$1.25 / 100 万个令牌

申请定制报价

Google Cloud 采用随用随付的价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获取为贵组织量身定制的报价。
与销售人员联系