解读视频动作识别模型的预测结果

请求预测后,Vertex AI 会根据您的模型目标返回结果。根据您定义的标签,操作识别模型的预测会返回操作的时刻。模型会为每个预测分配置信度分数,以表明您的模型准确识别出某项操作的置信度。数字越大 - 模型的置信度越高,预测就越准确。

批量预测输出示例

以下示例是识别视频中“滑动”和“跳转”操作的模型的预测结果。每个结果都包含已识别操作的标签(“滑动”或“跳跃”)、一个具有相同开始和结束时间的时间细分(用于指定动作的时刻)以及置信度得分。

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "swing",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "1.2s",
    "confidence": 0.7
  }, {
    "id": "2",
    "displayName": "jump",
    "timeSegmentStart": "3.4s",
    "timeSegmentEnd": "3.4s",
    "confidence": 0.5
  }]
}