跟踪执行和工件

Vertex AI Experiments 支持跟踪执行和工件。 执行是机器学习工作流中的步骤,包括但不限于数据预处理、训练和模型评估。执行可以使用数据集等工件并生成模型等工件。

创建工件

以下示例使用 Artifact 类的 create 方法。

Python

def create_artifact_sample(
    schema_title: str,
    project: str,
    location: str,
    uri: Optional[str] = None,
    resource_id: Optional[str] = None,
    display_name: Optional[str] = None,
    schema_version: Optional[str] = None,
    description: Optional[str] = None,
    metadata: Optional[Dict] = None,
):
    artifact = aiplatform.Artifact.create(
        schema_title=schema_title,
        uri=uri,
        resource_id=resource_id,
        display_name=display_name,
        schema_version=schema_version,
        description=description,
        metadata=metadata,
        project=project,
        location=location,
    )
    return artifact
  • schema_title:必填。标识资源使用的架构标题。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到这些 ID。
  • location:请参阅可用位置列表
  • uri:可选。工件位置的 URI。
  • resource_id:可选。工件名称的 resource_id 部分,具有格式。这在 metadataStore 中全局唯一:
    projects/123/locations/us-central1/metadataStores/<metadata_store_id>/artifacts/<resource_id>
  • display_name:可选。用户定义的资源名称。
  • schema_version:可选。指定资源使用的版本。如果未设置,则默认为使用最新版本。
  • description:可选。说明要创建的资源的用途。
  • metadata:可选。包含将存储在资源中的元数据信息。

开始执行

以下示例使用 start_execution 方法。

Python

def start_execution_sample(
    schema_title: str,
    display_name: str,
    input_artifacts: List[aiplatform.Artifact],
    output_artifacts: List[aiplatform.Artifact],
    project: str,
    location: str,
    resource_id: Optional[str] = None,
    metadata: Optional[Dict[str, Any]] = None,
    schema_version: Optional[str] = None,
    resume: bool = False,
):
    aiplatform.init(project=project, location=location)

    with aiplatform.start_execution(
        schema_title=schema_title,
        display_name=display_name,
        resource_id=resource_id,
        metadata=metadata,
        schema_version=schema_version,
        resume=resume,
    ) as execution:
        execution.assign_input_artifacts(input_artifacts)
        execution.assign_output_artifacts(output_artifacts)
        return execution

  • schema_title:标识资源使用的架构标题。
  • display_name:用户定义的资源名称。
  • input_artifacts:要作为输入分配的工件。
  • output_artifacts:工件作为此 Execution 的输出。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到这些 ID。
  • location:请参阅可用位置列表
  • resource_id:可选。工件名称的 resource_id 部分,具有格式。这在 metadataStore 中全局唯一: projects/123/locations/us-central1/metadataStores/<metadata_store_id>/artifacts/<resource_id>。
  • schema_version:可选。指定资源使用的版本。如果未设置,则默认为使用最新版本。
  • metadata:可选。包含将存储在资源中的元数据信息。
  • resume:布尔值。

    注意:将可选的 resume 参数指定为 TRUE 时,先前启动的运行会继续。如果未指定,则 resume 默认为 FALSE,并创建一个新的运行。

笔记本示例