Registra automáticamente los datos en una ejecución de experimento

El registro automático es una función en el SDK de Vertex AI que registra de forma automática los parámetros y las métricas de las ejecuciones de entrenamiento de modelos en Vertex AI Experiments. Esto puede ahorrar tiempo y esfuerzo, ya que elimina la necesidad de registrar estos datos de forma manual. Por el momento, el registro automático solo admite el registro de parámetros y métricas.

Registro automático de datos

Existen dos opciones para registrar datos de forma automática en Vertex AI Experiments.

Permite que el SDK de Vertex cree los recursos de ExperimentRun de forma automática.
Especifica el recurso ExperimentRun en el que deseas que se escriban los parámetros y las métricas registrados automáticamente
.

Creados automáticamente

El SDK de Vertex AI para Python controla la creación de recursos ExperimentRun. Los recursos ExperimentRun creados de forma automática tendrán un nombre de ejecución con el siguiente formato: {ml-framework-name}-{timestamp}-{uid}; por ejemplo: “tensorflow-2023-01-04-16-09-20-86a88”.

En el siguiente ejemplo, se usa el método init, de las funciones de paquetes aiplatform.

Python

def autologging_with_auto_run_creation_sample(
    experiment_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    # Your model training code goes here

    aiplatform.autolog(disable=True)

experiment_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
experiment_tensorboard: (Opcional) Proporciona un nombre para tu instancia de Vertex AI TensorBoard.
project: El ID del proyecto. Puedes encontrar estos IDs en la página de bienvenida de la consola de Google Cloud.
location: Consulta Lista de ubicaciones disponibles

Especificado por el usuario

Proporciona tus propios nombres de ExperimentRun, y ten métricas y parámetros de varias ejecuciones de entrenamiento de modelos registradas en la misma ExperimentRun. Cualquier métrica desde el modelo hasta la ejecución actual llama a aiplatform.start_run("your-run-name") hasta que se llama a aiplatform.end_run().

En el siguiente ejemplo, se usa el método init, de las funciones de paquetes aiplatform.

Python

def autologging_with_manual_run_creation_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    aiplatform.start_run(run=run_name)

    # Your model training code goes here

    aiplatform.end_run()

    aiplatform.autolog(disable=True)

experiment_name: Proporciona el nombre del experimento.
run_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
project: El ID del proyecto. Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud.
location: Consulta Lista de ubicaciones disponibles
experiment_tensorboard: (Opcional) Proporciona un nombre para tu instancia de Vertex AI TensorBoard.

El registro automático del SDK de Vertex AI usa el registro automático de MLFlow en su implementación. Las métricas y los parámetros de evaluación de los siguientes frameworks se registran en ExperimentRun cuando el registro automático está habilitado.

Fastai
Gluon
Keras
LightGBM
Pytorch Lightning
Scikit-learn
Spark
Statsmodels
XGBoost

Visualiza métricas y parámetros registrados automáticamente

Usa el SDK de Vertex AI para Python a fin de comparar ejecuciones y obtener datos de ejecuciones. La consola de Google Cloud proporciona una forma fácil de comparar estas ejecuciones.

Muestra de notebook relevante

Registro automático de datos

Entrada de blog

Cómo puedes automatizar el seguimiento de experimentos de AA con el registro automático de Vertex AI Experiments