Configura Ray en Vertex AI

Antes de comenzar con Ray en Vertex AI, sigue los pasos para configurar tu proyecto de Google, el SDK de Vertex AI para Python, y la red de intercambio de tráfico de VPC:

  1. Sigue los pasos que se indican en Configura un proyecto y un entorno de desarrollo para configurar la facturación de tu proyecto, habilitar la API de Vertex AI y, luego, instalar gcloud CLI.

  2. Si aún no lo hiciste, habilita la API de Compute Engine y la API de Service Networking:

    Habilita las APIs

  3. Prerrequisito: Debes saber cómo desarrollar programas con Ray de código abierto.

  4. Configura una red de intercambio de tráfico de VPC y una conexión de servicios privadas para acceder a Vertex AI. Para conectarse al nodo principal en el clúster de Ray con el SDK de Vertex AI para Python, el entorno de conexión (por ejemplo, la VM de Compute Engine o el notebook de Vertex AI Workbench) debe estar en el misma red de VPC con intercambio de tráfico que el clúster.

  5. El SDK de Ray en Vertex AI para Python que se usa aquí es una versión del SDK de Vertex AI para Python que incluye la funcionalidad del cliente de Ray, el conector Ray BigQuery y Ray. administración de clústeres en Vertex AI y predicciones en Vertex AI.

    • Si usas Ray en Vertex AI en la consola de Google Cloud, un notebook de Colab Enterprise te guiará a través del proceso de instalación del SDK de Vertex AI para Python después de crear un clúster de Ray.

    • Si usas Ray en Vertex AI en el entorno de Vertex AI Workbench o en otro entorno interactivo de Python, instala el SDK de Vertex AI para Python:

      # The latest image in the Ray cluster includes Ray 2.9
      # The latest supported Python version is Python 3.10.
      $ pip install google-cloud-aiplatform[ray]

      Después de instalar el SDK, reinicia el kernel antes de importar paquetes.

  6. La cantidad total máxima de nodos en el clúster de Ray en Vertex AI que puedes escalar verticalmente (M) depende de la cantidad total inicial de nodos que configuraste (N). Después de crear el clúster de Ray en Vertex AI, puedes escalar la cantidad total de nodos a cualquier cantidad entre P y M inclusive, donde P es la cantidad de grupos en tu clúster.

    Si suponemos que f(x) = min(29, (32 - ceiling(log2(x))), usa las siguientes fórmulas para asegurarte de no exceder la cantidad máxima de nodos (M):

    • f(2 * M) = f(2 * N)
    • f(64 * M) = f(64 * N)
    • f(max(32, 16 + M)) = f(max(32, 16 + N))
  7. Si planeas leer desde BigQuery, debes crear un conjunto de datos nuevo de BigQuery o usar un conjunto de datos existente.

  8. (Opcional) Para mitigar el riesgo de robo de datos de Vertex AI, puedes habilitar los Controles del servicio de VPC. Para obtener más información, consulta Controles del servicio de VPC con Vertex AI.

    Si habilitas los Controles del servicio de VPC, no podrás acceder a los recursos fuera del perímetro, como los archivos en un bucket de Cloud Storage.

Ubicaciones admitidas

En la tabla Disponibilidad de atributos del entrenamiento de modelos personalizados, se enumeran las ubicaciones disponibles para Ray en Vertex AI.

¿Qué sigue?