Conéctate a los modelos de IA generativa de Vertex AI

Vertex AI es una plataforma de aprendizaje automático (AA) que te permite entrenar, ajustar e implementar modelos de AA y aplicaciones de IA. Para agregar capacidades de IA generativa a un servicio existente de Cloud Run, puedes usar Vertex AI para acceder a modelos de IA generativas, como Gemini, PaLM, Imagen, Codey y muchos más.

En esta guía, se explica cómo usar las integraciones de Cloud Run a fin de configurar con rapidez el acceso a Vertex AI para tu servicio de Cloud Run.

Antes de comenzar

  • Asegúrate de que el servicio de Cloud Run con el que te integras ya esté implementado.
  • Revisa la página de precios de Vertex AI. Se te facturan los recursos individuales usados en la integración.

Roles obligatorios

Para usar las integraciones de Cloud Run, tú o tu administrador deben otorgar roles de IAM en dos principales diferentes.

Haz clic para ver los roles necesarios para tu Cuenta de Google

Para obtener los permisos que necesitas para usar las integraciones de Cloud Run, pídele a tu administrador que otorgue a tu Cuenta de Google los siguientes roles de IAM en tu proyecto:

Haz clic para ver los roles necesarios para la cuenta de servicio

Para implementar el servicio de Cloud Run, puedes usar la cuenta de servicio predeterminada de Compute Engine creada automáticamente o especificar una cuenta de servicio administrada por el usuario. Esta cuenta de servicio debe tener los siguientes roles:

Conecta un servicio a Vertex AI

Cuando usas integraciones de Cloud Run para conectarte a Vertex AI, la integración hace lo siguiente:

  • Habilita la API de Vertex AI para que el servicio de Cloud Run acceda a los modelos de IA generativa de Vertex AI.
  • Otorga a la identidad del servicio los roles necesarios.

Puedes crear la integración mediante la consola o la línea de comandos.

Console

  1. En la consola de Google Cloud, ve a la página Cloud Run.

    Ir a Cloud Run

  2. Haz clic en el servicio de la lista de servicios que deseas usar en esta integración.

  3. Haz clic en la pestaña Integraciones.

  4. Haz clic en Agregar integración.

  5. Haz clic en Vertex AI.

  6. Usa el nombre predeterminado o cambia el nombre por el valor que quieres usar.

  7. Si se te solicita que habilites una lista de APIs, haz clic en Habilitar y espera a que las API se habiliten.

  8. Haz clic en Enviar y espera a que se complete la integración. Esto puede tardar hasta un minuto.

Línea de comandos

  1. Actualiza a la versión más reciente de Google Cloud CLI:

    gcloud components update
    
  2. Crea la integración:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \
    

    Reemplaza lo siguiente:

    • SERVICE por el nombre de servicio de Cloud Run

    De manera opcional, puedes incluir la marca --service-account=SERVICE_ACCOUNT_EMAIL.

    • Reemplaza SERVICE_ACCOUNT_EMAIL por la dirección de correo electrónico de la cuenta de servicio administrada por el usuario (PROJECT_NUMBER[email protected]) que se usa para implementar el servicio. Omite esta marca si deseas usar la cuenta de servicio de procesamiento predeterminada (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Para seguir usando la cuenta de servicio especificada cuando implementas integraciones de Cloud Run, ejecuta lo siguiente:

      gcloud config set runapps/deployment-service-account
      
  3. Espera hasta un minuto, durante el cual tu servicio de Cloud Run recibe permisos para llamar a la API de Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.
    

    Puedes verificar el estado con gcloud beta run integrations describe.

Ver integraciones de Vertex AI

Para ver el estado actual de las integraciones de Vertex AI para el servicio de Cloud Run, sigue estos pasos:

Console

  1. En la consola de Google Cloud, ve a la página Cloud Run.

    Ir a Cloud Run

  2. Haz clic en el servicio de la lista de servicios que deseas usar en esta integración.

  3. Haz clic en la pestaña Integraciones.

  4. Ubica la integración de Vertex AI que te interese y haz clic en Ver detalles.

Línea de comandos

  1. Usa el siguiente comando para obtener una lista de las integraciones disponibles:

    gcloud beta run integrations list
  2. Con un nombre de la lista que se muestra, muestra sus detalles:

    gcloud beta run integrations describe INTEGRATION_NAME

    Reemplaza INTEGRATION_NAME por el nombre de tu integración de Vertex AI.

Borra integraciones de Vertex AI

Si borras una integración, también se borrarán todos los recursos de Google Cloud asociados a esa integración, pero no se borrará tu servicio de Cloud Run.

Para borrar una integración de Vertex AI de tu servicio de Cloud Run, sigue estos pasos:

Console

  1. En la consola de Google Cloud, ve a la página Cloud Run.

    Ir a Cloud Run

  2. Haz clic en el servicio del que deseas borrar una integración.

  3. Haz clic en la pestaña Integraciones.

  4. Ubica la integración de Vertex AI que te interese y haz clic en el ícono de puntos suspensivos a la derecha de la integración. Luego, haz clic en Borrar.

Línea de comandos

  1. Usa el siguiente comando para obtener una lista de las integraciones disponibles:

    gcloud beta run integrations list
  2. Con un nombre de la lista que se muestra, borra la integración:

    gcloud beta run integrations delete INTEGRATION_NAME
    

    Reemplaza lo siguiente:

    • INTEGRATION_NAME por el nombre de tu integración de Vertex AI.

    De manera opcional, puedes usar las siguientes opciones de marcas:

    Opción Descripción
    --service-account La dirección de correo electrónico de la cuenta de servicio administrada por el usuario para realizar la operación de eliminación.

Accede a modelos de IA generativa de Vertex AI en tu código

Después de completar la integración, puedes enviar solicitudes a las APIs de modelo de Vertex AI y usar Vertex AI Studio para probar y personalizar con rapidez los modelos de IA generativa en tu aplicación.

Limitaciones

Las integraciones de Cloud Run solo se admiten en ciertas regiones. Si necesitas usar una región que no sea compatible con las integraciones de Cloud Run, consulta Ubicaciones de Vertex AI.