애플리케이션 배포

Vertex AI에 애플리케이션을 배포하려면 ReasoningEngine의 새 인스턴스를 만들고 애플리케이션 클래스에 매개변수로 전달합니다. 애플리케이션에 대해 패키지 종속 항목을 도입하려면 다음 매개변수를 사용합니다.

  • requirements: 외부 PyPI 패키지 종속 항목 목록입니다. 각 줄은 단일 문자열이어야 합니다. 자세한 내용은 요구사항 파일 형식을 참조하세요.
  • extra_packages: 내부 패키지 종속 항목 목록입니다. 이러한 패키지 종속 항목은 애플리케이션에 필요한 로컬 Python 패키지에 해당하는 로컬 파일 또는 디렉터리입니다.

다음 코드는 애플리케이션을 배포하는 방법을 보여줍니다.

DISPLAY_NAME = "Demo Langchain Application"

remote_app = reasoning_engines.ReasoningEngine.create(
    reasoning_engines.LangchainAgent(
        model=model,
        tools=[get_exchange_rate],
        model_kwargs=model_kwargs,
    ),
    requirements=[
        "google-cloud-aiplatform[reasoningengine,langchain]",
    ],
    display_name=DISPLAY_NAME,
)
remote_app

Reasoning Engine에 애플리케이션을 배포할 때는 기존 객체를 다시 사용하는 대신 새 객체를 전달합니다. 이렇게 하면 .set_up 메서드의 데이터베이스 연결 및 서비스와 같이 초기화 중에 선택할 수 없는 데이터가 포함된 객체가 생성되는 것을 방지할 수 있습니다.

애플리케이션 배포는 실행하는 데 몇 분 정도 걸립니다. 컨테이너를 빌드하고 백엔드에서 HTTP 서버를 사용 중지합니다. 배포 지연 시간은 필요한 패키지를 설치하는 데 걸리는 총 시간에 따라 달라집니다.

배포된 후 remote_app은 Vertex AI에서 실행되는 CLASS_NAME 인스턴스에 해당하며 이를 쿼리 또는 삭제할 수 있습니다. 이는 CLASS_NAME로컬 인스턴스와 별개입니다.

배포된 각 애플리케이션에는 고유한 식별자가 포함됩니다. 다음 명령어를 실행하여 애플리케이션에 대해 resource_name 식별자를 가져옵니다.

remote_app.resource_name

resource_name의 형식은 "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"입니다.

다음 단계