Usa la memorizzazione nella cache di file di Cloud Storage FUSE

La funzionalità Cache file di Cloud Storage FUSE è una cache di lettura basata su client che consente di ripetere letture dei file da uno spazio di archiviazione cache più veloce di tua scelta. Questa pagina descrive come attivare e utilizzare la memorizzazione nella cache di file di Cloud Storage FUSE. Per una panoramica sulla memorizzazione nella cache dei file, delle statistiche o dei tipi di memorizzazione nella cache, consulta Panoramica della memorizzazione nella cache.

Prima di iniziare

La cache dei file richiede un percorso di directory da utilizzare per memorizzare i file nella cache. Puoi creare una nuova directory su un file system esistente o creare un nuovo file system sullo spazio di archiviazione di cui è stato eseguito il provisioning. Se esegui il provisioning di un nuovo spazio di archiviazione da utilizzare, segui le istruzioni riportate di seguito per creare un nuovo file system:

  1. Per formattare un Persistent Disk, consulta le istruzioni di Compute Engine per la formattazione di un disco permanente.

  2. Per creare dischi RAM in memoria, consulta le istruzioni di Compute Engine per montare i dischi RAM.

  3. Per formattare e montare gli SSD locali, consulta le istruzioni di Compute Engine per il montaggio delle unità SSD locali. Per combinare più SSD locali in un singolo volume, consulta le istruzioni di Compute Engine su come aggiungere un SSD locale alla tua VM.

Abilita e configura il comportamento della memorizzazione nella cache

  1. Abilita e configura la memorizzazione nella cache dei file utilizzando il campo file-cache in un file di configurazione di Cloud Storage FUSE e specifica la directory della cache che vuoi utilizzare nel campo cache-dir. La cache dei file è disattivata per impostazione predefinita. Tieni presente che puoi abilitare la memorizzazione nella cache dei file passando una directory al campo cache-dir.

  2. (Facoltativo) Configura la memorizzazione nella cache delle statistiche e la memorizzazione nella cache dei tipi utilizzando il campo metadata-cache in un file di configurazione. Per saperne di più sulle cache di statistiche e tipi, consulta Panoramica della memorizzazione nella cache dei tipi o Panoramica della memorizzazione nella cache delle statistiche.

  3. (Facoltativo) Aumenta il TTL delle voci memorizzate nella cache impostando l'opzione ttl-secs su un valore basato sul tempo previsto tra le letture ripetute, bilanciando le esigenze di coerenza. Ti consigliamo di impostare il valore ttl-secs sul valore massimo consentito dal carico di lavoro. Puoi configurare il TTL in un file di configurazione di Cloud Storage FUSE. Per ulteriori informazioni sull'impostazione di un TTL per le voci memorizzate nella cache, consulta Durata.

    Ad esempio, il seguente file di configurazione consente la memorizzazione nella cache dei file, la memorizzazione delle statistiche e la memorizzazione nella cache dei tipi con un TTL di 3600 secondi e la directory della cache impostata su /path/to/a/directory/. Tieni presente che max-size-mb è impostato su -1, il che configura la cache dei file in modo da utilizzare tutta la capacità disponibile.

    file-cache:
      max-size-mb: -1
      cache-file-for-range-read: false
    
    metadata-cache:
      stat-cache-max-size-mb: 32
      ttl-secs: 3600
      type-cache-max-size-mb: 4
    
    cache-dir: /path/to/a/directory
    
  4. Esegui manualmente il comando ls -R sul bucket montato prima di eseguire il carico di lavoro per precompilare i metadati e assicurarti che la cache dei tipi venga completata prima della prima lettura in un metodo più veloce in batch.

Passaggi successivi