Esecuzione di un flusso di lavoro di mappatura degli ID personalizzato - AWS Entity Resolution

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esecuzione di un flusso di lavoro di mappatura degli ID personalizzato

Quando esegui un flusso di lavoro di mappatura degli ID, puoi specificare una posizione Amazon S3 diversa per i dati di output rispetto a quella originariamente configurata. Puoi anche scegliere come elaborare i tuoi dati selezionando uno dei tre tipi di esecuzione: Batch (elabora tutti i dati), Incrementale (elabora solo dati nuovi o modificati) o Solo Elimina (elabora solo le richieste di eliminazione).

Per eseguire un flusso di lavoro di mappatura degli ID con una nuova destinazione di output
  1. Accedi a AWS Management Console e apri la AWS Entity Resolution console all'indirizzo https://console.aws.amazon.com/entityresolution/.

  2. Nel riquadro di navigazione a sinistra, in Flussi di lavoro, scegli Mappatura degli ID.

  3. Scegli il flusso di lavoro di mappatura degli ID che desideri eseguire.

  4. Nella pagina dei dettagli del flusso di lavoro di mappatura degli ID, scegli Esegui flusso di lavoro, quindi scegli Esegui con una nuova destinazione di output.

  5. Per Destinazione di output dei dati, configura quanto segue.

    1. Per Tipo di esecuzione, selezionate una delle seguenti opzioni.

      • Batch: elabora l'intera tabella di mappatura degli ID.

        Consigliato per la configurazione iniziale, gli aggiornamenti periodici completi o quando si verificano modifiche significative negli spazi dei nomi Source e Target ID.

      • Incrementale: elabora solo i record nuovi, aggiornati o eliminati nello spazio dei nomi Source o Target ID.

        Consigliato per aggiornamenti frequenti, esecuzioni giornaliere o sincronizzazione dei dati in tempo reale.

      • Solo eliminazione: elabora solo i record eliminati dallo spazio dei nomi Target ID.

        Consigliato per sincronizzare rapidamente le rimozioni.

    2. Scegli la posizione Amazon S3 per l'output dei dati.

    3. Per la crittografia, esegui una delle seguenti operazioni:

      • Mantieni le impostazioni di crittografia predefinite

      • Scegli Personalizza le impostazioni di crittografia e inserisci l'ARN della AWS KMS chiave o scegli Crea una AWS KMS chiave.

  6. Per specificare le autorizzazioni di accesso al servizio, scegli un'opzione e intraprendi l'azione consigliata.

    Opzione Azione consigliata
    Crea e utilizza un nuovo ruolo di servizio
    • AWS Entity Resolution crea un ruolo di servizio con la politica richiesta per questa tabella.

    • Il nome del ruolo di servizio predefinito èentityresolution-id-mapping-workflow-<timestamp>.

    • È necessario disporre delle autorizzazioni per creare ruoli e allegare politiche.

    • Se i dati di input sono crittografati, scegli l'opzione Questi dati sono crittografati da una chiave KMS. Quindi, inserisci una AWS KMS chiave che viene utilizzata per decrittografare i dati in ingresso.

    Utilizza un ruolo di servizio esistente
    1. Scegli il nome di un ruolo di servizio esistente dall'elenco a discesa.

      L'elenco dei ruoli viene visualizzato se si dispone delle autorizzazioni per elencare i ruoli.

      Se non disponi delle autorizzazioni per elencare i ruoli, puoi inserire l'Amazon Resource Name (ARN) del ruolo che desideri utilizzare.

      Se non ci sono ruoli di servizio esistenti, l'opzione Usa un ruolo di servizio esistente non è disponibile.

    2. Visualizza il ruolo di servizio scegliendo il link esterno View in IAM.

      Per impostazione predefinita, AWS Entity Resolution non tenta di aggiornare la politica esistente sui ruoli per aggiungere le autorizzazioni necessarie.

  7. Seleziona Esegui.

  8. Nella pagina dei dettagli del flusso di lavoro corrispondente, nella scheda Metriche, visualizza quanto segue in Metriche dell'ultimo lavoro:

    • Il Job ID

    • L'ora di completamento del processo del flusso di lavoro

    • Lo stato del processo del flusso di lavoro corrispondente: In coda, In corso, Completato, Non riuscito

    • Il numero di record elaborati

    • Il numero di record non elaborati

    • Il numero di record di input

    • Il numero di corrispondenze uniche IDs generate.

    • Il numero di nuovi record mappati.

    • Il numero di nuovi record di destinazione mappati.

    • Il numero di nuovi record di origine mappati.

    • Il numero di nuovi record di origine mappati rimossi.

    • Il numero di nuovi record di destinazione mappati rimossi.

    • Il numero di nuovi record mappati rimossi.

    In Cronologia lavori, puoi anche visualizzare le metriche dei lavori del flusso di lavoro di mappatura degli ID eseguiti in precedenza.

  9. Al termine del processo di mappatura degli ID (lo stato è Completato), scegli Data output, quindi scegli la tua posizione Amazon S3 per visualizzare i risultati.

    Dopo aver ottenuto il file CSV, puoi unirti a. RAMPID TRANSCODED_ID