Interpretabilità globale

La comprensione del modo in cui le caratteristiche contribuiscono all'output complessivo di un modello fornisce informazioni generali utili per la selezione delle funzionalità e lo sviluppo del modello. Per misurare l'effetto dell'aggiunta di una nuova funzionalità, in genere si esegue la convalida incrociata con e senza la funzionalità. Tuttavia, eseguire una convalida incrociata per tutte le combinazioni di funzionalità e tutti i tipi di modello presi in considerazione è spesso impossibile a causa dei costi di calcolo. Altri metodi per determinare l'importanza delle funzionalità sono quindi utili per prendere decisioni rapide. Il nostro consiglio per determinare le attribuzioni globali delle funzionalità è di aggregare i punteggi di attribuzione delle funzionalità locali consigliati nella sezione precedente tra tutti i dati. Consigliamo inoltre di calcolare la modifica del punteggio di convalida incrociata quando una funzionalità viene rimossa, se i vincoli temporali e computazionali lo consentono. L'esempio seguente illustra l'aggregazione dei punteggi di attribuzione locali. Calcola la media delle grandezze dei valori SHAP per il modello di classificazione dell'iride (dalla panoramica) e le traccia come mappa termica. Come si può vedere, le misurazioni del sepalo non giocano un ruolo importante nel modello per determinare la classe dell'iride.

Mappa termica per il modello di classificazione dell'iride con valori SHAP

Per l'output di un modello specifico, la raccolta dei valori SHAP tra le istanze di valutazione può essere visualizzata in un grafico Beeswarm, come illustrato nel diagramma seguente (per un sottoinsieme di dati del set di dati iris [4]). Qui puoi vedere che l'petal_widthattributo ha l'effetto maggiore sull'output del modello per la classe e che un valore elevato contribuisce negativamente alla Iris-versicolor previsione della classe. petal_width Quando più di un punto dati ha lo stesso valore di attribuzione della caratteristica o molto simile, i punti vengono sovrapposti per indicare la maggiore prevalenza in quella posizione.

Visualizzazione del grafico Beeswarm per il modello di classificazione dell'iride con valori SHAP

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Interpretabilità locale

Interpretabilità su AWS