Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Interpretabilità globale
La comprensione del modo in cui le caratteristiche contribuiscono all'output complessivo di un modello fornisce informazioni generali utili per la selezione delle funzionalità e lo sviluppo del modello. Per misurare l'effetto dell'aggiunta di una nuova funzionalità, in genere si esegue la convalida incrociata con e senza la funzionalità. Tuttavia, eseguire una convalida incrociata per tutte le combinazioni di funzionalità e tutti i tipi di modello presi in considerazione è spesso impossibile a causa dei costi di calcolo. Altri metodi per determinare l'importanza delle funzionalità sono quindi utili per prendere decisioni rapide. Il nostro consiglio per determinare le attribuzioni globali delle funzionalità è di aggregare i punteggi di attribuzione delle funzionalità locali consigliati nella sezione precedente tra tutti i dati. Consigliamo inoltre di calcolare la modifica del punteggio di convalida incrociata quando una funzionalità viene rimossa, se i vincoli temporali e computazionali lo consentono. L'esempio seguente illustra l'aggregazione dei punteggi di attribuzione locali. Calcola la media delle grandezze dei valori SHAP per il modello di classificazione dell'iride (dalla panoramica) e le traccia come mappa termica. Come si può vedere, le misurazioni del sepalo non giocano un ruolo importante nel modello per determinare la classe dell'iride.
Per l'output di un modello specifico, la raccolta dei valori SHAP tra le istanze di valutazione può essere visualizzata in un grafico Beeswarm, come illustrato nel diagramma seguente (per un sottoinsieme di dati del set di dati iris [4]). Qui puoi vedere che l'petal_widthattributo ha l'effetto maggiore sull'output del modello per la classe e che un valore elevato contribuisce negativamente alla Iris-versicolor previsione della classe. petal_width Quando più di un punto dati ha lo stesso valore di attribuzione della caratteristica o molto simile, i punti vengono sovrapposti per indicare la maggiore prevalenza in quella posizione.