

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Linee di base SHAP per la spiegabilità
<a name="clarify-feature-attribute-shap-baselines"></a>

Le spiegazioni sono in genere contrastive, ovvero tengono conto delle deviazioni da una linea di base. Di conseguenza, per lo stesso modello di previsione, puoi aspettarti di ottenere spiegazioni diverse rispetto a linee di base diverse. Pertanto, la scelta di una linea di base è fondamentale. In un contesto di machine learning, la linea di base corrisponde a un'istanza ipotetica che può essere *non informativa* o *informativa*. Durante il calcolo dei valori di Shapley, SageMaker Clarify genera diverse nuove istanze tra la linea di base e l'istanza data, in cui l'assenza di una feature viene modellata impostando il valore della feature su quello della linea di base e la presenza di una feature viene modellata impostando il valore della feature su quello della determinata istanza. Pertanto, l'assenza di tutte le funzionalità corrisponde alla linea di base e la presenza di tutte le funzionalità corrisponde all'istanza data. 

Come si possono scegliere delle buone linee di base? Spesso è preferibile selezionare una linea di base con un contenuto informativo molto basso. Ad esempio, è possibile costruire un'istanza media dal set di dati di addestramento prendendo la mediana o la media per le caratteristiche numeriche e la modalità per le caratteristiche categoriche. Per quanto riguarda l'esempio delle ammissioni all'università, potrebbe interessarti spiegare perché un determinato candidato è stato accettato rispetto alle accettazioni di base basate su un candidato medio. Se non viene fornita, una linea di base viene calcolata automaticamente da SageMaker Clarify utilizzando metodi K o prototipi K nel set di dati di input.

In alternativa, è possibile scegliere di generare spiegazioni rispetto alle linee di base informative. Per quanto riguarda lo scenario delle ammissioni all'università, potresti voler spiegare perché un determinato candidato è stato respinto rispetto ad altri candidati provenienti da contesti demografici simili. In questo caso, puoi scegliere una linea di base che rappresenti i candidati di interesse, vale a dire quelli con un background demografico simile. Pertanto, è possibile utilizzare linee di base informative per concentrare l'analisi sugli aspetti specifici di un particolare modello di previsione. È possibile isolare le funzionalità per la valutazione impostando gli attributi demografici e altre funzionalità su cui non è possibile agire con lo stesso valore dell'istanza specifica.