L_p-norma (LP)

La L_p-norm (LP) misura la distanza p-norm tra le distribuzioni dei facet delle etichette osservate in un set di dati di addestramento. Questa metrica è non negativa e quindi non può rilevare il bias inverso.

La formula per L_p-norm è la seguente:

^{L _p (P_a, P_d) = (_y|P - P || p_a) _d ^1/p}

Dove la distanza p-norm tra i punti x e y è definita come segue:

^{L _p (x, y) = (|x ₁ -y | p + |x -y ₁ | ^p +... +|x ₂ -y ₂ | ^p) _n _n ^1/p}

2-norm è la norma euclidea. Supponiamo di avere una distribuzione degli esiti con tre categorie, ad esempio y_i = {y₀, y₁, y₂} = {accettato, in lista d'attesa, rifiutato} in uno scenario multicategoria di ammissioni all'università. Si calcola la somma dei quadrati delle differenze tra i conteggi degli esiti per i facet a e d. La distanza euclidea risultante viene calcolata come segue:

^{^{L ₂ (P_a, P_d) = [(n _a ⁽⁰⁾ - n _d ⁽⁰⁾⁾ ² + (n (1) - n _a ⁽¹⁾⁾ ^{2 + _d (n (2}⁾ - n _a ^{(2)) 2] _d ^1/2}}}

Dove:

n_a⁽ⁱ⁾ è il numero dei risultati della nesima categoria nel facet a: ad esempio n_a⁽⁰⁾ è il numero di accettazioni del facet a.
n_d⁽ⁱ⁾ è il numero dei risultati della nesima categoria nel facet d: ad esempio n_d⁽²⁾ è il numero di rifiuti del facet d.

L'intervallo di valori LP per esiti binari, multicategoria e continui è [0, √2), dove:
- I valori vicini allo zero indicano che le etichette sono distribuite in modo simile.
- I valori positivi indicano che le distribuzioni delle etichette divergono, più sono positivi e maggiore è la divergenza.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Jensen-Shannon Divergenza (JS)

Distanza di variazione totale (TVD)

Lp-norma (LP)

L_p-norma (LP)