Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Lp-norma (LP)
La Lp-norm (LP) misura la distanza p-norm tra le distribuzioni dei facet delle etichette osservate in un set di dati di addestramento. Questa metrica è non negativa e quindi non può rilevare il bias inverso.
La formula per Lp-norm è la seguente:
L p (Pa, Pd) = (y|P - P || pa) d 1/p
Dove la distanza p-norm tra i punti x e y è definita come segue:
L p (x, y) = (|x 1 -y | p + |x -y 1 | p +... +|x 2 -y 2 | p) n n 1/p
2-norm è la norma euclidea. Supponiamo di avere una distribuzione degli esiti con tre categorie, ad esempio yi = {y0, y1, y2} = {accettato, in lista d'attesa, rifiutato} in uno scenario multicategoria di ammissioni all'università. Si calcola la somma dei quadrati delle differenze tra i conteggi degli esiti per i facet a e d. La distanza euclidea risultante viene calcolata come segue:
L 2 (Pa, Pd) = [(n a (0) - n d (0)) 2 + (n (1) - n a (1)) 2 + d (n (2) - n a (2)) 2] d 1/2
Dove:
-
na(i) è il numero dei risultati della nesima categoria nel facet a: ad esempio na(0) è il numero di accettazioni del facet a.
-
nd(i) è il numero dei risultati della nesima categoria nel facet d: ad esempio nd(2) è il numero di rifiuti del facet d.
L'intervallo di valori LP per esiti binari, multicategoria e continui è [0, √2), dove:
-
I valori vicini allo zero indicano che le etichette sono distribuite in modo simile.
-
I valori positivi indicano che le distribuzioni delle etichette divergono, più sono positivi e maggiore è la divergenza.
-