As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Incerteza aleatória
A incerteza aleatória se refere à aleatoriedade inerente aos dados que não pode ser explicada (aleator se refere a alguém que joga dados, em latim). Exemplos de dados com incerteza aleatória incluem dados de telemetria ruidosos e imagens de baixa resolução ou texto de redes sociais. Você pode pressupor que a incerteza aleatória
, a aleatoriedade inerente, seja constante (homocedástica) ou variável (heterocedástica), em função das variáveis explicativas de entrada.
Incerteza aleatória homocedástica
A incerteza aleatória homocedástica, quando
é constante, é o caso mais simples e comumente encontrado na regressão sob a suposição de modelagem de que
, onde
, onde
é a matriz de identidade e
é um escalar constante. É altamente restritivo assumir um risco aleatório constante — presumir que o ruído
sobre uma resposta
é independente da variável
explicativa e constante — e raramente reflete a realidade. Muitos fenômenos na natureza não exibem aleatoriedade constante. Por exemplo, a incerteza sobre os resultados em sistemas físicos, como o movimento de fluidos, geralmente é uma função da energia cinética. Considere o contraste entre o fluxo de água turbulento de uma grande cachoeira e o fluxo de água laminar de uma fonte decorativa. A estocasticidade (aleatoriedade) da trajetória de uma partícula de água é função da energia cinética e, portanto, não é constante. Essa suposição pode levar à perda de informações valiosas ao modelar relações entre alvos e entradas que hospedam ruído variável e não pode ser explicada com as informações observáveis. Como consequência, na maioria dos casos, não é suficiente presumir incerteza homocedástica. A menos que se saiba que o fenômeno é de natureza homocedástica, o ruído inerente deve ser modelado em função das variáveis explicativas
, se possível.
Incerteza aleatória heterocedástica
A incerteza aleatória heterocedástica ocorre quando consideramos a aleatoriedade inerente aos dados como uma função dos próprios dados.
Para calcular esse tipo de incerteza, você calcula a média de um conjunto de amostras da variância preditiva:
com
sendo estimado por um BNN. Aprender a incerteza aleatória durante o treinamento incentiva os BNNs a encapsular a aleatoriedade inerente aos dados que não podem ser explicados. Se não houver aleatoriedade inerente,
deve tender para zero.