Distribució categòrica

Infotaula distribució de probabilitatDistribució categòrica
Tipusdistribució univariant Modifica el valor a Wikidata
Paràmetres k > 0 {\displaystyle k>0} nombre de categories (enter)
p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} probabilitats d'esdeveniment ( p i 0 , Σ p i = 1 ) {\displaystyle (p_{i}\geq 0,\,\Sigma p_{i}=1)}
Suport x { 1 , , k } {\displaystyle x\in \{1,\dots ,k\}}
fpm(1) p ( x = i ) = p i {\displaystyle p(x=i)=p_{i}}

(2) p ( x ) = p 1 [ x = 1 ] p k [ x = k ] {\displaystyle p(x)=p_{1}^{[x=1]}\cdots p_{k}^{[x=k]}}
(3) p ( x ) = [ x = 1 ] p 1 + + [ x = k ] p k {\displaystyle p(x)=[x=1]\cdot p_{1}\,+\cdots +\,[x=k]\cdot p_{k}}

on [ x = i ] {\displaystyle [x=i]} és el claudàtor Iverson
Moda i  de tal manera que  p i = max ( p 1 , , p k ) {\displaystyle i{\text{ de tal manera que }}p_{i}=\max(p_{1},\ldots ,p_{k})}
Les probabilitats possibles per a la distribució categòrica amb k = 3 {\displaystyle k=3} són el 2-síplex p 1 + p 2 + p 3 = 1 {\displaystyle p_{1}+p_{2}+p_{3}=1} , incrustat en 3 espais.

En teoria i estadística de probabilitats, una distribució categòrica (també anomenada distribució de Bernoulli generalitzada, distribució multinoulli [1]) és una distribució de probabilitat discreta que descriu els possibles resultats d'una variable aleatòria que pot adoptar una de les K categories possibles, amb la probabilitat de cada categoria especificada per separat. No hi ha cap ordre subjacent innat d'aquests resultats, però sovint s'adjunten etiquetes numèriques per a més comoditat a l'hora de descriure la distribució (per exemple, d'1 a K). La distribució categòrica K -dimensional és la distribució més general sobre un esdeveniment K-camins; qualsevol altra distribució discreta sobre un espai mostral de mida K és un cas especial. Els paràmetres que especifiquen les probabilitats de cada possible resultat només estan limitats pel fet que cadascun ha d'estar en el rang de 0 a 1, i tots han de sumar 1.[2][3]

La distribució categòrica és la generalització de la distribució de Bernoulli per a una variable aleatòria categòrica, és a dir, per a una variable discreta amb més de dos possibles resultats, com ara el llançament d'un dau. D'altra banda, la distribució categòrica és un cas especial de la distribució multinomial, ja que dóna les probabilitats de resultats potencials d'un únic dibuix en lloc de múltiples dibuixos.[4]

Formulació de distribucions

Una distribució categòrica és una distribució de probabilitat discreta l'espai mostral de la qual és el conjunt de k elements identificats individualment. És la generalització de la distribució de Bernoulli per a una variable aleatòria categòrica.

En una formulació de la distribució, l'espai mostral es considera una seqüència finita de nombres enters. Els nombres enters exactes utilitzats com a etiquetes no tenen importància; poden ser {0, 1, ..., k − 1} o {1, 2, ..., k } o qualsevol altre conjunt arbitrari de valors. A les descripcions següents, utilitzem {1, 2, ..., k } per comoditat, tot i que això no està d'acord amb la convenció per a la distribució de Bernoulli, que utilitza {0, 1}. En aquest cas, la funció de massa de probabilitat f és:

f ( x = i p ) = p i , {\displaystyle f(x=i\mid {\boldsymbol {p}})=p_{i},}

on p = ( p 1 , , p k ) {\displaystyle {\boldsymbol {p}}=(p_{1},\ldots ,p_{k})} , p i {\displaystyle p_{i}} representa la probabilitat de veure l'element i i i = 1 k p i = 1 {\displaystyle \textstyle {\sum _{i=1}^{k}p_{i}=1}} .

Referències

  1. Murphy, K. P.. Machine learning: a probabilistic perspective (en anglès), 2012, p. 35. ISBN 0262018020. 
  2. Zach. «What is a Categorical Distribution?» (en anglès), 07-01-2021. [Consulta: 8 juliol 2023].
  3. «Categorical Distribution: Definition & Examples» (en anglès). Statistics how to. [Consulta: 8 juliol 2023].
  4. «What is meant by categorical distribution?» (en anglès). Stack exchange. [Consulta: 8 juliol 2023].
  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies