Experimentos aleatorios

Como se menciona en la Guía 2.1, un Experimento aleatorio se puede definir como una acción que podemos repetir en iguales condiciones muchas veces y cuyo resultado no conocemos anticipadamente

Un ejemplo de ello es cuando estamos jugando parques y un jugador lanza dos dados, el resultado solo es posible de observar después de haber realizado la acción de lanzarlos.

Al conjunto de todos los posibles valores que puede tomar el experimento aleatorio se le denomina Espacio muestral, que se denota por la letra mayuscula S.


Para este ejemplo :

\[S=\{ 2,3,4,5,6,7,8,9,10,11,12 \}\]

Lanzamiento de un dados

n=20000000
x=sample(1:6,n, replace = TRUE)
td1=prop.table(table(x))
barplot(td1, las=1)

Lanzamiento de dos dados

n=20000000
d1=sample(1:6,n, replace = TRUE)
d2=sample(1:6,n, replace = TRUE)
dados=data.frame(d1,d2)
suma=apply(dados, 1, sum)
barplot(table(suma), las=1,cex.axis=0.7)

data.frame(prop.table(table(suma)))
   suma       Freq
1     2 0.02780310
2     3 0.05550165
3     4 0.08334300
4     5 0.11110030
5     6 0.13892055
6     7 0.16658150
7     8 0.13894795
8     9 0.11108045
9    10 0.08344885
10   11 0.05550840
11   12 0.02776425

Procedimiento alternativo

t=sapply(1:200000, function(x){sum(sample(1:6,2,rep=T))})
barplot(table(t), las=1, cex.axis=0.7)

Urna

Simulación de urna con: 3 bolas Blancas, 5 Rojas y 4 Azules

1 representa las bolas blancas 2 representa las bolas rojas 3 representa las bolas azules

sample(c(1,2,3),2,rep=T,prob=c(3,5,4))
[1] 2 2

La misma simulación con palabras

sample(c("Blanca","Roja","Azul"),2,rep=T,prob=c(3,5,4))
[1] "Roja" "Roja"

Tablas de contingencia

Las tablas de contingencia o tablas cruzadas se basan en las tablas de frecuencia para dos variables cualitativas o cuantitativas con pocos valores. En ellas se representan probabilidades conjuntas, marginales y condicionales

Inicialmente construimos una tabla con los valores de las frecuencias relativas conjuntas

x=c(20,60,100,30,140,50)
    m=matrix(x,ncol=2)
    rownames(m)=c("Adminitrativo","Operativo","Vendedor")
    colnames(m)=c("Mujer","Hombre")
    m
              Mujer Hombre
Adminitrativo    20     30
Operativo        60    140
Vendedor        100     50

En este caso se adicionan las frecuencias relativas marginales

addmargins(m)
              Mujer Hombre Sum
Adminitrativo    20     30  50
Operativo        60    140 200
Vendedor        100     50 150
Sum             180    220 400

Para convertirlas en probabilidades utilizamos la función prop.table()

prop.table(m)
              Mujer Hombre
Adminitrativo  0.05  0.075
Operativo      0.15  0.350
Vendedor       0.25  0.125

Esta funcion tambien se utiliza para calcular las probabilidades condicionales por filas

prop.table(m,1)
                  Mujer    Hombre
Adminitrativo 0.4000000 0.6000000
Operativo     0.3000000 0.7000000
Vendedor      0.6666667 0.3333333

o las probabilidades condicionales por columnas

prop.table(m,2)
                  Mujer    Hombre
Adminitrativo 0.1111111 0.1363636
Operativo     0.3333333 0.6363636
Vendedor      0.5555556 0.2272727

Ejemplo

Ubicación por estado contagiados de Covid en Colombia

# Colombia= read.csv("data/Colombia.csv")
t21=table(Colombia$ubicacion, Colombia$estado)
(t22=addmargins(t21))
              
               fallecido   grave    leve moderado     Sum
  casa                 0       0 4803358        0 4803358
  fallecido       126299       0       0        0  126299
  hospital             0       0       0     7950    7950
  hospital uci         0     993       0        0     993
  Sum             126299     993 4803358     7950 4938600

La tabla de frecuencias la convertimos en tabla de probabilidades

t23=prop.table(t21)
round(t23, 4)
              
               fallecido  grave   leve moderado
  casa            0.0000 0.0000 0.9726   0.0000
  fallecido       0.0256 0.0000 0.0000   0.0000
  hospital        0.0000 0.0000 0.0000   0.0016
  hospital uci    0.0000 0.0002 0.0000   0.0000