Como se menciona en la Guía 2.1, un Experimento aleatorio se puede definir como una acción que podemos repetir en iguales condiciones muchas veces y cuyo resultado no conocemos anticipadamente
Un ejemplo de ello es cuando estamos jugando parques y un jugador lanza dos dados, el resultado solo es posible de observar después de haber realizado la acción de lanzarlos.
Al conjunto de todos los posibles valores que puede tomar el experimento aleatorio se le denomina Espacio muestral, que se denota por la letra mayuscula S.
Para este ejemplo :
\[S=\{ 2,3,4,5,6,7,8,9,10,11,12 \}\]
n=20000000
x=sample(1:6,n, replace = TRUE)
td1=prop.table(table(x))
barplot(td1, las=1)
n=20000000
d1=sample(1:6,n, replace = TRUE)
d2=sample(1:6,n, replace = TRUE)
dados=data.frame(d1,d2)
suma=apply(dados, 1, sum)
barplot(table(suma), las=1,cex.axis=0.7)
data.frame(prop.table(table(suma)))
suma Freq
1 2 0.02780310
2 3 0.05550165
3 4 0.08334300
4 5 0.11110030
5 6 0.13892055
6 7 0.16658150
7 8 0.13894795
8 9 0.11108045
9 10 0.08344885
10 11 0.05550840
11 12 0.02776425
Procedimiento alternativo
t=sapply(1:200000, function(x){sum(sample(1:6,2,rep=T))})
barplot(table(t), las=1, cex.axis=0.7)
Simulación de urna con: 3 bolas Blancas, 5 Rojas y 4 Azules
1 representa las bolas blancas 2 representa las bolas rojas 3 representa las bolas azules
sample(c(1,2,3),2,rep=T,prob=c(3,5,4))
[1] 2 2
La misma simulación con palabras
sample(c("Blanca","Roja","Azul"),2,rep=T,prob=c(3,5,4))
[1] "Roja" "Roja"
Las tablas de contingencia o tablas cruzadas se basan en las tablas de frecuencia para dos variables cualitativas o cuantitativas con pocos valores. En ellas se representan probabilidades conjuntas, marginales y condicionales
Inicialmente construimos una tabla con los valores de las frecuencias relativas conjuntas
x=c(20,60,100,30,140,50)
m=matrix(x,ncol=2)
rownames(m)=c("Adminitrativo","Operativo","Vendedor")
colnames(m)=c("Mujer","Hombre")
m
Mujer Hombre
Adminitrativo 20 30
Operativo 60 140
Vendedor 100 50
En este caso se adicionan las frecuencias relativas marginales
addmargins(m)
Mujer Hombre Sum
Adminitrativo 20 30 50
Operativo 60 140 200
Vendedor 100 50 150
Sum 180 220 400
Para convertirlas en probabilidades utilizamos la función prop.table()
prop.table(m)
Mujer Hombre
Adminitrativo 0.05 0.075
Operativo 0.15 0.350
Vendedor 0.25 0.125
Esta funcion tambien se utiliza para calcular las probabilidades condicionales por filas
prop.table(m,1)
Mujer Hombre
Adminitrativo 0.4000000 0.6000000
Operativo 0.3000000 0.7000000
Vendedor 0.6666667 0.3333333
o las probabilidades condicionales por columnas
prop.table(m,2)
Mujer Hombre
Adminitrativo 0.1111111 0.1363636
Operativo 0.3333333 0.6363636
Vendedor 0.5555556 0.2272727
# Colombia= read.csv("data/Colombia.csv")
t21=table(Colombia$ubicacion, Colombia$estado)
(t22=addmargins(t21))
fallecido grave leve moderado Sum
casa 0 0 4803358 0 4803358
fallecido 126299 0 0 0 126299
hospital 0 0 0 7950 7950
hospital uci 0 993 0 0 993
Sum 126299 993 4803358 7950 4938600
La tabla de frecuencias la convertimos en tabla de probabilidades
t23=prop.table(t21)
round(t23, 4)
fallecido grave leve moderado
casa 0.0000 0.0000 0.9726 0.0000
fallecido 0.0256 0.0000 0.0000 0.0000
hospital 0.0000 0.0000 0.0000 0.0016
hospital uci 0.0000 0.0002 0.0000 0.0000