El concepto de variable aleatoria y sus principales características como es su tipo, su función de probabilidad, función de distribución acumulada, valor esperado y la varianza, permiten la identificación de diferentes modelos para su uso a través funciones matemáticas y su posterior aplicación computacional con el fin de representar situaciones reales en la búsqueda de solución a problemas.
Al finalizar la unidad los estudiantes estarán en capacidad de IDENTIFICAR, CALCULAR y APLICAR los conceptos y las principales características de las VARIABLE ALEATORIA para representar situaciones reales en la búsqueda de soluciones a problemas o valorar los riesgos que se pueden presentar en toma de decisiones
La presente unidad será desarrollada durante la semana séptima del semestre ( 6 al 12 de septiembre de 2021). Ademas del material suministrado contaran con el acompañamiento del profesor en tres sesiones (Lunes, Miércoles y Viernes) y de manera asincrónica con foro de actividades académicas. Los entregables para esta unidad podrán enviarse a través de la plataforma Brightsce hasta el 12 de septiembre.
Para alcanzar los objetivos planteados se propone realizar las siguientes actividades
Actividad | Descripción |
---|---|
Individual | Taller301: El siguiente taller recoge los principales conceptos relacionados con variables aleatorias, tanto discretas como continuas y sus aplicaciones en la estimación de probabilidades |
Reursos | Guía 3.1 |
Capitulo 2 Navidi. Navidi, W. estadística para ingenieros y científicos. Editorial Mc Graw Hill. 2006. | |
Capitulos 3 y 4 Walpole. Walpole, R. Myers, R. Myers, S. Ye, K. Probabilidad y Estadística para ingeniería y Ciencias.8 Ed. Editorial Pearson. 2007 |
Reconoce los diferentes tipos de variables aleatorias y sus principales características
Utiliza las herramientas estadística apropiadas en el calculo de probabilidades en la solución de problemas en contexto
Utiliza herramientas computacionales que le permiten representar y calcular probabilidades en la solución de problemas en contexto
Interpreta y expresa el desarrollo de los problemas con el lenguaje propio de la estadística
Taller 301.pdf | El taller tiene un valor de 30 puntos si es resuelto completamente y enviado dentro de los tiempos establecidos |
Fecha | Domingo 12 de septiembr de 2021 |
Hora límite | 23:59 hora local |
El concepto de variable aleatoria constituye uno de los conceptos principales de la probabilidad y estadística. A este concepto se pueden asociar dos paradigmas de evolución histórica segun J.A. Alberth & B. Ruiz (2013) , El primero basada en el resultado de fenómenos aleatorios y por otro lado el proceso que relaciona los conjuntos de espacio muestral y sus respectivas probabilidades, para definir el concepto de variable aleatória como función de números reales y el espacio para el sustento matemático.
Ahora, se puede relacionar el concepto de variable aleatoria a diferentes contextos donde se requiere dar respuesta a preguntas relacionadas con la ocurrencia o no de fenómenos aleatorios que eventualmente se presentarán en el futuro, como por ejemplo:
¿Cuánto tiempo se tarda un estudiante en ir a la universidad?
¿Cuál será el resultado en mi próximo examen de estadística?
El dueño de la cafetería se puede preguntar ¿Cuantas botellas de agua se venderán esta semana?
¿Cuánto tiempo tardaría la entrega de un paquete una empresa de mensajería?
¿Cuánto tiempo dura la bombilla de un vehículo?
¿Qué diámetro tendrá la perforación de una máquina en una lámina de acero que hace parte de una puerta de un vehículo?
¿ cuanto tiempo tardara la creación de la vacuna para el Covid-19?
En todos los casos se trata de preguntas que tienen diferentes respuestas, o que no tienen un único valor como respuesta. En este documento se estudiará el concepto de variable aleatoria y mediante la definición de una función matemática que nos permita caracterizar su comportamiento, realizaremos diferentes cálculos de probabilidades de interés. Para ello será necesario retomar conocimientos de cálculo integral que serán expuestos en su momento mediante funciones de fácil manejo.
En esta unidad se tratará el caso univariado discreto, luego el caso continuo,con sus principales características, conceptos relacionados con los vistos en el modulo anterior.
Una variable aleatoria \(X\) es una función que asigna a cada valor de un espacio muestral \(S\) un numero . El conjunto formado por estos números conforman un subconjunto de los reales llamado rango de la variable X, (\(R_{_{X}}\))
Las variables aleatorias se clasifican teniendo en cuenta las características de su rango en discretas, continuas. La distribución de una variable aleatoria será univariada si se estudia el comportamiento de una sola variable y serán multivariadas si se considera el comportamiento conjunto de varias variables definidas sobre el mismo espacio muestral.Este ultimo caso sera tratado en la Unidad 3.2
Una variable \(X\) se considera DISCRETA si su rango \(R_{_{X}}\) es un conjunto finito o infinito numerable de valores.
Se considera CONTINUA si su rango \(R_{_{X}}\) es un conjunto de valores infinito no numerable y generalmente corresponde a unión de intervalos.
Un experimento aleatorio \(E\), consiste en lanzar una moneda balanceada al aire tres veces y observar el orden de caras (\(c\)) y sellos (\(s\)) que se obtienen en los tres lanzamientos. El espacio muestral \(S\) de \(E\), estará dado por: |
\[S =\{(s,s,s),(s,s,c),(s,c,s),(s,c,c),(c,s,s),(c,s,c),(c,c,s),(c,c,c)\} \]
Donde :
\(X\) es la variable que asigna a cada resultado el número de caras en los tres lanzamientos de la moneda.
\(R_{_{X}}=\{0,1,2,3\}\) determinado por la regla de asignación: número de caras en los tres lanzamientos de la moneda y corresponde al rango de valores que puede tomar la variable aleatoria.
\(f_{_{X}}(x)=P(X=x)\) conforma la función que asigna a cada valor de la variable una probabilidad
En este ejemplo \((X=0)=\{(s,s,s)\}\) ; \((X=1)=\{(s,s,c),(s,c,s),(c,s,s)\}\) ; $(X=2)={(s,c,c),(c,s,c),(c,c,s) } $ y \((X=3) =\{(c,c,c) \}\). Bajo el supuesto que la moneda es balanceada, se cumple que los resultados en \(S\) son igualmente posibles y por lo tanto:
\[f_{_{X}}(0) =P(X=0)= \frac{1}{8} \hspace{.2cm} ,\hspace{.5cm} f_{_{X}}(1) = P(X=1)=\frac{3}{8},\] \[f_{_{X}}(2) = P(X=2)=\frac{3}{8}\hspace{.2cm} ,\hspace{.5cm} f_{_{X}}(3) =P(X=3)= \frac{1}{8}\]
Como se mencionó anteriormente una variable aleatoria se considera como DIACRETA cuando el conjunto de posibles valores que puede tomar la variables es un conjunto finito o infinito numerable. En la gran mayoria de los casos este conjunto corresponde a los números enteros.
Para catacterizar la variable se define la función de distribución de probabilidad que modela la asignación de las probabilidades
Para \(X\) un variable aleatoria discreta, su función de distribución de probabilidad estará dada por \(f(x)\), la cual proporciona las probabilidades asociadas a todos los valores de su rango \(R_{X}\) . Esta función debe cumplir las siguientes propiedades:
\(f(x) = P(X=x) > 0\)
\(\sum_{R_X} f(x) = 1\)
Por lo general este tipo de variables proceden del conteo. Ejemplos.
Número de llamadas que entran a un conmutador diariamente
Número de personas contagiadas por Covid19 durante un dia
Número de quejas reportadas a una sucursal bancaria en un dia
Número de accidentes producidos en una ciudad
Número de huevos producidos diariamenete en una avicola
Número de hijos en una familia
Número de mensajes enviados en un grupo de Whatsapp
Como complemento de \(f(x)\) y debido a que puede resultar más interesante calcular probabilidades de rangos de valores se define la función de distribución acumulada \(F(x)\)
Sea \(X\) una variable aleatoria continua con función de densidad \(f_{X}(x)\), se define la función de distribución acumulada, \(F_{X}(x)\), como:
\[F(x)=P(X\leq x)=\sum _{t \leq x}f(t)\]
Para la variable definida como \(X\) número de puntos obtenidos al lanzar un dado tenemos que : |
\(x_{i}\) | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
\(f(x)\) | \(\dfrac{1}{6}\) | \(\dfrac{1}{6}\) | \(\dfrac{1}{6}\) | \(\dfrac{1}{6}\) | \(\dfrac{1}{6}\) | \(\dfrac{1}{6}\) |
Esta asignación la podemos resumir en la función:
\(f(x) = \left \{ \begin{matrix} \dfrac{1}{6} & \mbox{si }\mbox{ x=1,2,3,4,5,6} \\ \\ 0 & \mbox{ en cualquier otro caso}\end{matrix}\right.\)
Tambien podemos representar esta función de manera gráfica
x=1:6
fx=rep(1,6)/6
plot(x,fx,pch=19, ylim=c(0,0.18), las=1, xlab="puntos", ylab="f(x)")
lines(x, fx, type="h", col=2)
grid()
Para la construcción de la función de distribución acumulada se acumulan los valores correspondienes a las probabilidades puntuales de manera creciente
x=1:6
fx=rep(1,6)/6
Fx=cumsum(fx)
plot(x,Fx, las=1, ylab="F(x)", xlab="puntos",pch=19, ylim=c(0,1))
lines(x, Fx, type="s", col=2)
grid()
x=1:6
fx=round(rep(1,6)/6,6)
Fx=round(cumsum(fx),4)
data.frame(x,fx,Fx)
x fx Fx
1 1 0.166667 0.1667
2 2 0.166667 0.3333
3 3 0.166667 0.5000
4 4 0.166667 0.6667
5 5 0.166667 0.8333
6 6 0.166667 1.0000
El restaurante “Asados y algo más” solo da servicio mediante reservas. De acuerdo con los registros diarios en los últimos diez años se sabe que el treinta por ciento de las personas que reservan no llegan al restaurante. El restaurante tiene treinta mesas y acepta cuarenta reservas. La función de distribución probabilidad que modela el número de personas que llegan al restaurante es \(f\), dada por: |
\[f_{_{X}}(x) = \left \{ \begin{matrix} \displaystyle\binom{40}{x}(0.7)^{x}(0.3)^{40-x} & \mbox{si } x=0,1,2,\ldots,40\\ & \\ 0 & \mbox{en otro caso } \end{matrix}\right. \]
En este caso se utiliza la función combinatoria vista en la guía 0.2
Para representar la función utilizamos el siguiente código
x=0:40
fx=choose(40,x)*0.70^x*0.30^(40-x)
plot(x,fx, las=1, ylab="f(x)", xlab="número personas que asisten", pch=19)
lines(x, fx, type="h", col=2)
x=0:40
fx=choose(40,x)*0.70^x*0.30^(40-x)
Fx=cumsum(fx)
plot(x,Fx, las=1, ylab="F(x)", xlab="número personas que asisten",pch=19, ylim=c(0,1))
lines(x, Fx, type="s", col=2)
grid()
x=0:40
fx=round(choose(40,x)*0.70^x*0.30^(40-x),6)
Fx=round(cumsum(fx),4)
cat("P(X=0) = ",fx[1], "\n")
P(X=0) = 0
cat("P(X=25) = ", fx[26], "\n")
P(X=25) = 0.077405
cat("P(X<25) = P(X<=24) = ", Fx[25], "\n")
P(X<25) = P(X<=24) = 0.1151
cat("P(X >25) = 1 - P(X<=24) =", 1-Fx[25])
P(X >25) = 1 - P(X<=24) = 0.8849
Como se mencionó se considera una variable como continua cuando el conjunto de valores que puede tomar es un conjunto infinito no numerable, es decir que siempre podrá haber un valor entre dos valores de ella.
Para este caso la probabilidad se puede modelar a través de una función continua, la cual se puede visualizar al construir un gráfico de densidad a partir de una muestra de ellos. A esta función se le llama función de densidad de probabilidad
En este caso las variables por lo general proceden de una medición como por ejemplo:
Tiempo que tarda un estudiante en responder un examen
Peso de un bebe recien nacido
Edad de una persona
Tiempo que tarda un vehículo en requerir una reparación de su motor
Diámetro de un agujero realizado en una lamina de acero
Cantidad de azúcar contenida en un refresco
Proporción de cemento en concreto
La función de densidad de probablidad se define como \(f(x)\), tal que cumpla las siguientes condiciones:
\(f(x) \geq 0\)
\(\displaystyle\int\limits_{-\infty}^{+\infty}f(x)\:dx =1\)
\(P(a < X < b)=\displaystyle\int\limits_{a}^{b}f(x)\:dx\)
Para el caso continuo la función de distribución de probabilidad corresponde a una integral
\(F_{_X}(x)=P(X \leq x)=\displaystyle\int \limits_{-\infty}^{x}f_{_X}(t)\:dt\)
\(F(x) = P(X \leq x) = P(X < x)\)
Con base en información histórica una compañía que fabrica lavadoras determinó que el tiempo \(Y\) (en años) para que el electrodoméstico requiera una reparación mayor se obtiene mediante la siguiente función de densidad de probabilidad: |
\[f_{_{X}}(x) = \left \{ \begin{matrix} \dfrac{1}{4} e^{-y/4} & \mbox{ , } y \geq 0\\ & \\ 0 & \mbox{en otro caso } \end{matrix}\right. \]
Para tener la seguridad que \(f(x)\) puede ser una función de densidad de probabilidad se debe verificar
\(\displaystyle\int\limits_{0}^{+\infty} \dfrac{1}{4} e^{-y/4} \:dx =1\)
fy=function(y){1/4*exp(-y/4)}
integrate(fy, lower=0,upper=Inf)
1 with absolute error < 2.7e-05
Al igual que R se puede utilizar SimboLab (https://es.symbolab.com/),
O tambien utilizando la plataforma Wolfram Alpha (https://www.wolframalpha.com/)
El valor esperado o esperanza matemática y la varianza corresponde a dos los conceptos principales asociados a una variable aleatoria. El concepto de esperanza está relacionado en un principio con los juegos de azar, pues los jugadores querían conocer cual era el valor esperado de ganar cuando jugaban un gran número de veces.
La esperanza matemática de una variable aleatoria X, corresponde a un valor que representa el valor más probable que ocurra o la media población de la variable aleatoria denotada por \(E[x]\) o tambien \(\mu\)
Sea \(X\) una variable aleatoria discreta o continua. La esperanza matemática de \(X\) o valor esperado, \(E(X)\) o bien \(\mu\), se define respectivamente como, \[\begin{eqnarray*} E(X)&=&\displaystyle\sum\limits_{x}^{}x_{i}f(x_{i}) \hspace{1cm} \text{Caso discreto} \\ E(X)&=&\displaystyle\int\limits_{-\infty}^{+\infty}x f(x)dx \hspace{1cm} \text{Caso continuo} \end{eqnarray*}\]
En el caso continuo y similarmente para el caso discreto.
\(E(k) = k\), para todo numero real \(k\).
\(E(kX) = k E(X)\), para todo número real \(k\).
\(E(aX + b) = a E(X) + b\), para todo par de números \(a\) y \(b\)
\(E(aX + bY) = a E (X) + b E(Y)\)
\(E(XY) = E(X)E(Y)\), unicamente en el caso que \(X\) e \(Y\) sean variables aleatorias independientes
Otra caracteristica importante de las variables aleatorias corresponde a la varianza que se denota por \(V[X]\) o \(\sigma^{2}\). Antes de definirma veremos el concepto de momento de una variable aleatoria
Sea \(X\) una variable aleatoria discreta o continua. El momento de orden \(k\) se define como: \[\begin{eqnarray*} E(X^{k})&=&\displaystyle\sum\limits_{x}^{}x_{i}^{k}f(x_{i}) \hspace{1cm} \text{Caso discreto} \\ E(X^{k})&=&\displaystyle\int\limits_{-\infty}^{+\infty}x^{k} f(x)dx \hspace{1cm} \text{Caso continuo} \end{eqnarray*}\]
Con este nuevo elemento se define la varianza de una variable aleatorias como la diferencia entre el segundo momento y el cuadrado del primer momento
\(V[X] = E[X^{2}]-(E[X])^{2} = E[X^{2}]-\mu^{2}\)
El valor esperado y la varianza para el número de personas que asisten al restaurante del ejemplo 3 son : |
x=0:40
fx=round(choose(40,x)*0.70^x*0.30^(40-x),6)
Ex=sum(x*fx)
Ex2=sum(x^2*fx)
cat("E[X] =",Ex, "\n")
E[X] = 27.99995
cat("V[X] = ", Ex2-Ex^2)
V[X] = 8.401435
Este resultado nos indica que en promedio asisten al restaurante 28 personas de las cuarenta reservas aceptadas, con una varianza de 8.4 de la cual podemos obtener la desviación estándar y el coeficiente de variación
Para el ejemplo 4 correspondiente al tiempo que requiere una lavadora requiere una reparación mayor, tenemos: |
fy=function(y){1/4*exp(-y/4)}
fEy=function(y){1/4*exp(-y/4)*y}
fEy2=function(y){1/4*exp(-y/4)*y^2}
Ey=integrate(fEy, lower=0,upper=Inf)
Ey2=integrate(fEy2, lower=0,upper=Inf)
cat("E[X] = ", Ey$value,"\n")
E[X] = 4
cat("V[X] = ", Ey2$value-Ey$value^2)
V[X] = 16
Esto nos indica que el valor esperado correspondiente al tiempo en que una lavadora requiere una reparación mayor es de 4 años. Para la interpretación de la variaza podemos utilizar el concepto de desviación estandar o de coeficiente de variación