El concepto de probabilidad constituye uno de los pilares de la estadística que permiten la construcción de conceptos posteriores como el de Variable Aleatoria e Inferencia Estadística. Se parte de los conceptos básicos para lo cual se requiere revisar los temas de teoría de conjuntos y técnicas de conteo del Módulo 0 (Unidad 0.2).
En esta unidad se consideran los conceptos básicos de probabilidad, los axiomas que la rigen y los diferentes enfoques para su calculo.
Al finalizar la unidad el estudiante estará en capacidad de DESARROLLAR el pensamiento probabilístico mediante el calculo e interpretación de probabilidades mediante la comprensión de los CONCEPTOS BÁSICOS, los diferentes ENFOQUES y TIPOS de probabilidad que le ayuden a cuantificar el riesgo para la toma de decisiones.
La presente unidad será desarrollada durante la cuarta semana del semestre (18 al 23 de agosto de 2021). Ademas del material suministrado contaran con el acompañamiento del profesor en tres sesiones (Lunes, Miércoles y Viernes) y de manera asincrónica con foro de actividades académicas. Los entregables para esta unidad podrán enviarse a través de la plataforma Brightspace hasta el 23 de agosto.
Para alcanzar los objetivos planteados se propone realizar las siguientes actividades
Actividad | Descripción |
---|---|
Actividad 201 | Taller201. Resuelva las preguntas del siguiente taller y entregue su solución en formato pdf en el enlace correspondiente de Brightspace. |
Fecha | 23 de agosto de 2021 |
Hora | 23:59 hora local |
El taller201 de la unidad 2.1 recoge los elementos estudiados y por tanto tiene objetivo la revisión de los principales conceptos tratados.
Reconocer los principales conceptos de probabilidad y su efecto sobre la toma de decisiones informadas.
Reconocer e identificar los diferentes tipos de probabilidad y sus respectivas interpretación.
Entregable | Descripción |
---|---|
Actividad201 | Actividad201.pdf : Solucionario taller 201 |
Fecha | Martes 23 de agosto de 2021 |
Hora límite | 23:59 hora local |
Tomada : película El dorado
Muchos relacionamos el concepto de probabilidad con los dados, pues forma parte de su origen y de su desarrollo inicial a traves de preguntas y situaciones imaginarias y de alguna forma modelables desde la matematicas. Peor este concepto va mucho mas alla como lo veremos en esta unidad.
La probabilidad es un concepto que se empieza a trabajar en los años cuando , caballero de Mered solicita a b. Pascal le ayude a resolver un problema relacionado con juegos de mesa. En particular este callero manifestaba que las Matemáticas presentaban un vacio, pues sus calculos no coincidian con lo que pasaba en la realidad y como consecuencia de ellos perdia dinero en las apuestas que se presentaban en el juego.
Encomendado Pascal de esta tarea empieza a compartir su trabajo con Fermat, matematico y de la correspondencia de estos dos brillantes matematicos nace los principios y fundamentos de lo que hoy conocemos como probabilidad
Problema:
Los dados, tal y como los conocemos hoy en día, se hicieron muy populares en la edad media. En esta época un caballero llamado Chevalier de Mere propuso el siguiente problema:
Qué es más probable :
Sacar al menos un seis en cuatro tiradas con un solo dado o
Sacar al menos un doble seis en 24 tiradas con dos dados?
El caballero afirmaba que este problema generaba una solución matemática que difería de la observación empírica
Este problema se retoma mas adelante
Iniciaremos con algunos conceptos basicos que nos permiten la contrucion de sus funtamentos.
Experimento aleatorio
Acción que puede ser replicada bajo las mismas condiciones y cuyo resultado no se conoce por anticipado.
\(E_{1}\): Lanzar una moneda dos veces y observar los resultados obtenidos en sus caras superiores
\(E_{2}\): Lanzar dos dados y observar la suma de los resultados superiores
\(E_{3}\): Realizar un examen de estadística y observar el resultado obtenido
\(E_{4}\): En una salida de campo, observo si se cumple o no, totalmente el objetivo planteado
\(E_{5}\): Observo el número total de ensayos de laboratorio exitosos en 20 intentos realizados.
Espacio muestral
Conjunto de todos los posibles valores que puede tomar el experimento aleatorio. Este conjunto se nombra conuna letra mayuscula \(S\) o tambien con \(\Omega\)
\(S_{1}\)= \(\{ (cc), (cs), (sc), (ss) \}\)
\(\begin{equation*} S_{2}=\left\{ \begin{array}{cccccc} &(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)&\\ &(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)&\\ &(3,1),(3,2),(3,3),(3,4),(3,5),(3,6)&\\ &(4,1),(4,2),(4,3),(4,4),(4,5),(4,6)&\\ &(5,1),(5,2),(5,3),(5,4),(5,5),(5,6)&\\ &(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)& \end{array} \right\} \end{equation*}\)
Evento aleatorio
Subconjunto del espacio muestral que es de nuestro interés. Como todo conjunto se nombra con una letra mayúscula por lo general las primeras letras del alfabeto
\(A_{1}\): Obtiener solo caras
\(A_{2}\): Sacar un resultados es inferior a 6
\(A_{3}\): Ganar el examen
\(A_{4}\): Cumplir el objetivo de la salida
\(A_{5}\): Obtener más de 5 ensayos éxitos
Resumiendo:
Experimento aleatorio | Espacio muestral | Evento aleatorio |
---|---|---|
Lanzar una moneda dos veces y observar los resultados obtenidos en sus caras superiores | \(S_{1}\)= \(\{ (cc), (cs), (sc), (ss) \}\) | Obtiener solo caras |
Lanzar dos dados y observar la suma de los resultados superiores | \(S_{2}\)= \(\{(1,1),(1,2), \dots, (6,6) \}\) | Sacar un resultados es inferior a 6 |
Realizar un examen de estadística y observar el resultado obtenido | \(S_{3}\)= \(\{ x \in \mathbb{R} | 0 \leq x \leq 5 \}\) | Ganar el examen |
En una salida de campo, observo si se cumple o no, totalmente el objetivo planteado | \(S_{4}\)= \(\{ x \in \mathbb{N}| 0 \leq x \leq 1 \}\) | Cumplir el objetivo de la salida |
Observo el número total de ensayos de laboratorio exitosos en 20 intentos realizados | \(S_{5}\)= \(\{ x \in \mathbb{N}| 0 \leq x \leq 20 \}\) | Obtener más de 5 ensayos éxitos |
Es el enfoque más antiguo de probabilidad y que está basado en el supuesto de eventos individuales igualmente probables. La probabilidad bajo ese enfoque para el evento \(A\) se calcula como la fracción entre el número de elementos del conjunto \(A\), \(n(A)\) y el número de elementos del espacio muestral \(n(S)\):
\(P(A)=\dfrac{n(A)}{n(S)}\)
En el caso del evento \(A_{1}=\{(c,c)\}\), su probabilidad se obtiene como:
\(P(A_{1}=\dfrac{n(A_{1})}{n(S_{1})}=\dfrac{1}{4}=0.25\)
Para \(A_{2}\), la suma de los resultados es inferior a 6, se obtiene de la siguiente forma
$P(A_{2})===0.25 $
En la gran mayoria de casos no se cumplen los supuestos anteriores, pues se tienen eventos que no son igualmente probables, lo cual impide que podamos utilizar el enfoque frecuentista.
Ahora suponemos que lo ocurrió en el pasado segirá pasando y asi estudiando la información recogida podemos predecir la posibilidad de ocurrencia de un evento futuro
Este enfoque basa su cálculo en la frecuencia con que ocurre un evento en un tamaño de muestra determinado \(n\).
\(\lim_{n \to{+}\infty} P(A)=\Bigg[ \dfrac{\text{número de veces que ocurre A}}{n} \Bigg]\)
Si observamos el cobro de un penalti en un partido de fútbol, el cobrador tiene un gran número de posibilidades (lugares) para colocar el balón que podemos simplificar en 6 : parte baja derecha, parte alta derecha, parte baja al centro, parte alta central, parte baja izquierda y parte alta izquierda. Por su parte el arquero piensa también es estos lograres para evitar que el disparo termine en gol. Hoy en dia ambos jugadores estudian las frecuencias para determinar cual lugar ofrece mayores probabilidades de obtener éxito desde su rol.
Para calcular la probabilidad de que un jugador ejecute y convierta gol, debemos utilizar el enfoque frecuentista, contando para ello información pasada y realizando una división entre el numero de aciertos sobre el numero total de cobros.
Otro ejemplo puede estar relacionado con la probabilidad de muerte por Covid en Colombia. Es de aclarar que esta probabilidad no se mantiene constante a través del tiempo pues los efectos causados por la vacunación y su evolución hacen que esta probabilidad cambie. Por fines prácticos tomaremos la base total de colombianos infectados desde marzo del 2019 como denominador y como numerador el numero total de muertos
Colombia=readRDS("data/Colombia.RDS")
summarytools::freq(Colombia$ubicacion, cumul = FALSE)
Frequencies
Freq % Valid % Total
------------------ --------- --------- ---------
casa 4803358 97.26 96.90
fallecido 126299 2.56 2.55
hospital 7950 0.16 0.16
hospital uci 993 0.02 0.02
<NA> 18677 0.38
Total 4957277 100.00 100.00
Con base en esta tabla podríamos pensar que la probabilidad de que una persona muera a causa del Covid es de 0.02525. Valor que se obtiene al dividir el número de personas fallecidas y el número total de personas que se han contraído covid. Claro bajo el supuesto de que todos las personas tenemos la misma probabilidad de fallecer. Hecho que se discutirá mas adelante.
En este caso la probabilidad es valorada y asignada por un EXPERTO, como un médico, un ingeniero, un abogado, un economista, un estadístico ……
\(A_{1}\) : Sea \(S\) un espacio muestral asociado a un experimento. Entonces \(P(S)=1\)
\(A_{2}\) : Para cualquier evento \(A\), se cumple que \(0 \leq P(A) \leq 1\)
\(A_{3}\) : Si \(A\) y \(B\) son dos eventos mutuamente excluyentes, entonces: \(P(A \cup B) = P(A) + P(B)\) ( En general \(P(A \cup B) = P(A)+ P(B) - P(A \cap B)\) )
\(A_{4}\) : Para cualquier evento \(A\), \(P(\bar{A})=1-P(A)\)
\(A_{5}\) : La probabilidad de \(P(\phi) =0\)
\(P(A)\) : probabilidad de que ocurra A
\(P(A')\) : probabilidad de que NO ocurra A
\(P(B)\) : probabilidad de que ocurra B
\(P(B')\) : probabilidad de que NO ocurra B
\(P(A \cap B)\) : probabilidad de que ocurra A y B
\(P(A' \cap B)\) : probabilidad de que NO ocurra A y ocurra B
\(P(A \cap B')\) : probabilidad de que ocurra A y NO ocurra B
\(P(A' \cap B')\) : probabilidad de que NO ocurra A ni B
\(P(B|A)=\dfrac{P(A \cap B)}{P(A)}\)
\(P(B) = P(A_{1} \cap B) + P(A_{1} \cap B) + \dots +P(A_{m} \cap B)\)
\(P(B) = P(A_{1})\times P(B|A_{1}) + \dots+P(A_{1})\times P(B|A_{m})\)
\(P(B) = \sum\limits_{i=1}^{m} P(A_{i}) \times P(B|A_{i})\)
\(P(A_{i}|B)=\dfrac{P(A_{i}\cap B)}{P(B)}= \dfrac{P(A_{1}) \times P(B|A_{1})}{\sum\limits_{i=1}^{m} P(A_{i}) \times P(B|A_{i})}\)