miércoles, 17 de abril de 2019

SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 9

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS 


1. INFERENCIA ESTADÍSTICA 
Se le denomina inferencia estadística al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población. 

imagen extraída de las diapositivas de clase


ESTIMACIÓN:
Proceso de utilizar información de una muestra para extraer conclusiones acerca de toda la población. 

ESTIMACIÓN PUNTUAL
Por ejemplo: si la tensión arterial sistólica de una muestra es de 125 mmHg, una estimación puntual es considerar este valor como una aproximación a la tensión arterial sistólica media poblacional. 

Esto genera mucha incertidumbre y mucha imprecisión. 


ESTIMACIÓN POR INTERVALOS: 
Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95% de confianza. 

Por ejemplo: a partir de los datos de una muestra hemos calculado que hay un 95% de probabilidad de la TAS media de una población esté comprendida entre 120 y 130 mmHg (120 y 130 son los límites de intervalo de confianza). 





CONTRASTE DE HIPÓTESIS:
→ Establecemos a priori una hipótesis acerca del valor del parámetro  
→ Realizamos la recogida de datos  
→ Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos 





2. ERROR ESTÁNDAR
El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población. 


EJEMPLOS:

1.Estamos interesados en conocer el consumo medio de cigarrillos diario entre los alumnos de bachillerato de nuestra localidad. Se seleccionaron una muestra de 100 alumnos y se observó que fumaban una media de 8 cigarrillos al día. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho consumo medio para un nivel d confianza del 95% y del 99%.

1)Mirar si es una media o una proporción:
a) e= s/√n para la media
b) e=√(pq/n) para la proporción

q=1-p                    
el estimador en este caso es la media 8
IC (intervalo de confianza)-> esti ± ze

Resolución:
s^2= 16
n=100

e=√16/√100= 0,4

95% lo usamos para sacar la z = 1,96
99% igual z= 2,58

95% -> 8 ± 0,4 x 1,96 [7,2-8,7]
99% -> 8 ± 0.4 x 2,58 [6,9-9,0]



2.Tomada al azar una muestra de 240 estudiantes de la universidad se encontró que 108 de ellos tenían el B1 de inglés. Halla con un nivel de confianza del 99 y 95% la estimación de la proporción de estudiantes que tienen el B1 en la Universidad.

n=240
B1=108

Resolución:
el estimador en este caso es la proporción que como no nos la da la calculamos:
esti= p(B1)= 108/240=0,45

q(B1)= 1-0,45

e=√pq/240=0,032

IC 95% -> 0,45 +- 0,032x1,96 -> [0,39-0,51]
IC 99% -> +- 0,45 +- 0,0032x2,58 -> [0,36-0,53]

entre el 36 y 53% de los alumnos tiene el B1 y tengo una probabilidad del 99% de no equivocarme







SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 8

TEORÍA DE MUESTRAS 

1. ESTIMACIÓN E INFERENCIA ESTADÍSTICA 
Al conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población le llamamos técnicas de muestreo. 


Siempre que trabajamos con muestras no estudiamos el problema en toda la población sino en una parte de ella → hay que asumir un cierto error.

Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio. Consiste en extraer una muestra de una población, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionadas.

En los muestreos no probabilísticos (no usan el azar) no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable, pero es evaluable. Se caracteriza porque el investigador selecciona la muestra siguiendo unos criterios identificados para los fines del estudio que realiza.




2. PROCEDIMIENTO ESTADÍSTICO
Quiero medir un parámetro en la población, no puedo medirlo en todos los sujetos, así que realizo una preselección aleatoria y a través de esta muestra obtengo el estimador que me permite realizar la inferencia.

Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.



3. TIPOS DE MUESTREO





EJEMPLOS:

1. Se desea hacer una estimación sobre la edad media de una determinada población de 2600 habitantes. Calcula el tamaño de la muestra necesario para poder realizar dicha estimación con un error menor de medio año (0,5) a un nivel de confianza del 99%. Se conoce de estudios previos que la edad media de dicha población tiene una desviación típica igual a 3.





2. A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes en una zona básica de salud de 15000 habitantes asumiendo que esta prevalencia en otros estudios se ha aproximado al 5% y que deseamos una confianza del 95% y un error máximo aceptado en la proporción del 3%.










martes, 16 de abril de 2019

SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 7

TEORÍA DE LA PROBABILIDAD


1. PROBABILIDAD
Es muy frecuente para comunicarnos y entendernos. Si no existe la certeza de que los hechos ocurran, existe una esperanza dimensionada y razonable de que el hecho se vea confirmado.

imagen extraída de las diapositivas de clase




A continuación explicaremos los tipos de enfoques de la probabilidad:



→ PROBABILIDAD SUBJETIVA O PERSONALÍSTICA:
La probabilidad mide la confianza que el individuo tiene sobre la certeza de una proposición determinada.

Por ejemplo: los epidemiólogos se basan en la experiencia para afirmar que el próximo invierno, la epidemia de gripe tendrá una probabilidad del 0,0016.


→ PROBABILIDAD OBJETIVA
Desarrollada para resolver problemas relacionados con los juegos de azar (dados, monedas, ruletas...) Las probabilidades se calculan con un razonamiento abstracto.
Por ejemplo: no hay que lanzar el dado para saber que la probabilidad “a priori” de que salga el 6 es de 1/6=0,16.


Esta puede ser:
 Probabilidad clásica o "a priori":
Si un evento puede ocurrir de N formas, las cuales se excluyen mutuamente y son igualmente probables, y si M de esos eventos poseen una característica E, la probabilidad de ocurrencia de E es igual a M/N
P(E) = 𝑀/𝑁

Por ejemplo: La probabilidad “a priori” de que salga un As en una baraja de póker (52 cartas) será:
P= 4/52= 0,77



LEY DE LOS GRANDES NÚMEROS: Inicialmente esa probabilidad real puede no cumplirse pero
si repetimos muchas veces el experimento, la frecuencia relativa de un suceso A, cualquiera, tiende a estabilizarse en torno al valor “a priori”.



→ Probabilidad relativa o "a posteriori":
Si un suceso es repetido un GRAN número de veces, y si algún evento resultante, con la característica E, ocurre m veces, la frecuencia relativa de la ocurrencia E, m/n, es aproximadamente igual a
la probabilidad de ocurrencia de E
P(E) = m/n

Dicho de otra forma, si el número de determinaciones (repeticiones de un experimento aleatorio) es grande, podemos esperar que la probabilidad observada se acerque a la probabilidad teórica.



En resumen de ambas:






PROPIEDADES DE LAS PROBABILIDADES:
















EJEMPLOS:

1. Un 15% de los pacientes atendidos en la Consulta de Enfermería del Centro de Salud de el Cachorro padecen hipertensión arterial (A) y el 25% hiperlipemia (B). El 5% son hipertensos e
hiperlipémicos
• Cual es la P de A, de B y de la unión.
• Representa la situación en un diagrama de Venn: 0,65; 0,10;
0.05; 0,20
• Calcula la probabilidad de que una persona al azar no padezca
ni A ni B


2. Se han utilizado dos tratamientos en un experimento. Se aplican a 400
enfermos. Curan: 200
• La probabilidad de curar es P(C)=200/400=0,5
• ¿y la de no curar? P(NC)=200/400=0,5



Resolución:













¿Cuál es la probabilidad de infección o no infección habiendo estado en tratamiento A o B? Se resuelve mediante la probabilidad condicionada. Otro ejemplo de tabla:























2. TIPIFICACIÓN DE LOS VALORES Y SU RELACIÓN CON LA CAMPANA DE GAUSS


Trabajamos con una variables continuas.

La media coincide con lo más alto de la campana: 8
El 50% tiene puntuaciones>8
El 50% tiene puntuaciones<8





EJEMPLO:
1. Supongamos que la altura de adolescentes en Andalucía a los 10 años sigue una distribución normal, siendo la media 140 cm y la desviación típica 5 cm.

1.1 ¿Qué porcentaje de niños tienen una talla menor de 150 cm?












2.1 ¿Qué porcentaje de niños tienen una talla por encima de 150cm?













3.1¿Cuál es el porcentaje de niños con una talla comprendida entre
137,25 y 145,50 cm?


















Imágenes extraídas de las diapositivas de clase

SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 6

REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN


1. REPRESENTACIONES GRÁFICAS 
⇾ Son una forma rápida de comunicar información numérica (frecuencias).
⇾ Son la imagen de las ideas que queremos transmitir (barras, histogramas, sectores…). 
⇾ Complementan el análisis estadístico, aumentando la información y ofreciendo orientación visual


2. REPRESENTACIONES GRÁFICAS MÁS EMPLEADAS (EJEMPLOS)


VARIABLES CUALITATIVAS:


Resultado de imagen de grafico de sectores
Gráfico de sectores


Resultado de imagen de Gráfico de barras:
Gráfico de barras











Pictograma



Histograma
VARIABLES CUANTITATIVAS:

Resultado de imagen de Gráfico de barras:
Gráfico de barras
















Resultado de imagen de Polígonos de frecuencia
Polígono de frecuencia
Gráfico de tallos y hojas



















DATOS BIDIMENSIONALES Y MULTIDIMENSIONALES:


Resultado de imagen de Tendencias temporales
Tendencias temporales



Resultado de imagen de diagrama de estrella
Diagrama de estrella
Resultado de imagen de Nubes de punto estadistica
Nube de puntos















miércoles, 3 de abril de 2019

SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 5

 ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS. 

1.  MEDIDAS DE TENDENCIA CENTRAL 
Muestran valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse.
- Media aritmética o media (x): Centro geométrico o de gravedad de nuestros datos. (Para variables cuantitativas).


           Cuando los datos son agrupados: 






- Mediana:  Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor. Sólo tiene en cuenta la posición de los valores en la muestra y por tanto tiene mucho mejor comportamiento que la media cuando hay observaciones extremas. (Para variables cuantitativas).

          ⇨ Si el número de observaciones es impar: valor = (n/2) +1. POSICIÓN


          Si es par:  valor = media entre la observación n/2 y la observación (n/2) +1. POSICIÓN



- Moda: Valor que más veces se repite. (Para variables cuantitativas y cualitativas).

          ⇨ Si hay dos modas: bimodal.
          
          ⇨ Si hay más de dos: multimodal.



2.  MEDIDAS DE POSICIÓN

Cuantiles: es la medida más general. (Para variables continuas). Sólo tiene en cuenta la posición de los valores en la muestra. Se clasifican en: cuartiles, deciles y percentiles.


Os adjunto un vídeo que lo explica bastante claro y esquemático:







3. MEDIDAS DE DISPERSIÓN

⇨ Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra: |xn-x1|
 

⇨ Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra:

   


⇨ Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media:

   



Varianza: expresa la misma información en valores cuadráticos:



 Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil: |Q3-Q1|




 Coeficiente de variación:  
c.v.=s/x




Para entender mejor esta parte realizaremos un ejemplo práctico:





4. DISTRIBUCIONES NORMALES

- En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.

- La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores de posición central (media, mediana y moda, que coinciden en estas distribuciones).

- Esta curva se conoce como la campana de Gauss.





5. ASIMETRÍA Y CURTOSIS

Os adjunto un vídeo que lo explica fenomenal!!!




lunes, 1 de abril de 2019

SESIÓN TEÓRICA ESTADÍSTICA Y TIC: TEMA 4

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA 



1. ESTADÍSTICA DESCRIPTIVA

1.1.VARIABLES. TABLAS DE FRECUENCIA
  • Contiene datos que muestran frecuencias en columnas y las categorías de las variables en las filas.
  • Indican frecuencias absolutas (fi) (número absoluto) y relativas (hi) (proporción).
            hi=fi/n (x100)



Existen tipos de tablas de frecuencias tanto cualitativas (nominales y ordinales) como cuantitativas (discretas y continuas). A continuación os pongo un ejemplo de cada una:


EJEMPLO TABLA DE FRECUENCIA CUALITATIVA POLICOTÓMICA: 
Personal sanitario del hospital “Virgen de la cueva”. Año 2017. 

imagen extraída de las diapositivas de clase



EJEMPLO TABLA DE FRECUENCIA VARIABLE CUANTITATIVA CONTINUA: 
imagen extraída de las diapositivas de clase

⇨ Frecuencias absolutas: número de individuos que presentan una modalidad, o que están incluidos en un intervalo. 

⇨ Frecuencias relativas: proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo. 

⇨ Frecuencias acumuladas: número de individuos menores o iguales que la modalidad o el intervalo que estamos estudiando. Las acumuladas son el "sumatorio de las frecuencias".



¿Cómo se hace?
- Primero defino los intervalos. 
- Defino los extremos de los intervalos.
- Defino la amplitud o distancia entre los extremos.
- Calculo la marca de clase de cada intervalo. La marca de clase (Mc) es la media entre los dos extremos de los intervalos.



⇢ Primero calculamos el recorrido así:  Re= xn-x1 

⇢ Cuando nos dicen el nº de intervalos no habría que hacer nada, pero si no nos dan ese dato, se obtiene así:  nºintervalos=n (siendo "n" el numero total de encuestados).



⇢ Entonces teniendo el recorrido y el nºintervalos, ya podríamos calcular la amplitud con esta fórmula:  Amplitud = Re/nºintervalos



EJEMPLO:









1.2. INDICADORES





               Prevalencia        




  ⟵         Incidencias
                   ⤸
                   
En el denominador sumamos todos los tiempos en los que ha participado cada persona
























1.3. MEDIDAS DE ASOCIACIÓN

Os adjunto unos esquemas de clase que lo explican súper bien!!!
Dependiendo del estudio se realizarán unas u otras:


imagen extraída de las diapositivas de clase


ESTUDIOS DESCRIPTIVOS: RAZÓN DE PREVALENCIA














imagen extraída de las diapositivas de clase


ESTUDIOS DE SEGUIMIENTO Y EXPERIMENTALES: RAZÓN DE INCIDENCIAS, RAZÓN RIESGOS O RIESGO RELATIVO
⟵                                              




imagen extraída de las diapositivas de clase




ESTUDIOS DE CASOS Y CONTROLES: ODDS RATIO O RAZÓN DE VENTAJAS   










Os adjunto unos problemas como ejemplo que realizamos en clase:

EJERCICIO 1º: En un centro de salud se realiza un estudio entre la población escolar para conocer si un programa de educación sobre hábitos alimenticios saludables logran que los niños tomen desayunos saludables. Se sometieron 258 escolares al programa educativo para medir en los meses siguientes mediante un cuestionario si seguían o no el desayuno y a otros 288 escolares que no participaron en el programa también se les midió el seguimiento de los desayunos. En el primer grupo se halló que 156 escolares seguían el desayuno mientras que en el segundo grupo se encontraron 87 escolares que seguían el desayuno. Calcular la magnitud de asociación.




EJERCICIO 2º: En un centro de salud se pretende realizar un estudio sobre la influencia del tabaquismo en el EPOC. Para ello, a partir de un grupo de 337 pacientes EPOC que acuden a consulta de enfermería del centro se selecciona un grupo de otros 437 pacientes de características similares pero que no presentaban EPOC. Tras recoger los datos sobre antecedentes de tabaquismo se comprueba que en el primer grupo había 215 pacientes con antecendentes de tabaquismo, mientras que en el segundo grupo se detectaron 184 con antecedentes. Calcular la medida de magnitud de asociación.








REFLEXIÓN Y CONCLUSIÓN FINAL

Para concluir y a modo de reflexión final, me gustaría dejar constancia de lo importante e imprescindible que ha sido para mí la estadístic...