+ - 0:00:00
Notes for current slide
Notes for next slide

Contenidos

  1. Repaso de sesión anterior

  2. Datos y variables

  3. Bases: Tendencia central y dispersión

  4. Correlación

2 / 41

1. Repaso sesión anterior

3 / 41

Estadística multivariada

  • Hacia la explicación de los fenómenos sociales

4 / 41

Estadística multivariada

  • Hechos sociales: multicausales

5 / 41

Estadística multivariada

  • Intentando dar cuenta de la complejidad: modelos matemáticos
6 / 41

Estadística multivariada

  • Intentando dar cuenta de la complejidad: modelos matemáticos

  • A partir de un modelo matemático denominado regresión, este curso busca entregar herramientas de análisis de datos que permitan aproximarse a la explicación de fenómenos sociales multicausales.
6 / 41

Más sobre explicación en:

- Lizon (2006) Estadística y causalidad en sociología

7 / 41

... y sobre la estructura del curso

8 / 41

9 / 41

10 / 41

2. Bases

Datos y variables

Tendencia central y variabilidad

Correlación

11 / 41

2. Bases

Datos y variables

Tendencia central y variabilidad

Correlación

12 / 41

Datos

  • Los datos miden al menos una característica de a los menos una unidad en a lo menos un punto en el tiempo
13 / 41

Datos

  • Los datos miden al menos una característica de a los menos una unidad en a lo menos un punto en el tiempo

    • Ejemplo: La esperanza de vida en Chile el 2017 fue de 79,9 años
    • Característica (variable) : esperanza de vida

    • Unidad: Años

    • Punto en el tiempo: 2017

13 / 41

Base de Datos

  • Forma "rectangular" de almacenamiento de datos:

14 / 41

Base de Datos

  • cada fila representa una unidad o caso (ej: un entrevistad_)

  • cada columna una variable (ej: edad)

  • cada variable posee valores numéricos

  • los valores numéricos pueden estar asociados a una etiqueta (ej: 1=Mujer)

15 / 41

Ejemplos de estudios / bases de datos

  1. Encuesta Centro de Estudios Públicos

  2. Encuesta CASEN

  3. Encuesta Lapop

  4. ELSOC

16 / 41

Variables

  • Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:

  • \(Variable \neq Constante\)

  • Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)

17 / 41

Variables

  • discretas (Rango finito de valores):

    • Dicotómicas
    • Politómicas
  • continuas:

    • Rango (teóricamente) infinito de valores.
18 / 41

Escalas de medición de variables

  • NOIR: Nominal, Ordinal, Intervalar, Razón
Tipo Características Propiedad de números Ejemplo
Nominal Uso de números en lugar de palabras Identidad Nacionalidad
Ordinal Números se usan para ordenar series + ranking Nivel educacional
Intervalar Intervalos iguales entre números + igualdad Temperatura
Razón Cero real + aditividad Distancia
19 / 41
  • Nominal: Números empleados como etiquetas (ej. sexo, raza)

    • Ordinales: Distintas categorías puede sen ordenados en serie. Posición, no distancia. (ej. cargos en una empresa)

    • Intervalares: Escalas de unidades iguales. Diferencia entre dos número consecuntivos refleja diferencia empírica. (ej. Horas del día)

    • Razón: caracterizados por la presencia de un cero absoluto. (ej. frecuencias de eventos)

Tipos de datos en relación a escalas de medición.

  • Datos categóricos:

    • pueden ser medidos sólo mediante escalas nominales, u ordinales en caso de orden de rango
  • Datos continuos:

    • Medidos en escalas intervalares o de razón
    • Pueden ser transformados a datos categóricos
20 / 41

Conversión de continuo a categórico: estatura (cm) a categorías bajo – mediano – alto

Descriptivos según tipo de variable


Categórica Continua Categ.(y)/Categ.(x) Cont.(y)/Categ.(x)
Ejemplo Estatus Ocupacional Ingreso Estatus Ocupacional (Y) / Género (X) Ingreso (Y) / Género (X)
Tabla Frecuencias / porcentajes \(\bar{X}\)/sd ... o recodificar en categorías Tabla de Contingencia Clasificar Y
Gráfico Barras Histograma / boxplot Gráfico de barras condicionado Histograma, box plot condicionado
21 / 41

Tipos de análisis estadístico bivariado

  • Variable dependiente (y) : lo que quiero explicar

  • Variable independiente (x): lo que me permite explicar la dependiente

Variable independiente x Variable dependiente Categórica Variable dependiente Continua
Categórica Análisis de tabla de Contigencia, Chi2 Análisis de Varianza ANOVA, Prueba T
Continua Regresión Logística Correlación / Regresión Lineal
22 / 41

Ojo, técnicamente tambien podemos generalizar los modelos de regresión con variables independientes categoricas, pero esto requiere unas consideraciones menores, que veremos más adelante

2. Bases

Datos y variables

Tendencia central y variabilidad

Correlación

23 / 41

Tendencia Central

  • Moda: valor que ocurre más frecuentemente

  • Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios

  • Media o promedio aritmético: suma de los valores dividido por el total de casos

24 / 41

Dispersión:

Varianza

25 / 41

Dispersión:

Varianza

26 / 41

Dispersión:

Varianza

27 / 41

Dispersión:

28 / 41

La VARIANZA equivale al promedio de la suma de las diferencias del promedio al cuadrado

29 / 41

Desviación Estándar

  • Raiz Cuadrada de la varianza.
  • Expresada en la mismas unidades que los puntajes de la escala original
30 / 41

Más sobre datos, variables y varianza en:

- Moore: 1.Comprensión de los datos (1-54)

31 / 41

2. Bases

Datos y variables

Tendencia central y variabilidad

Correlación

32 / 41

Respuesta correcta:

ENTRE -1 y +1

34 / 41


¿Cómo puedo saber si una variable se encuentra asociada a otra variable?

35 / 41


¿Cómo puedo saber si una variable se encuentra asociada a otra variable?

Si ambas varían de manera similar (covarían)

35 / 41

Correlación

  • Medida de co-variación lineal estandarizada
36 / 41

Correlación

  • Medida de co-variación lineal estandarizada
  • Varía entre -1 y +1
36 / 41

Correlación

  • Medida de co-variación lineal estandarizada
  • Varía entre -1 y +1

  • Da cuenta de:

    • Intesidad: mientras más cercana a |1|, más intensa
    • Sentido: positiva o negativa
36 / 41

Correlación

  • Medida de co-variación lineal estandarizada
  • Varía entre -1 y +1

  • Da cuenta de:

    • Intesidad: mientras más cercana a |1|, más intensa
    • Sentido: positiva o negativa
  • Gráficamente se expresa en nubes de puntos

36 / 41

37 / 41

Adivina la correlación - http://guessthecorrelation.com/

38 / 41

RESUMEN

  • Datos y variables

  • Tendencia cental

  • Dispersión

  • Introducción correlación

39 / 41

Próxima sesión (ver ajuste en programación):

40 / 41

Contenidos

  1. Repaso de sesión anterior

  2. Datos y variables

  3. Bases: Tendencia central y dispersión

  4. Correlación

2 / 41
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
oTile View: Overview of Slides
sToggle scribble toolbox
Esc Back to slideshow