Repaso de sesión anterior
Datos y variables
Bases: Tendencia central y dispersión
Correlación
... y sobre la estructura del curso
Los datos miden al menos una característica de a los menos una unidad en a lo menos un punto en el tiempo
Característica (variable) : esperanza de vida
Unidad: Años
Punto en el tiempo: 2017
cada fila representa una unidad o caso (ej: un entrevistad_)
cada columna una variable (ej: edad)
cada variable posee valores numéricos
los valores numéricos pueden estar asociados a una etiqueta (ej: 1=Mujer)
Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:
\(Variable \neq Constante\)
Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)
discretas (Rango finito de valores):
continuas:
Tipo | Características | Propiedad de números | Ejemplo |
---|---|---|---|
Nominal | Uso de números en lugar de palabras | Identidad | Nacionalidad |
Ordinal | Números se usan para ordenar series | + ranking | Nivel educacional |
Intervalar | Intervalos iguales entre números | + igualdad | Temperatura |
Razón | Cero real | + aditividad | Distancia |
Nominal: Números empleados como etiquetas (ej. sexo, raza)
Ordinales: Distintas categorías puede sen ordenados en serie. Posición, no distancia. (ej. cargos en una empresa)
Intervalares: Escalas de unidades iguales. Diferencia entre dos número consecuntivos refleja diferencia empírica. (ej. Horas del día)
Razón: caracterizados por la presencia de un cero absoluto. (ej. frecuencias de eventos)
Datos categóricos:
Datos continuos:
Conversión de continuo a categórico: estatura (cm) a categorías bajo – mediano – alto
Categórica | Continua | Categ.(y)/Categ.(x) | Cont.(y)/Categ.(x) | |
---|---|---|---|---|
Ejemplo | Estatus Ocupacional | Ingreso | Estatus Ocupacional (Y) / Género (X) | Ingreso (Y) / Género (X) |
Tabla | Frecuencias / porcentajes | \(\bar{X}\)/sd ... o recodificar en categorías | Tabla de Contingencia | Clasificar Y |
Gráfico | Barras | Histograma / boxplot | Gráfico de barras condicionado | Histograma, box plot condicionado |
Variable dependiente (y) : lo que quiero explicar
Variable independiente (x): lo que me permite explicar la dependiente
Variable independiente x | Variable dependiente Categórica | Variable dependiente Continua |
---|---|---|
Categórica | Análisis de tabla de Contigencia, Chi2 | Análisis de Varianza ANOVA, Prueba T |
Continua | Regresión Logística | Correlación / Regresión Lineal |
Ojo, técnicamente tambien podemos generalizar los modelos de regresión con variables independientes categoricas, pero esto requiere unas consideraciones menores, que veremos más adelante
Moda: valor que ocurre más frecuentemente
Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios
Media o promedio aritmético: suma de los valores dividido por el total de casos
Varía entre -1 y +1
Da cuenta de:
Varía entre -1 y +1
Da cuenta de:
Gráficamente se expresa en nubes de puntos
Datos y variables
Tendencia cental
Dispersión
Introducción correlación
Correlación y regresión simple
Práctica 2: Descripción de variables
Lecturas:
Repaso de sesión anterior
Datos y variables
Bases: Tendencia central y dispersión
Correlación
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
o | Tile View: Overview of Slides |
s | Toggle scribble toolbox |
Esc | Back to slideshow |
Repaso de sesión anterior
Datos y variables
Bases: Tendencia central y dispersión
Correlación
... y sobre la estructura del curso
Los datos miden al menos una característica de a los menos una unidad en a lo menos un punto en el tiempo
Característica (variable) : esperanza de vida
Unidad: Años
Punto en el tiempo: 2017
cada fila representa una unidad o caso (ej: un entrevistad_)
cada columna una variable (ej: edad)
cada variable posee valores numéricos
los valores numéricos pueden estar asociados a una etiqueta (ej: 1=Mujer)
Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:
\(Variable \neq Constante\)
Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)
discretas (Rango finito de valores):
continuas:
Tipo | Características | Propiedad de números | Ejemplo |
---|---|---|---|
Nominal | Uso de números en lugar de palabras | Identidad | Nacionalidad |
Ordinal | Números se usan para ordenar series | + ranking | Nivel educacional |
Intervalar | Intervalos iguales entre números | + igualdad | Temperatura |
Razón | Cero real | + aditividad | Distancia |
Nominal: Números empleados como etiquetas (ej. sexo, raza)
Ordinales: Distintas categorías puede sen ordenados en serie. Posición, no distancia. (ej. cargos en una empresa)
Intervalares: Escalas de unidades iguales. Diferencia entre dos número consecuntivos refleja diferencia empírica. (ej. Horas del día)
Razón: caracterizados por la presencia de un cero absoluto. (ej. frecuencias de eventos)
Datos categóricos:
Datos continuos:
Conversión de continuo a categórico: estatura (cm) a categorías bajo – mediano – alto
Categórica | Continua | Categ.(y)/Categ.(x) | Cont.(y)/Categ.(x) | |
---|---|---|---|---|
Ejemplo | Estatus Ocupacional | Ingreso | Estatus Ocupacional (Y) / Género (X) | Ingreso (Y) / Género (X) |
Tabla | Frecuencias / porcentajes | \(\bar{X}\)/sd ... o recodificar en categorías | Tabla de Contingencia | Clasificar Y |
Gráfico | Barras | Histograma / boxplot | Gráfico de barras condicionado | Histograma, box plot condicionado |
Variable dependiente (y) : lo que quiero explicar
Variable independiente (x): lo que me permite explicar la dependiente
Variable independiente x | Variable dependiente Categórica | Variable dependiente Continua |
---|---|---|
Categórica | Análisis de tabla de Contigencia, Chi2 | Análisis de Varianza ANOVA, Prueba T |
Continua | Regresión Logística | Correlación / Regresión Lineal |
Ojo, técnicamente tambien podemos generalizar los modelos de regresión con variables independientes categoricas, pero esto requiere unas consideraciones menores, que veremos más adelante
Moda: valor que ocurre más frecuentemente
Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios
Media o promedio aritmético: suma de los valores dividido por el total de casos
Varía entre -1 y +1
Da cuenta de:
Varía entre -1 y +1
Da cuenta de:
Gráficamente se expresa en nubes de puntos
Datos y variables
Tendencia cental
Dispersión
Introducción correlación
Correlación y regresión simple
Práctica 2: Descripción de variables
Lecturas: