El curso tendrá tres instancias de evaluación:
La nota ponderada de los trabajos equivaldrá al 60% de la nota del curso y el examen final al 40% restante.
Este trabajo abarca la primera parte del curso hasta regresión simple (Sesión 4: Regresión simple 2). Es un informe breve, consistente en preparación y análisis de datos incluyendo como producto final la estimación e interpretación de una regresión simple. Para ello, los pasos son los siguientes:
El informe tiene las siguientes secciones:
Identificación: Tema y nombre de estudiante
Resumen (200 palabras) (0.5p)
Antecedentes de la relación estudiada (300 palabras) (0.5p)
Metodología (1p)
4.1- Datos (descripción)
4.2- Variables (descripción y tabla con estadísticos descriptivos)
Análisis (2p)
5.1 Análisis descriptivo
5.2 Modelo de regresión
Bibliografía
Anexos: código de preparación de datos y código de análisis (2p)
Fecha de entrega: ver Planificación.
Ejemplo para Informe 1 aquí
Aplicar los contenidos del curso a una temática de interés en formato de artículo de investigación breve.
De modo de lograr una mayor colaboración desde el equipo docente a sus trabajos, sugerimos desarrollar los siguientes temas:
Recomendamos utilizar alguna de las siguientes fuentes de datos para realizar los trabajos (para abrir bases de datos en formatos distintos a R revisar nota correspondiente en práctica 1, link aquí):
Este trabajo posee dos entregas, tal como se señala en el programa del curso
Informe 2 (avance): Su formato es de un borrador de la entrega final. La idea es avanzar en todas las secciones, incluyendo la temática general a abordar así como también datos y variables en la sección de métodos, y análisis descriptivos. El énfasis en esta primera entrega se encuentra en el planteamiento de las hipótesis y el modelo de regresión asociado. Incluye estimar el modelo de regresión múltiple y su interpretación (total máximo 2000 palabras)
Informe 3 (final): Su formato es de artículo/ reporte breve de investigación. En esta entrega se corrigen aspectos del Informe 2, junto con profundizar en el chequeo de supuestos, casos influyentes, interacciones. Aquellos grupos que trabajen con una variable dependiente continua deberán realizar además al menos una estimación de regresión logística (y su correspondiente interpretación) con la variable dependiente dicotomizada (total máximo 3.500 palabras).
Actualización Informe 3
Lo central en este informe es incorporar las correcciones al informe 2
La estimación de regresión logística es opcional (excepto para quienes tengan una variable dependiente dicotómica o que haya sido sugerido dicotomizarla por temas de distribución)
No se incluye en la evaluación de este informe el chequeo de supuestos del modelo de regresión. De todas maneras en la página quedará un tutorial disponible sobre este tema.
Título: Breve, lo principal es hacer alusión al objeto central de estudio (variable dependiente) (0,5 pto)
Resumen/Abstract (250 palabras), incluye: problema/pregunta, objetivo, datos (y N), resultado principal. (0,5 pto)
Introducción: definición de la problemática a abordar, su relevancia y principales conceptos (500 palabras). (2 puntos, 1 por la definición del problema y pregunta, y 1 por la definición conceptual)
En este apartado es importante considerar:
Objetivos / hipótesis (alrededor de 3) (250 palabras) (1 punto)
Metodología: datos (no olvidar número de casos), variables y métodos (500 palabras). (3 puntos, uno por cada subsección)
Discusión de los resultados, con énfasis en la relación entre variable dependiente e independientes, limitaciones, posibles estudios futuros. (500 palabras) (2 puntos)
Video-cápsula de presentación del trabajo: video de máximo 5 minutos donde se presente resumidamente el trabajo de investigación (3 puntos)
Actualización: también existe la alterntiva de realizar un poster en lugar del video, los detalles para cada uno de los formatos en este link
(R)Markdown: se recomienda su uso pues facilita la integración y reproducibilidad de los análisis en R.
Formato Tradicional: archivo .pdf en tamaño carta, letra Times New Roman, tamaño 12, interlineado 1,5, márgenes normales (2,5 cm superior e inferior, 3 cm derecho e izquierdo).
Referencias: APA 6ta Edición o ASA
Tablas de calidad: formato APA (líneas horizontales y señalando fuente).
Ver planificación
Descuento por atraso: 0.5 por día corrido, luego de 3 días de atraso se da el trabajo por reprobado.
En la sección de tareas de UCursos. Se debe adjuntar un archivo comprimido con los siguientes elementos:
Base de datos original y procesada
Código de preparación y de análisis
Documento del trabajo (que puede ser un archivo RMarkdown o Word)
El documento del trabajo debe ser ingresado además por Turnitin, se enviará link en la fecha de entrega para esto.
Una idea por párrafo
Uso de “oración principal” (topic sentence): usualmente es la oración al principio del párrafo, que resume el sentido del párrafo completo y que conecta con el párrafo anterior.
el foco de este enforme es la aplicación de regresión múltiple como herramienta de análisis multivariado a un problema sustantivo de investigación. Por lo tanto, en el análisis se debe enfatizar qué sucede con los predictores en presencia de otros predictores, y en la argumentación esto se relaciona con qué sucede con mi factor explicativo central en presencia de otros factores explicativos
en relación con lo anterior, se sugiere argumentar en base a una tesis central (ejemplo: influencia de educación en ingreso), luego agregar otros posibles factores explicativos que podrían estar afectando esta relación. No se recomienda presentar un “paquete” de factores explicativos (ej: cómo influye sexo, educación y edad en ingreso), sino jerarquizarlos.
los conceptos centrales deben estar en las hipótesis y también luego operacionalizarse en variables. No presentar variables que no se relacionen con los conceptos centrales de la argumentación (a menos que solo sean variables de control).
recordar que el control estadístico es algo que se aplica a todos los predictores del modelo, es decir, vía parcialización al ser una regresión múltiple. No confundir con “variables de control”, que son variables que se pueden sumar al modelo sin necesidad de hipótesis sustantivas y por lo tanto sin un énfasis relevante en la interpretación.
recordar que la tabla de univariados corresponde a sección de variables, no de análisis
en la sección de metodología se debe presentar un apartado de métodos, donde se describa el método de estimación (ej: regresión múltiple por mínimos cuadrados ordinarios) así como la lógica de presentación de modelos
si hay muchos casos perdidos (mas de un tercio de datos originales), explicar claramente a qué se debe esta pérdida. Existe la posiblidad de recuperar casos perdidos de predictores categóricos (o recodificados a categóricos) agregando una categoría adicional de perdidos. Esto se explica en la guía de índices y transformación de variables.
interpretación de hipótesis e inferencia: las hipótesis nunca se comprueban o se descartan, solo se puede hablar de que existe o no existe evidencia a favor de la hipótesis planteada. Recordar: la ausencia de evidencia no es evidencia de ausencia.
evitar términos técnicos estadísticos (ej: correlación ) antes de la sección de metodología
existen algunas dificultades en el tratamiento de algunas variables como la de ingreso.
mantener coherencia entre factores explicativos, hipótesis, descripción de variables, incorporación en el modelo, discusión, ojalá siempreen el mismo orden
regresión y N: cuántos casos son suficientes?
dicotomización de la dependiente para logística
Con regresión simple
[Cereceda-Marambio, K., & Torres-Solís, A. (2017). Satisfacción con la democracia en Chile: De lo normativo a lo valorativo. Revista de Sociología, (32), pp. 32-49. doi:10.5354/0719-529X.2017.47884] (https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543)
Con regresión logística