El curso proporciona una descripción general de las metodologías de agrupación y sus aplicaciones en las ciencias sociales. Comienza discutiendo los supuestos epistemológicos relacionados con la construcción de tipologías, particiones de datos y soluciones de clúster (conglomerados) en fuentes de datos típicas para la investigación en ciencias sociales, como los censos, registros vitales, encuestas y datos agregados (por ejemplo, a nivel de país). A continuación, el curso se centrará en técnicas de clustering no paramétrico aplicadas a matrices de distancia y presentará los fundamentos algorítmicos básicos de las técnicas de agrupamiento no paramétrico desde el caso univariante al multivariado, incluidas las medidas de evaluación de la bondad de ajuste. Se presentarán diferentes distancias y algoritmos de agrupamiento, incluidos algoritmos jerárquicos y no jerárquicos. También se presentarán técnicas de agrupamiento basadas en modelos. Ofreceremos capacitación práctica sobre cómo aplicar estas técnicas usando Stata. El código también estará disponible en el paquete estadístico R.
Las personas que asistan al curso aprenderán los usos principales de agrupamiento o clasificación de datos y cómo se relacionan con las teorías en la investigación de las ciencias sociales. También aprenderán a calcular matrices de disimilitud basadas en seis distancias diferentes e implementarán tres algoritmos de agrupamiento jerárquico. También aprenderán los fundamentos del algoritmo K-means y cómo usarlo para la consolidación de clústers. Se introducirán principios de agrupación basados en modelos. Se discutirán diferentes criterios para la selección de soluciones de agrupación y se brindará capacitación práctica sobre la implementación de estas técnicas utilizando el paquete estadístico Stata.
Estudiantes de Máster y Doctorado que trabajan en proyectos de investigación cuantitativa. Este curso también puede resultar de utilidad para personas en cualquier etapa de su carrera investigadora.
Es obligatorio tener conocimientos básicos de programación en Stata. Idealmente, las personas que se inscriban al curso deberían tener nociones de matrices de distancias. Si este no es el caso, se sugerirán materiales de lectura para preparar el curso.
Las personas que asistan al curso deberán traer sus computadoras portátiles.
Jeroen ha cursado estudios de posgrado en Estadística Aplicada, incluyendo un Máster, y se ha doctorado en Ciencias Espaciales, con una especialización en Demografía. Es (co)autor de más de 60 artículos revisados por pares, incluidos varios que utilizaron análisis de conglomerados.
Más informaciónDate
01 Oct 2024 - 04 Oct 2024
Registration deadline
31 Jul 2024
Schedule
Martes a Viernes de 9:45 a 12:30 hs y de 13:30 a 14:45 hs
Modality
Presencial
Fee
400 €
Language
Castellano