Seminario de Estudiantes de Doctorado en Estadística

El propósito de estos seminarios es conocer los proyectos de investigación en los que han participado los y las estudiantes del programa de Doctorado en Estadística en la modalidad de ponencia. Se extiende la invitación a participar a toda la comunidad UC.


2023-05-11
16:00 hrshrs.
Cristian Capetillo Constela. PUC
Algoritmos Tipo Metropolis en Inferencia Bayesiana
SALA MULTIUSOS (2do piso), FELIPE VILLANUEVA
Abstract:

La estadística Bayesiana ha tomado una importancia relevante en los modelos estadísticos actuales. Su capacidad de incorporar nueva información de diversas fuentes y su naturalidad para realizar predicciones suelen ser un punto fuerte de este enfoque. El elemento en el cuál se basa la inferencia Bayesiana es la distribución a posteriori que es proporcional a la función de verosimilitud por la priori. Lamentablemente, el cálculo de esta distribución, o bien, cálculos que la involucren, suelen ser imposibles de resolver analíticamente y es necesario optar por métodos aproximados.

Debido a la complejidad de la posteriori, se han desarrollado técnicas computacionales para poder llevar a cabo la inferencia en el problema asociado. El conjunto de estas técnicas se denomina Computación Bayesiana. Dentro de la computación Bayesiana existe un conjunto de métodos denominados Markov Chain Monte Carlo (MCMC), que se basan en generar una cadena de Markov ergódica cuya distribución estacionaria y límite es justamente la posteriori. Desafortunadamente, el costo computacional puede ser bastante alto si se utiliza un método muy general como el Metropolis-Hastings vía caminata aleatoria. Suele ser común entonces que en base al problema, se utilice un algoritmo específico que haya sido estudiado en problemas relacionados.

Por la razón anterior es que en esta presentación se propone comparar tres algoritmos MCMC en distintos modelos Bayesianos: Random Walk Metropolis-Hastings (RWMH), Metropolis-Adjusted Langevin Algorithm (MALA) y Hamiltonian Monte Carlo (HMC). Éstos dos últimos tienen en común el uso del gradiente de la log-posteriori para la generación de la cadena de Markov.

2023-04-20
16:00 hrshrs.
Francisco Segovia Godoy. PUC
A survival curve estimator with hypothesis testing using Bayesian variable selection
SALA 3, FACULTAD DE MATEMÁTICAS
Abstract:

En el área de sobrevivencia es común buscar el estimar curvas de sobrevivencia para los tiempos de falla y concluir si existe una diferencia significativa entre dos curvas o no. Para esto, existen métodos conocidos tales como el estimador de Kaplan-Meier, test de log-rank o modelos de Cox. Sin embargo, las técnicas mencionadas poseen ciertas restricciones que buscamos superar. En esta presentación mostramos un método que sirve tanto para estimar curvas de sobrevivencia como para identificar predictores relevantes, usando una técnica de aumentación de datos bajo inferencia Bayesiana. La estrategía de selección de predictores está basada en la metodología Spike-and-slab. Se presenta tanto el método como el algoritmo de su Gibbs sampling. Finalmente, ajustamos nuestro modelo a una aplicación para datos reales.

2023-03-30
16:00 hrshrs.
Leonardo Barrios. PUC
Extensión de la distribución inversa power Muth usando composición de power series
SALA 2, FACULTAD DE MATEMÁTICAS
Abstract:

Se introduce una nueva distribución con soporte positivo, la cual permite una mayor flexibilidad para adaptarse a distintos tipos de datos en el área científica. Esta distribución, denominada inversa power Muth power series, es una extensión de la distribución inversa power Muth propuesta por Chesneau y Agiwal (2021), que es una composición entre las distribuciones inversa power Muth y la clase de distribuciones power series (Noak, 1950), destacando por primera vez el uso de la distribución Bell en este contexto. Se presentan las funciones de densidad, de sobrevivencia y de riesgo, así como los momentos de la distribución y la entropía diferencial. Haciendo uso de la representación estocástica del modelo se implementan los estimadores de máxima verosimilitud, a través del el algoritmo EM, y los errores estándar se calculan usando el método Oakes. Se realizan estudios de simulación de Monte Carlo para evaluar el desempeño de los estimadores de máxima verosimilitud en muestras finitas, y se presentan dos ilustraciones a conjuntos de datos reales, donde se compara con varios modelos comúnmente utilizados en la literatura también basados en composición del modelo power series.

2022-12-02
14:00hrs.
Nixon Jerez Lillo. PUC
Modelos Exponenciales de Grafos Aleatorios
SALA 2, FACULTAD DE MATEMÁTICAS
Abstract:

El Modelo Exponencial de Grafos Aleatorios (ERGM) es un modelo utilizado en grafos aleatorios que ha tenido una gran popularidad en el análisis estadístico de redes por permitir describir parsimoniosamente las fuerzas de selección locales que dan forma a la estructura global de una red (Hunter et al. 2008). Sus aplicaciones cruzan transversalmente diversas áreas, tales como las redes biológicas, informáticas, de trabajo, de conocimiento, etc.

 

La exposición tiene como objetivo dar a conocer esta nueva clases de modelos (en el marco de los modelos para variables binarias dependientes), y comprender sus desafíos (como modelo cuya constante normalizadora es intratable). Iniciaremos con una breve revisión bibliográfica sobre la forma en que algunos investigadores propusieron modelar redes para luego presentar el ergm y comprender la hipótesis de dependencia y homogeneidad por sobre el cual están construidos. A continuación, se ahondará en la forma con la que hacer inferencia clásica y bayesiana, cómo simular redes sintéticas a partir de él y una revisión a los métodos de bondad de ajuste que son utilizados.

2022-11-25
14:00hrs.
Hernán Robledo Araya. PUC
Psicometría: Puntuación de percepciones de seguridad en escuelas chilenas
Sala usos multiples 1 FELIPE VILLANUEVA
Abstract:

El Cuestionario de Contexto y Calidad de la Educación mide atributos relacionados a las percepciones del sistema educativo en estudiantes, profesores y apoderados para los cursos de 4° básico, 8° básico, y 2° medio. Estas percepciones son capturadas con cuestionarios autorreportados que miden clima escolar, motivación académica y escolar, entre otros. Teoría de Respuesta al Ítem (IRT) es un enfoque de modelamiento con variables latentes que es utilizado para modelar datos recopilados a través de este cuestionarios. Se presentará una aplicación de estos modelos para proponer cómo calcular un índice válido y confiable que representa las percepciones de seguridad de los miembros del sistema escolar.