| Estadística |
|
|
|
|
Todas las áreas de este grupo interdisciplinar interactúan fuertemente con la estadística, pero además se pueden concretar las siguientes actividades que se llevan a acabo precisamente en esta área.
Modelos Aditivos Generalizados incluyendo interacciones y/o función link desconocida. Los Modelos Aditivos Generalizados (GAM) tienen aplicación en muchos campos de regresión con respuesta perteneciente a la familia exponencial (Binomial, Gaussiana, Poisson, Binomial Negativa, etc...). Esto modelos pueden ser utilizados con fines exploratorios, predictivos, explicativos o bien para detectar posibles interacciones entre los efectos de covariables. También es de interés el cálculo de derivadas del GAM, y la selección de variables explicativas (especialmente cuando el número es grande). Su aplicación es muy amplia y se extiende a todos los campos de la Medicina (clínica y epidemiológica) y de la Biología. C. Cadarso, X.L. Otero y F. Gude aportan su amplia experiencia en la utilización e interpretación de los modelos GLM el campo de la Medicina y la Biología. En los últimos años C. Cadarso y J. Roca han realizado en esta área avances metodológicos en los GAM y aplicaciones biomédicas. La colaboración se centra en el estudio de extensiones particulares del GAM: interacciones entre efectos, función link desconocida, estimación de curvas de medidas de efecto (como la OR), intervalos de confianza bootstrap, test de hipótesis sobre posibles interacciones,... Debido a la dificultad teórica de la estimación se recurre a técnicas bootstrap y se estudia el comportamiento de los mecanismos propuestos mediante estudios de simulación y mediante su aplicación a datos biomédicos. El aspecto computacional, tanto en simulación como en aplicación a grandes bases de datos, es costoso. Por este motivo se continúa en la mejora de técnicas de aceleración computacional. Seguimos avanzando en este cam po, y en particular en nuevos objetivos como estimación y contraste de derivadas de la regresión GAM, selección de variables, regresión cuantil, etc. Actualmente se mantiene contacto con los profesores María Durbán (Univ. Carlos III) para el estudio del comportamiento de los suavizadores P-Splines en este contexto, y con Stefan Sperlich para los estudios de contrastes sobre la link, métodos de estimación como el smooth backfitting y curvas ROC condicionales .En particular, se trabaja una gran base de datos de la Fundación de Endocrinología y Nutrición Gallega, para el estudio de prevalencia de la Diabetes y de los factores de riesgo vascular en Galicia. También colaboramos con el Servicio Galego de Saúde (SERGAS), y con los Servicios de los Hospitales que requieran el análisis GAM.
Curvas ROC
Se espera que el empleo de la información procedente del análisis GAM, en combinación con las curvas ROC, permita obtener una mayor reducción en el número de falsas detecciones producidas por el sistema CAD desarrollado. Este avance supone un paso más en la automatización del screening mamográfico para el cáncer, y los sistemas de telemamografía, lo cual permite su explotación, dada la implantación de dichos programas y el gran volumen de imágenes a manejar. De un modo general, las curvas ROC obtenidas por métodos flexibles serán de gran utilidad en cualquier especialidad clínica y epidemiológica donde se requiera su uso en estudios de diagnosis y clasificación a través de tests diagnósticos o marcadores.
Modelos de Supervivencia “multi-estado”
En este campo de los modelos de supervivencia multi-estado, con muchos problemas abiertos, trabajan con dedicación intensa L. Meira y B. de Sousa En particular, se trabaja con médicos portugueses de la Liga Portuguesa contra o Cancro (con quienes L. Meira, B. de Sousa y C. Cadarso ya mantienen contactos de colaboración), con la Dirección Xeral de Saúde Pública (Xunta de Galicia), y diversos Hospitales gallegos. L. Meira C. Cadarso y B. de Sousa desarrollan software amigable en R para la aplicación de los métodos propuestos a bases de datos reales. En la parte de aplicación y diseño de estudios de supervivencia, trabajará F. Gude. Como venimos haciendo desde hace varios años, seguiremos colaborando con el profesor P.K. Andersen (Univ. Copenhagen), experto mundial en análisis de supervivencia, en particular en modelos multi-estado. GAMs vectoriales
Los GAMs vectoriales Pueden utilizarse en todos aquellos campos de aplicación que generen datos de respuesta multivariante, bien de tipo continuo, de tipo categórico, o bien mixturas de ambos tipos. Aplicaciones importantes aparecen en el campo de la fisiología (sincronía neuronal), oftalmología (estudio de enfermedades en los dos ojos), genética (estudios sobre gemelos), enfermedades respiratorias (p.e. pulmonares), en diseños epidemiológicos de tipo caso control apareado (matched case-control studies), etc.... Además, los modelos GAM vectoriales con estructura de correlación se podrán aplicar a bases de datos longitudinales.
En este campo contamos con el Profesor G. Molenberghs y C Faes. En los últimos años, bajo la dirección del Prof. Molenberghs varios miembros de su equipo, entre ellos Christel Faes, han desarrollado diversas técnicas de estimación de GLM vectoriales con datos longitudinales, basadas en metodologías tipo GEE y Pseudo-likelihood. Han aplicado con éxito estos métodos en distintas especialidades biomédicas. Su equipo también tiene experiencia en la estimación paramétrica local utilizando polinomios fraccionales. Trabajos recientes del Prof. Molenberghs donde se aplican técnicas de suavización spline para estimación no paramétrica de VGAM con respuestas categóricas independientes, avalan la posibilidad de extender de forma natural la estimación no paramétrica VGAM a cualquier tipo de respuestas y al contexto de datos correlacionados. J. Roca también trabaja esta línea, en la elaboración de programas R y S-plus para la aplicación de los modelos, y software en Fortran para estudios de simulación y de aplicación. A medida que surgen avances metodológicos se van aplicando a bases de datos en epidemiología y toxicología. Los GAM de respuesta multivariante son un campo muy novedoso en el análisis de datos longitudinales.
A) Modelos Aditivos Generalizados. Desarrollo de algoritmos de estimación de los modelos GAM (con interacciones y/o función link desconocida). Técnicas de remuestreo bootstrap para inferencia. Mejora de técnicas tipo binning de aceleración computacional. Selección de los parámetros de suavización. Selección de variables en GAMs. Estimación y contraste de derivadas de modelos de regresión GAM. Estimación y contraste en regresión cuantil basada en GAMs. Inclusión de interacciones. Desarrollo de un paquete estadístico de fácil manejo sobre el modelo GAM. Los nuevos mecanismos serán aplicados a datos de SIDA, tuberculosis, infección post-quirúrgica, diabetes, HTA, etc. B) Curvas ROC condicionales. Estimación no paramétrica de la curva de regresión ROC en presencia de interacciones. Método Directo. Método Inducido. Estimación de la curva ROC condicional a covariables. Estimación de medidas resumen de la capacidad diagnóstica: AUC e Índice de Youden. Estudio comparativo por simulación de las metodologías propuestas. Inferencia asintótica y bootstrap. Test de bondad de ajuste de los modelos de regresión ROC flexibles. Combinaciones óptimas de varios tests diagnósticos. C) Modelo de supervivencia multi-estado. Estimación no paramétrica en modelos aditivos multi-estado. Inclusión de interacciones. Estudios comparativos mediante simulación de distintas propuestas de estimación flexible, utilizando distintos suavizadores. Estimación flexible de medidas de riesgo de mortalidad de predictores continuos, como la Hazard Ratio (HR), en modelos multi-estado. Desarrollo de programas informáticos para la estimación de diferentes modelos multi-estado en presencia de covariables. Aplicación a bases de datos reales en supervivencia: Artritis psoriásica, cáncer de mama, de estómago y de colon. D) GAM vectorial de respuesta multivariante (VGAM) Extensiones aditivas de los modelos paramétricos de respuesta multivariante Dale y Plackett-Dale. Inferencia bootstrap sobre los efectos de las covariables en VGAM. Validación de las metodologías propuestas mediante estudios de simulación.
Publicaciones Recientes 1)Muñoz Barús, Jose Ignacio; María Sol Rodríguez-Calvo; Suárez-Peñaranda; Duarte N Vieira; Cadarso Suárez, Carmen María and Febrero-Bande, M. (2010). PMICALC: An R code-based software for estimating postmortem interval (PMI) compatible with Windows, Mac and Linux operating systems. Forensic Science International Vol.194, pp. 49-52. 2) Cadarso Suárez, Carmen María; Meira-Machado, L.; Kneib Thomas and F Gude (2009 (To appear)). Flexible hazard ratio curves for continuous predictors in multi-state models: An application to breast cancer. Statistical Modelling. 3) Seoane Pillado, Teresa; Rodríguez Muíños, Miguel Ángel; Hervada Vidal, Xurxo and Cadarso Suárez, Carmen María (2009 (in press)). Free Software in the Medical Investigation. Medicina Clínica. 5) Pata, M. P., Rodríguez-Álvarez, M. X., Lustres-Pérez, V., Fernández Pulpeiro, E. & Cadarso Suárez, C. (2009 (in revision)). Modelling spatial patterns of distribution and abundance of mussel seed using STAR models. SORT. 6) Budiño, B., Lamas, J., Pata, M. P., Arranz, J. A., Sanmartín, M. L., Leiro, J. (2009 (in press)). Intraspecific variability in several isolates of the scuticociliate Philasterides dicentrarchi (syn. Miamiensis avidus) parasite of farmed turbot from different geographical origins. Veterinary Parasitology. 7) Pérez Fdez, R.; Botana López, M. and Cadarso Suárez, Carmen María (2009). Prevalence of metabolic syndrome in Galicia (NW Spain) on four alternative definitions and association with insulin resistance. Journal of Endocrinological Investigation Vol.32(6), pp. 505-511. 8) Ibtissame Setti; Alba Rodríguez Castro; Maria P. Pata; Cadarso Suárez, Carmen María; Bouchra Yacoubi; Laila Bensmael; Abdellatif Moukrim and Martinez Urtaza, J (2009). Characteristics and Dynamics of Salmonella Contamination along the Coast of Agadir, Morocco. Applied and Environmental Microbiology Vol.75 (24), pp. 7700-7709. 9) B Cid-Álvarez; F Gude; Cadarso Suárez, Carmen María; MX Rodríguez-Álvarez; JM García-Acuña and JR González-Juanatey (2009). Admission and fasting plasma glucose for estimating risk of death of diabetic and non-diabetic patients with acute coronary syndrome: nonlinearity of hazard ratios, and time-dependent comparison. American Heart Journal, Vol.158, 6, pp. 989-997. 10) Pardo Vázquez, JL; Cadarso Suárez, Carmen María; Molenberghs, G.; Geys, H; Faes, C.; Maringwa, JT; Leborán, V and Acuña, Carlos (2009). Application of Penalized Smoothing Splines in Analyzing Neuronal Data. Biometrical Journal Vol.51 (1), pp. 203-216. 11) Roca Pardiñas, Javier; Cadarso Suárez, Carmen María; Garcia-Tahoces, Pablo and Lado, M. José (2009). Selecting variables in non-parametric regression models for binary response An application to the computerized detection of breast cancer. Statistics in Medicine Vol. 28, 2, pp. 240-259. 12) Meira-Machado, L.; de Uña Álvarez, Jacobo; Cadarso Suárez, Carmen María and Andersen, PK (2009). Multi-state models for the analysis of time to event data. Statistical Methods in Medical Research, Vol. 18, 2, pp. 195-222. 13) Rilo Pousa, Benito; Fernández-Formoso N; Mora, MJ; Cadarso Suárez, Carmen María and Santana-Mora U (2009). Distance of the contact glide in the closing masticatory stroke during mastication of three types of food. J. Oral Rehabil Vol. 36 (8), pp. 571-576. 14) Santana-Mora U; Cudeiro J; Mora, MJ; Rilo Pousa, Benito; Ferreira-Pinho J.C; Otero Cepeda, Xosé Luis and Santana Penin, Urbano Antonio (2009). Changes in EMG activity during clenching in chronic pain patients with unilateral temporomandibular disorders. Journal of Electromyography and Kinesiolog Vol. 19, pp. e543-549. 15) Ginarte M; García Doval I; Monteagudo; Cabanillas M; Labandeira J; Flórez A; Cabo F; Álvarez J; Zulaica A; Allegue; Luis Fernando; Abalde M; Rosón E; de la Torre C and MX Rodríguez-Álvarez (2009). Observer agreement in toenail disorders: implications for diagnosis and clinical research. British Journal of Dermatology Vol. 160, pp. 1315 - 1317. 16) Faes, C.; Geys, H; Molenberghs, G.; Aerts Marc; Cadarso Suárez, Carmen María; Acuña, Carlos and Cano Mónica (2008). A Flexible Method to Measure Synchrony in Neuronal Firing. Journal of the American Statistical Association Vol. 103, pp. 149-161. |
| Última actualización el Jueves, 29 de Abril de 2010 10:11 |





La investigación en curvas ROC condicionadas a covariables, a través de varios modelos alternativos de regresión lineal generalizada es un tema relativamente reciente y está aún en fase de desarrollo. M.X. Rodriguez y M. López, bajo la dirección de C. Cadarso investigan dichos modelos, y han comenzado a trabajar en las extensiones de dichos modelos al contexto no paramétrico, utilizando como herramienta los modelos GAM. Los resultados metodológicos, computacionales y de aplicación a datos biomédicos, obtenidos hasta la fecha son muy prometedores, y están constituyendo en su conjunto, sus tesis doctorales. Por otro lado, F. Gude aporta su experiencia de aplicación de las curvas ROC en el ámbito de la diagnosis clínica, y M.J. Lado y P.G. Tahoces, su experiencia en el campo del Radiodiagnóstico.
El 
¿Qué objetivos concretos tiene esta área del GRID[ECMB]?