Introducción al Lenguaje R
R es un lenguaje de alto nivel y un entorno para el análisis de datos y gráficos. Fue desarrollado en 1997 por Ross Ihaka y Robert Gentleman de la Universidad de Auckland, Nueva Zelanda. Es un software de código abierto, donde los usuarios colaboran con el desarrollo del proyecto. Las aportaciones son incluidas como librerías que se pueden descargar de la red. Si bien R carece de soporte técnico, el software tiene un sistema diverso y bien organizado de retroalimentación entre los usuarios y los desarrolladores. Por tratarse de software libre, R es una sobresaliente alternativa a las incosteables licencias de la mayoría de los paquetes estadísticos.
El propósito del taller fue proveer una introducción a las capacidades de R. Además, se presentaron los elementos básicos del lenguaje, se mostraron algunos de los recursos que existen en la Red para el manejo de bases de datos y el procesamiento de información. La dinámica del taller giro en torno a un código base (script). Conforme avanzó el taller, los estudiantes enriquecieron dicho código. La idea fue construir un punto de partida para el aprendizaje autodidacta del software.
Análisis de redes complejas aplicadas a la Ecología con R
Tradicionalmente, la mayoría de los estudios de interacciones ecológicas se han enfocado en aquellas que ocurren entre pares de especies. Sin embargo, las especies (y sus poblaciones) no son entidades aisladas, por lo que en el entorno natural existe una gran diversidad de interacciones interespecíficas entre plantas y animales, incluyendo la herbivoría, polinización, y la dispersión de semillas, lo que genera una compleja red de interacciones. Dichas interacciones ecológicas regulan los patrones y procesos que se dan en las poblaciones y comunidades biológicas y juegan un papel clave en la estructuración de la biodiversidad. El conocimiento de la estructura y funcionamiento de las redes ecológicas complejas en las comunidades bióticas, nos permite conocer la dinámica ecológica y evolutiva de sistemas ricos en especies (ej. Bosques Tropicales).
Este curso se enfocó a la revisión teórica y práctica de las bases conceptuales de la aplicación de redes complejas para el estudio de las interacciones interespecíficas entre las plantas y los animales. Los estudiantes aprendendieron acerca de los últimos enfoques de la topología de las redes ecológicas y cómo estos varían en el espacio y el tiempo y la forma en que se ven influenciados por diferentes perturbaciones ambientales.
Herramientas para el análisis cualitativo en las ciencias sociales: Análisis de contenido y uso de RQDA
Se familiarizó a los participantes con las principales técnicas de análisis cualitativo de contenido a partir del programa de acceso libre RQDA.El programa del curso se basó en el análisis de contenido en las ciencias sociales, teniendo como principales temas: Análisis de contenido; El papel de la teoría en el análisis de contenido; Fuentes y organización de material; Estrategias de codificación; Construcción de categorías y tipos de relaciones; y por último el uso de RQDA.
Análisis de dependencia y autocorrelación espacial
La utilidad de la estadística para describir conjuntos de datos es bien conocida. Pero, ¿qué pasa cuando lo que se quiere describir está en el espacio? Los métodos tradicionales pueden perder validez, entre otras cosas, porque es altamente probable que se viole el principio de independencia en nuestras observaciones. De manera espacial, uno puede estudiar un patrón o proceso. Un patrón suele entenderse como el resultado de un proceso, y en fenómenos naturales o sociales, no solemos contar con la posibilidad de repetir el proceso que dio lugar al patrón que observamos. Por esta razón, debemos contar con herramientas de estadística espacial que nos permitan estudiar los patrones para poder entender los procesos. Además, los procesos naturales y sociales a menudo,presentar dependencia y asociación espacial, es decir, las observaciones suelen acumularse en ciertas ubicaciones preferidas.
El propósito del taller se basó en que los asistentes se familiarizaran con una serie de medidas de autocorrelación espacial para datos ambientales y de criminalidad. Para ello, primero fue necesaria una breve introducción teórica y conceptual acerca de la autocorrelación espacial que permitió establecer la terminología que se utilizó. Con esto, se lograron manejar datos espaciales en el software GeoDa con el propósito de hacer algunos cálculos de indicadores de asociación espacial global y local.
Introducción al diseño y manejo de bases de datos: Una aproximación desde MySQL y R
El manejo de información constituye uno de los pilares de la producción científica. Una administración y/o gestión adecuada de datos permite incrementar la productividad científica, posibilitar el desarrollo de proyectos colaborativos,y asegurar el uso de la información en el futuro, entre otros. Más aún, el conocimiento de criterios básicos para el diseño de bases de datos, así como el manejo de herramientas diseñadas ad hoc para el manejo de información, permite ligar los procesos de diseño de la investigación, toma de información y síntesis de la misma, haciendo el proceso de investigación científica más coherente y eficiente. Sin embargo, es común que veamos estos procesos como independientes y que nos limitemos al uso de tan sólo algunas herramientas para el manejo y/o administración de la información, particular o exclusivamente Excel. Afortunadamente existen hoy en día opciones de software libre y de alta calidad que nos permiten lograr una administración de datos más eficiente, entre las que encontramos MySQL y R. La primera constituye un sistema de gestión de bases de datos que nos permite relacionar tablas de diferente índole para sintetizar información. Por su parte, R es un lenguaje de alto nivel y un entorno para el análisis de datos y gráficos. Ofrecemos entonces a los académicos y estudiantes de la UNAM campus Morelia el presente taller introductorio al manejo de bases de datos empleando MySQL y R, esperando que su aprendizaje les permita hacer más eficiente el procesamiento y gestión de los datos con los que cuentan.
El objetivo de este taller fue introducir a los asistentes en la concepción, diseño y manejo de bases de datos mediante el uso de software de acceso libre, como MySQL y R.
Modelos lineales en R
El análisis estadístico de uso común en la práctica científica, tales como la regresión lineal simple o múltiple, la comparación de medias de dos grupos, el análisis de varianza, o las curvas de supervivencia, pueden parecer en primera instancia técnicas disímiles entre sí. Algunas de ellas incluyen variables predictorias de po cuantitativo, otras de po categórico, o incluso otras una mezcla de las dos. De igual forma, la respuesta analizada puede ser de po con nuo, discreto, binario o mul nomial. A pesar de esta diversidad, una buena parte de las situaciones más comunes de análisis pueden ser abordados desde el marco unificador de los modelos lineales generalizados, que permiten integrar predictores y respuestas de diferente naturaleza.
En este curso se presentó una introducción al uso de los modelos lineales generalizados. Si bien durante el curso se hizo énfasis en el análisis de datos ecológicos, los métodos y herramientas empleados son de amplia aplicación en otras áreas del conocimiento. Para su desarrollo se empleó el lenguaje de programación R, debido a la amplia variedad de herramientas analíticas y de visualización que ofrece, así como a su fácil acceso dado su carácter de software libre. Se expuso a los asistentes una introducción a la teoría y aplicación de los modeloslineales generalizados. En particular, los participantes aprendieron a: Emplear herramientas gráficas y tabulares para visualizar las relaciones entre variables y valorar el po de modelo lineal; Ajustar modelos lineales generalizados e interpretar sus resultados; Emplear herramientas gráficas para evaluar el ajuste del modelo, así como el cumplimiento de los supuestos del mismo; Realizar inferencias estadísticas empleando aproximaciones frecuentitas (valores de P) y de información (criterios con AIC); Y realizar reportes gráficos y tabulares de los modelos ajustados.
Modelos no lineales en R
Al buscar establecer la relación que existe entre una variable de respuesta y un conjunto de variables explicativas, la primera estrategia suele ser ajustar un modelo lineal. Sin embargo, en ciertos contextos, tiene más sentido plantear una relación no lineal de las variables explicativas con la variable de respuesta. Esto ocurre cuando, 1) al visualizar los datos no se ven patrones claramente lineales, 2) la teoría científica plantea que la relación no debería ser lineal. Necesitamos entonces contar con una herramienta de modelación no lineal que herede la flexibilidad de los modelos lineales generalizados mixtos en términos de permitir incluir efectos fijos y aleatorios y anidamiento, así como permitir considerar variables con distribuciones no normales.
Este curso se enfocó a la revisión teórica y práctica de las bases c onceptuales de la aplicación de modelos para el estudio de la relación no lineal entre variables explicativas y de respuesta. Los estudiantes aprendieron:
Eco-evolutionary dynamics of virulence: the devil is still in the details
Las ideas de que la virulencia del patógeno (el daño causado por el patógeno a su huésped) es un rasgo evolucionado que puede explicarse por la teoría evolutiva, y la virulencia puede evolucionar significativamente en el curso de una sola epidemia ("transitoria" o dinámica "eco-evolutiva"), han ganado apoyo tanto teórico como empírico en las últimas décadas. Los biólogos esperan que estas ideas puedan aplicarse en contextos prácticos para pronosticar y, con suerte, gestionar la evolución de la virulencia.
En el curso se presentó la teoría básica de las dinámicas eco-evolutivas de la virulencia; repasando algunas de las historias de éxito empíricas; y se concluyó con un análisis reciente de la evolución de la virulencia del VIH que agrega algunos cambios de precaución a la historia.
Visualización y gestión de datos y generación de reportes con Tidyverse y RMarkdown
Todos tenemos datos por analizar, pero muchas veces no sabemos por dónde comenzar. Los maestros y tutores dan por hecho que los estudiantes saben cómo organizar sus datos para emprender el análisis. Por su parte, los estudiantes comúnmente crean hojas de cálculo siguiendo su intuición. Lo que la mayoría no reconoce es que el adecuado manejo de los datos, desde el momento mismo en que se toman, tiene la capacidad de facilitar enormemente el análisis posterior y acelerar así el proceso de obtención de resultados.
Este curso expuso las bases de un manejo adecuado de datos y su presentación, así como facilitó a los estudiantes el proceso de generación de información. Los estudiantes reconocieron y aplicaron criterios básicos para la organización y resumen de datos empleando las herramientas de la suite Tidyverse para R, y aprendieron a generar reportes de sus análisis de datos empleando RMarkdown.