¿Es posible predecir la distribución geográfica de las especies basándonos en variables ambientales? Jorge M. Lobo 1. La cuestión 2. ¿Cuanto esfuerzo es suficiente? 3. Buscando la función predictiva 3.1 Necesidades. 3.2 Los inoportunos inconvenientes 3.3 Un ejemplo 4. Los factores históricos y el espacio 5. Comentario final 6. Bibliografía 1. - La cuestión
El estudio de las condiciones climáticas durante los dos últimos millones de años demuestra que el medio abiótico está en un permanente estado de no-equilibrio y que las condiciones ambientales siguen tendencias cambiantes de distinta duración. La respuesta de las especies ante esos cambios ha sido la dispersión sin apenas evidencias de modificaciones morfológicas importantes (Coope, 1979; Elias, 1994; Huntley & Birks, 1983; Webb et al., 1993). Si las especies son relativamente rígidas y si, además, el medio abiótico está en permanente estado de transformación, la reacción más eficaz de una especie ante una modificación ambiental consiste en variar espacialmente su distribución geográfica a fin de acoplar espacialmente los requerimientos eco-fisiológicos en aquellos enclaves que reproducen las condiciones ambientales para las que está adaptada (adaptación espacial; véase Hengeveld, 1997 y Lobo, 1999 para una revisión sobre el tema). Este modo de entender el medio natural concede gran importancia a la dimensión espacial y es de gran ayuda si queremos explicar la diversidad y la composición faunística de un determinado territorio. La Biogeografía se convierte así en una disciplina de alto valor explicativo a la hora de estudiar la variación espacial de la biodiversidad. Actualmente, el estudio de la biogeografía de la biodiversidad tiene como principales objetivos:
Las potentes herramientas informáticas disponibles, en especial los programas de bases de datos y los sistemas de información geográfica, facilitan enormemente la recopilación y cartografía de la información biológica (Davis, 1994; Margules & Austin, 1994; Miller, 1994; ver http://viceroy.eeb.uconn.edu/Biota). El análisis ulterior de esta información debe permitir evaluar el esfuerzo taxonómico y faunístico realizado, describir el emplazamiento de las áreas y los grupos taxonómicos necesitados de prospección, estimando el trabajo pendiente necesario para completar los atlas de la biodiversidad (véase Morrone en este mismo volumen). Sin embargo, son pocos los casos en los que se está acometiendo esta labor de manera permanente (Beaufort & Maurin, 1988; Harding & Sheail, 1992; ver también http://kaos.erin.gov.au (Environmental Resources Information Network, Australia), http://www.conabio.gob.mx (Comisión Nacional para el Conocimiento y el Uso de la Biodiversidad, México), o http://www.inbio.ac.cr (Instituto Nacional de Biodiversidad, Costa Rica) y muchos los lamentos sobre el poco esfuerzo dedicado a la recolección, determinación y estudio sistemático animal y vegetal, sobre todo en aquellos países económicamente pobres, pero ricos en número de especies y endemismos. 2. - ¿Cuanto esfuerzo es suficiente? Cuantificar el esfuerzo de muestreo es imprescindible para evaluar la calidad de la información biológica disponible, pero no es sencillo determinar cuan completos son nuestros inventarios. Rara vez puede demostrarse que el incremento en el esfuerzo de muestreo de un territorio permite descubrir nuevas especies de un grupo cualquiera (Gaston, 1996). Sin embargo, los datos sobre la distribución de una especie se limitan a constatar su presencia, sin existir medida alguna que permita diferenciar la ausencia de la falta de muestreo. En los pocos casos en los que se manejan datos sobre la distribución geográfica del número de especies de un grupo, se evita mencionar generalmente que dicha información procede de diversas fuentes, es decir, que ha sido recogida utilizando distintos métodos y esfuerzos. De este modo, resulta imposible discernir cuál es el efecto de la variación en la intensidad de muestreo sobre la distribución del número de especies y, por tanto, cuál es el patrón real de distribución (Williams & Gaston, 1994). Algunas aproximaciones metodológicas permiten realizar comparaciones entre la riqueza de especies de distintas localidades, corrigiendo el número de especies de un área según el esfuerzo de muestreo realizado en ella (Hurlbert, 1971; Prendergast et al., 1993). Estas técnicas pretenden obtener estimas relativas comparables de riqueza entre distintas localidades, pero no ofrecen información sobre el número absoluto de especies que contienen. Sin embargo, para la aplicación de todas estas metodologías se necesitan siempre datos con un mínimo de calidad. Datos que ofrezcan información sobre la abundancia de las especies o que estén asociados con alguna medida de esfuerzo claramente definida. Cuando procede, éstas metodologías son muy valiosas pero, evidentemente, nada pueden hacer cuando el problema fundamental es la ausencia de información Si el grado de conocimiento taxonómico y biogeográfico de un territorio es precario, el esfuerzo aún por realizar puede ser de tales proporciones, que resulta imposible obtener a medio plazo una aproximación fiable del reparto espacial del número de especies. Aunque resulte descorazonador, no hay que descartar que esta situación sea corriente incluso en aquellos grupos bien estudiados y en países con una prolongada tradición sistemática. Veamos un ejemplo. Los coleópteros coprófagos de la subfamilia Scarabaeinae son uno de los grupos de insectos mejor estudiados en Europa Occidental. Tanto en la Península Ibérica como en Francia, existen bancos de datos exhaustivos que compendian toda la información museística y bibliográfica disponible (Lumaret., 1990; Lobo & Martín-Piera 1991). Utilizando como medida de esfuerzo la cantidad de registros contenidos en dichas bases de datos para cada cuadrícula UTM de 50 Km., se realizó un análisis de la relación asintótica entre el número de especies y el esfuerzo de muestreo (ver Soberón & Llorente 1993), expresado este como el número de registros (Figura 1).
Dicho análisis demostró que únicamente entre un 25% y 32% del total de las cuadrículas pueden considerarse relativamente bien muestreadas (Figura 2).
Es decir, recopilar durante años toda la información disponible desde hace más de un siglo, sobre un grupo faunística y taxonómicamente bien estudiado (la última nueva especie fue descrita hace más de 20 años), sólo permite tener inventarios fiables en apenas poco más de la cuarta parte del territorio. Considerando, además, que se trata de una escala espacial grosera (cuadrículas de unos 2.500 Km2 aproximadamente) y de un país europeo, ¿;cuál puede ser entonces la situación en otras áreas más ricas y con menor información almacenada?; ¿Qué podemos hacer entonces?
3. - Buscando la función predictiva. En este caso, la única alternativa es realizar pronósticos razonables sobre la distribución del número de especies. La relación entre el número de taxones de alto rango y el número de especies, la búsqueda de especies indicadoras y la utilización de información ambiental de diverso tipo para obtener modelos con valor predictivo, son las tres principales aproximaciones seguidas para obtener estimas de la diversidad biológica cuando falta la información biológica (Gaston, 1996). En adelante me centraré en la última de éstas aproximaciones, describiendo sus requerimientos y algunos fundamentos básicos sobre el Análisis de Regresión , la técnica estadística generalmente aplicada en esta metodología. Después repasaré los principales inconvenientes a tener en cuenta, enumerando algunas soluciones que pueden ser de utilidad a la hora de encontrar funciones predictivas de mayor capacidad. Ejemplos de esta metodología e información más detallada pueden encontrarse en Austin et al. (1984 y 1996), Buckland & Elston (1993), Heikkinen & Neuvonen (1997), Kirkpatrick & Brown (1994), Nicholls (1989) o Margules et al. (1987).
Son necesarios tres requisitos para buscar una función predictiva:
Respecto a las variables a utilizar, numerosos estudios han tratado de poner de manifiesto la relación existente entre el número de especies de un grupo determinado y distintos parámetros ambientales (ver Gaston, 1996 y referencias allí citadas). Estos trabajos demuestran que el número de variables ambientales que pueden utilizarse para buscar una función predictiva es muy grande, siendo difícil decidir cuales son las más convenientes en cada caso concreto. Como criterio preliminar, parece conveniente seleccionar aquellas variables relacionadas con la energía que entra en el sistema como productividad, evapotranspiración, pluviosidad, temperatura, etc. (ver Wright et al., 1993), pero la amplitud altitudinal o alguna medida de la heterogeneidad ambiental suelen dar también buenos resultados (Wohlgemuth, 1998). Finalmente, si sospechamos que la influencia de la alteración antrópica del territorio puede ser una variable importante, resulta útil considerar alguna medida del uso del suelo o del tipo de paisaje. Existen diversos métodos, unos más sofisticados que otros, para intentar predecir el número de especies o la presencia de una sola de ellas a partir de variables ambientales. Por ejemplo, los algoritmos genéticos (Mitchell, 1991; ver http://kaos.erin.gov.au/general/biodiv_model/ERIN/GARP/home.html), el análisis de huecos (Gap Analysis, Scott et al., 1993; ver http://www.sdvc.uwyo.edu/wbn/gap.html), los autómatas celulares (Carey, 1996) o los métodos de clasificación y regresión (Regression Tree Analysis; Iverson & Prasad, 1998). Sin embargo, el método más socorrido y sencillo para explorar la relación entre los datos de especies y diversas variables es el Análisis de Regresión (Ter Braak & Looman, 1995). Si se poseen datos de varias variables ambientales explicativas deben utilizarse los Análisis de Regresión múltiples que, en esencia, siguen los mismos principios que los Análisis de Regresión simples. En estos análisis suele ser frecuente que algunas variables independientes estén correlacionadas entre ellas, por lo que hay que conducirse cuidadosamente para realizar la elección de las variables significativas. Puede hacerse un Análisis de Regresión Múltiple con todas las variables a la vez y comprobar cuales tienen una pendiente significativamente diferente de cero, pero también pueden eliminarse aquellas variables no significativas mediante un proceso de eliminación hacia delante (forward) o hacia atrás (backward). En el primero se realiza una regresión individual sobre cada una de las variables independientes y se elige aquella que explica un mayor porcentaje de la variación en la variable dependiente. Entonces se vuelven a realizar regresiones parciales incluyendo la variable elegida y, una a una, se introduce el resto de las variables hasta encontrar aquella que explica un mayor porcentaje de la varianza que queda aún por explicar. El proceso finaliza cuando no puede encontrarse ninguna otra variable que contribuya significativamente. En el procedimiento de selección backward se comienza por incluir todas las variables a la vez, eliminándose en cada paso la variable explicativa menos significativa, hasta que sólo queden aquellas que contribuyen significativamente a explicar la variación de la variable dependiente. Un método más fiable es el Análisis de Regresión por Pasos (Stepwise Multiple Regression) en el cual se alterna un proceso de selección forward de las variables con una eliminación backward, de modo que cada vez que se incluye una nueva variable en el modelo, se comprueba la significación de todas las previamente incluidas. Desgraciadamente puede ocurrir que los distintos métodos elijan diferentes conjuntos de variables. Los Análisis de Regresión por Pasos son cada vez más frecuentemente criticados (ver, por ejemplo, http://www.fmdc.calpoly.edu/libarts/jgill/360.stepwise.html), debido a que, con relativa frecuencia, son incapaces de producir una función en la cual las variables integrantes sean las de mayor poder predictivo. En general, los mayores inconvenientes se producen cuando existe un alto número de variables explicativas y cuando algunas de éstas están correlacionadas entre sí. En esos casos, el grado de correlación entre la variables predictivas, suele afectar la frecuencia con que aparecen aquellas que son verdaderamente explicativas, pudiendo entrar a formar parte del modelo variables que no poseen ninguna significación biológica o estén pobremente relacionadas con la variable dependiente. Si tenemos N variables independientes, existen 2N posibles ecuaciones y varias de ellas pueden ser capaces de representar los datos igualmente bien (Daniel & Wood, 1980). ¿Cuál debemos elegir? La solución óptima consiste en estudiar todas las ecuaciones posibles y elegir la que posee menores residuos. Esta aproximación, aunque infalible, puede ser inviable en la práctica con los métodos tradicionales: si poseemos 15 variables independientes, existen 32.728 ecuaciones diferentes. Cuando se trata únicamente de buscar una función que nos permita predecir no es trascendente que la función obtenida excluya variables significativas o incluya otras menos explicativas y difíciles de interpretar biológicamente. Podemos identificar los factores correlacionados con la diversidad de especies de un grupo cualquiera a una determinada escala espacial, pero resulta más difícil decidir si esa correlación es accidental o si puede identificarse una causa biológica subyacente (Shipley, 1999).
3. 2. - Los inoportunos inconvenientes La búsqueda de una relación sencilla que pueda ofrecernos una función de alto valor predictivo es, con toda seguridad, una pretensión exagerada e irreal. Estimar el número de especies (o la presencia de una sola de ellas) en un territorio concreto y a una escala espacial determinada, mediante la utilización de variables ambientales, es una aproximación más simple que colectar, identificar y contar directamente el número de especies, pero no está exenta de dificultades, a continuación, examinaré las que considero fundamentales. Como se mencionó anteriormente, un problema frecuente es la correlación existente entre las distintas variables ambientales que se utilizan (Figura 3), un atributo propio de los sistemas que, como la Biosfera, poseen una notable complejidad en las relaciones entre sus elementos. Muchas variables ambientales varían de forma similar a lo largo de un gradiente espacial, de modo que se pierde la necesaria independencia entre sus valores. Elegir una variable explicativa suele suponer desestimar otras relacionadas con ella, pero que son ligeramente menos efectivas a la hora de predecir la variable dependiente.
Por ello, pueden encontrarse distintas funciones con similar capacidad predictiva constituidas por conjuntos de variables ambientales diferentes. Cualquiera de esas funciones puede ser útil a la hora de realizar pronósticos, pero siempre hay que tener cuidado con las interpretaciones causales, es decir, con la consideración de esas variables como los factores que originan la modificación en la variable estudiada. Examinar previamente el grado de correlación existente entre las variables explicativas no soluciona completamente el problema, pero permite desechar algunas variables ambientales y conocer las razones de su elección o rechazo. Una alternativa consiste en utilizar algún método multivariante de ordenación, como el análisis de componentes principales (ver Legendre & Legendre, 1998). Con estos métodos puede reducirse el número de variables mediante la generación de otras nuevas que son composiciones de las anteriores y, lo que es más importante, que no están correlacionadas entre sí. El inconveniente es que, en no pocas ocasiones, es difícil interpretar estas nuevas variables. Otro inconveniente habitual es que, a veces, el efecto de una variable depende del valor de otra y esa interacción posee un mayor valor predictivo que las propias variables por separado (Figura 4) (ver Margules et al. 1987).
Para comprobar si las interacciones son efectivas a la hora de predecir la variable dependiente, se utiliza el producto de dos variables (x3=x1 * x2) como una variable más, comprobándose su capacidad predictiva mediante su inclusión en el Análisis de Regresión. Un tipo de interacciones especialmente interesantes, son aquellas que existen entre una variable espacial (latitud, longitud o algún término cuadrático o cúbico de éstas) y una variable ambiental. En el caso hipotético de que una variable de interacción de este tipo posea valor predictivo, es probable que la variable ambiental en cuestión tenga un efecto significativo únicamente en determinadas porciones del territorio. La relación entre las variables ambientales y la variable dependiente no tiene por qué ser lineal (Figura 5) (ver Austin et al., 1996).
Es más, hay numerosos ejemplos de relaciones que no son lineares. Tal es el caso de las que se dan entre productividad y diversidad (Rosenzweig & Abramsky, 1993) o entre diversidad y altitud (McCoy, 1990): parabólicas, exponenciales, potenciales, etc. Las relaciones deben de ser lineales para la mayoría de los métodos de regresión y estadísticos sencillos. Por ello, es conveniente visualizar una a una las relaciones entre las variables explicativas y la variable dependiente y en el caso de que no sean lineares intentar linearizarlas mediante algún tipo de transformación. Como generalmente las variables biológicas no se distribuyen siguiendo la curva Normal, ni las relaciones entre ellas suelen lineales, se está imponiendo cada vez con mayor frecuencia el uso de los Modelos Lineales Generalizados (McCullagh & Nelder, 1983; Crawley, 1993). La utilización de esta técnica estadística constituye una herramienta fundamental para solventar los inconvenientes anteriores, ya que permite especificar el tipo de distribución para los errores y elaborar modelos aunque las relaciones entre las variables no sean lineales. Además, facilita el análisis de las interacciones, siendo utilizable, asimismo, en el caso de variables categóricas (ver algunos ejemplos en Austin et al., 1996 o Heikkinen & Neuvonen, 1997). Las variables ambientales están a menudo espacialmente autocorrelacionadas, o sea, el valor de la variable en una localidad depende del valor en las localidades contiguas, violándose así la independencia entre las observaciones requerida por la mayoría de las pruebas estadísticas (Cliff & Ord, 1981; Odland, 1988). La autocorrelación de una variable puede suprimirse con bastante efectividad mediante un Trend Surface Analysis (TSA; ver Legendre, 1993). Se trata de construir un polinomio de tercer grado con la latitud (LAT) y la longitud (LON) de cada observación (LAT + LON + LAT2 + LAT x LON + LON2 + LAT3 + LAT2 x LON + LAT x LON2 + LON3) y someter sus nueve términos como variables independientes a un análisis de regresión por pasos, con la variable a la cual queremos quitar su estructura espacial como dependiente. De este modo, si aparece algún término significativo, la variable posee una estructura espacial y pueden elegirse los residuos de la regresión (la parte de la variable no explicada por el espacio), como una estima de la variable sin autocorrelación o estructura espacial. Como casi todas las variables ambientales varían siguiendo algún gradiente espacial, sobre todo a escala geográfica, eliminar el componente espacial de una variable supone casi siempre desechar una parte importante de su capacidad explicativa. De este modo, es necesario: Como casi todas las variables ambientales varían siguiendo algún gradiente espacial, sobre todo a escala geográfica, eliminar el componente espacial de una variable supone casi siempre desechar una parte importante de su capacidad explicativa. De este modo, es necesario:
Si los residuos (lo que no predice nuestro modelo) poseen una clara estructura espacial o están autocorrelacionados, es que probablemente no hemos considerado alguna variable con una clara variación espacial. Será entonces necesario buscar esa variable o variables (elaborar un mapa de esos residuos puede dar algunas pistas) e introducirla para lograr que la capacidad predictiva de nuestro modelo no sea significativamente mayor en unos lugares determinados que en otros. Una manera de asegurar que la variación espacial de nuestra variable dependiente esté recogida, disminuyendo de este modo las posibilidades de que aparezcan residuos autocorrelacionados, es introducir al final del modelo y como variables independientes, los nueve términos del polinomio de tercer grado de la latitud y la longitud. Para realizar los análisis de autocorrelación existen algunos programas informáticos de acceso gratuito: R-Package, http://www.fas.umontreal.ca/biol/casgrain/en/labo/R/index.html RookCase, http://aix1.uottawa.ca/academic/arts/geographie/lpcweb/sections1/software/frmsoft.htm)
Utilizando el número de registros contenidos en una exhaustiva base de datos sobre los Scarabaeidae Ibéricos como medida de esfuerzo, hemos predicho la distribución geográfica de la riqueza de especies en la Península Ibérica, mediante la utilización de variables ambientales. En primer lugar, se evaluó el esfuerzo de muestreo en toda la península a escala de cuadrículas UTM de 50 km. Para ello, se definieron primeramente las regiones fisiográficas del territorio peninsular utilizando variables climáticas (temperatura media anual, variación de la temperatura anual, días de sol al año, precipitación total anual, variación de la precipitación estival y anual) y topográficas (altitud media y rango altitudinal). A continuación, se analizó el esfuerzo de muestreo diferencial entre áreas, investigando la relación asintótica del número de especies registradas a diferentes niveles de esfuerzo de muestreo. Posteriormente, se estableció el grupo de cuadrículas UTM bien muestreadas en cada una de las subregiones, mediante una jerarquía de esfuerzos de muestreo subjetivamente definidos a diferentes tasas de incremento del número de especies. Se identificaron un total de 82 cuadrículas (32.2%) adecuadamente muestreadas (Figura 1). Como variables explicativas se utilizaron los valores de 24 variables en esas 82 cuadrículas (Tabla 1): dos espaciales, dos geográficas, cuatro topográficas, tres geológicas, ocho climáticas y cinco relativas a usos del suelo, más los correspondientes términos de interacción entre las diferentes variables ambientales (n=231) y entre éstas y las espaciales (n=44).
Tabla 1. - Variables explicativas utilizadas para elaborar un modelo predictivo de la distribución del número de especies de Escarabeidos en la Península Ibérica. Los datos de cada variables se tomaron para cada cuadrícula UTM de 50 km utilizando un modelo digital del terreno, mapas de usos del suelo y mapas climáticos. Para obtener los datos promedios en cada cuadrícula, dicha cartografía se superpuso con un mapa digital de las cuadrículas mediante un Sistema de Información Geográfica. La diversidad de usos del suelo y la diversidad geológica se calcularon mediante el índice de diversidad de Shannon utilizando los valores de todas las categorías de usos del suelo (n=44) y geológicas (n=3). Mediante Modelos Lineares Generalizados se averiguó la significación de las funciones lineales (y=c+bx), cuadráticas (y=c+bx+bx2) o cúbicas (y=c+bx+bx2+bx3) de cada variable a la hora de explicar el número de especies en las 82 cuadrículas UTM bien muestreadas, mostrándose la función elegida en cada caso.
Para elegir el modelo predictivo se examinó primeramente la significación de cada una de las variables ambientales, comprobando si su relación con el número de especies era una función lineal (y = x), cuadrática (y = x+x2) o cúbica (y = x + x2 + x3). La función de la variable ambiental con una mayor capacidad explicativa ingresó en primer lugar en un análisis de regresión por pasos. Una vez incluida esa primera variable, se introdujeron secuencialmente cada una de las restantes variables, eligiendo aquella que mejoraba más el modelo. Una vez incluidas todas las variables ambientales significativas, se examinaron todos los posibles pares de interacciones entre variables. Cada interacción era añadida al modelo hasta entonces resultante y una vez elegida la interacción más significativa, el proceso se repetía hasta que no se encontraba ninguna otra interacción significativa. Por último se añadieron los nueve términos del polinomio de tercer grado de la latitud y la longitud. Tras cada inclusión de una variable significativa (forward), se comprobó si cualquiera de las anteriormente introducidas dejaba de ser significativa (backward). La elaboración completa de un primer modelo final permitió comprobar que algunas cuadrículas poseían valores reales muy superiores a los que predecía la función, mientras que otras poseían valores reales inferiores a los predichos ('outliers'). Se trataba de cuatro cuadrículas ubicadas en los alrededores de Madrid y Barcelona con una gran cantidad de información faunística acumulada y de las tres cuadrículas ubicadas en las Islas Baleares. Ya que utilizar el número de especies observado en estas cuadrículas para predecir la riqueza del resto, podría producir resultados erróneos, se elaboró un nuevo modelo tras eliminar estas 7 cuadrículas. El modelo final permite explicar el 62.4% de la varianza en el número de especies y contiene ocho variables (Tabla 2): altitud máxima, el término cuadrático de la superficie de pastizal, la diversidad de usos del suelo, las interacciones superficie forestal x diversidad geológica, área terrestre x altitud máxima, superficie caliza x diversidad geológica y los términos cuadrático y cúbico de la latitud. Un examen de los residuos del modelo mostró la ausencia de características aberrantes y autocorrelacion. Tabla 2.- Resultados del análisis de regresión múltiple por pasos entre el número de especies de Escarabaeidos en las cuadrículas Ibéricas bien muestreadas (Figura 1) y las variables ambientales y espaciales elegidas (Tabla 1). Se muestran las variables significativas, sus coeficientes y el error en la estima de los mismos.
Aplicando la función predictiva al resto de las cuadrículas ibéricas obtuvimos la distribución del número de especies que se refleja en la Figura 5. Finalmente validamos nuestro modelo elaborando 75 funciones predictivas (una por cada observación) en las que los parámetros de cada ecuación se estimaban utilizando sólo los datos de 74 cuadrículas y la función resultante se aplicaba sobre la cuadrícula excluida (Figura 6).
4.- Los factores históricos y el espacio Las funciones predictivas resultantes producen un mapa de distribución potencial, un mapa que refleja el área con las condiciones ambientales "convenientes" para que se presente esa especie o esa riqueza de especies. Sin embargo, una de las observaciones que alimentan el estudio biogeográfico es que siempre hay un lugar que parece idóneo ambientalmente para una especie, pero que no está habitado por ella (por ejemplo, cada región mediterránea tiene riquezas y especies distintas; Ver Ricklefs & Schluter, 1993). Cuanto mayor es la escala espacial de análisis, más frecuente es este fenómeno debido, lógicamente, a la actuación de factores de carácter único e irrepetible que condicionan la distribución. Se trata de la historia evolutiva propia de cada grupo, de la historia y los avatares propios de cada región y de las características geográficas de la misma. Evidentemente, la importancia de los factores ambientales a la hora de restringir la distribución de las especies es limitada, de modo que elaborar funciones predictivas que únicamente tengan en consideración variables ambientales producirá, generalmente, modelos incompletos. Ello será especialmente cierto cuando la escala espacial de análisis sea amplia, como exige el estudio geográfico de la variación del número de especies. Historia y geografía también juegan y es necesario incluirlas ¿Cómo podemos hacerlo? Si los factores históricos y geográficos ejercen una manifiesta influencia sobre la distribución de las especies y si el efecto de estos factores tiene una expresión espacial, la inclusión de funciones complejas de la latitud y la longitud, puede mejorar la capacidad de predicción de las funciones obtenidas. Veamos un ejemplo. En la Figura 7 se muestra la distribución hipotética de una variable ambiental que decrece en sus valores hacia el sur y hacia el oeste y, a la vez, una distribución hipotética de la riqueza en especies de un taxon que es función de dicha variable ambiental (el número de especies es la raíz cuadrada del valor de la variable ambiental). Supongamos que por causas históricas o geográficas no asociadas a factores ambientales, el número de especies disminuye en el cuadrante noroccidental sombreado (Figura 7A). En este caso, elaborar una función predictiva mediante un análisis de regresión, utilizando sólo la variable ambiental permite explicar el 74,6% de la variación en el número de especies. Sin embargo, si se incluye esa misma variable ambiental junto a los 9 términos del polinomio de tercer grado de la latitud y la longitud, la función predictiva permite explicar el 92,1% de la variación en el número de especies (ver Figura 7). La longitud y la interacción entre la latitud y la longitud2 resultan ser los términos espaciales que mejoran la capacidad explicativa del modelo.
Los factores de carácter único e irrepetible pueden ejercer una profunda influencia sobre la diversidad biológica, sobre todo en aquellos territorios en los que existe una yuxtaposición de táxones con distintas historias evolutivas. Incorporar la componente espacial en estos casos, puede permitir elaborar funciones predictivas más fiables y competentes ya que, generalmente, el efecto de estos factores suele estar delimitado geográficamente. Sin embargo, en el caso de que el espacio posea una alta capacidad explicativa, no se debe atribuir ésta únicamente a factores de tipo histórico o geográfico. En la práctica, resulta difícil discernir si la capacidad explicativa del espacio se debe a factores de este tipo o a alguna otra variable ambiental no considerada (ver Legendre, 1990 y Borcard et al., 1992). Sin embargo, si utilizando diversos tipos de variables ambientales, el espacio todavía posee una apreciable capacidad explicativa es licito sospechar que ésta se deba a factores histórico-geográficos.
Conocer la distribución geográfica del número de especies de un grupo taxonómico cualquiera es una tarea prácticamente inabordable a corto plazo, incluso en aquellos países con una dilatada tradición taxonómica. Esto es especialmente cierto cuando tratamos con algún grupo de insectos y con escalas espaciales geográficas. Ante esta situación, una estrategia recomendable consiste en recopilar la información taxonómica y corológica dispersa en las colecciones y la bibliografía, con el fin de delimitar los territorios insuficientemente muestreados y aquellos en los que el inventario faunístico puede considerarse bien establecido. Cuando, como resultado de este análisis, la información sobre la distribución de las especies es insuficiente, deberá incrementarse el esfuerzo de inventario pero, en este caso, tendremos una valiosa información sobre la ubicación de las zonas a prospectar y sobre el esfuerzo suplementario a realizar. Si, por el contrario, la información biológica es suficiente, pueden aplicarse distintas aproximaciones metodológicas que, dentro de unos límites razonables, son capaces de proporcionar una estima de la diversidad existente en cada unidad espacial analizada, mediante la utilización de diversas variables ambientales. La distribución de la diversidad generada mediante este proceso debe considerarse una primera aproximación. Aproximación que puede y debe validarse y mejorarse paulatinamente mediante la realización de posteriores colectas en distintos territorios.
JORGE M.
LOBO |
|