Oposiciones TIC: Sistemas de Información Geográfica

Introducción a los Sistemas de Información Geográfica. Clasificación de los SIG.

Introducción a los sistemas de información geográfica.

Introducción a los Sistemas de Información Geográfica. Clasificación de los SIG.

Modelado de datos en los SIG.

Los Sistemas de Información Geográfica manejan datos geográficos en formato digital procedentes de la discretización de modelos de información continua. Estos modelos de información continua constituyen el denominado formato analógico. Un claro ejemplo de información geográfica en formato analógico es el mapa tradicional en soporte papel. Una imagen aérea obtenida con una cámara fotográfica analógica, la voz humana, o el sonido directo de un instrumento son otros ejemplos de información analógica.

La teoría de muestreo y los principios de discretización permiten obtener modelos discretos de la información continua cuyo resultado será el formato digital, apto para ser procesados por sistemas informáticos de información geográfica. La imagen captada por un satélite, el plano de
una ciudad representado en Google Earth, un fichero de música en formato MP3 son ejemplos de información discreta en formato digital.

El problema de la conversión analógico/digital de la información geográfica se centra en la representación de la componente espacial de los datos. La correcta representación digital de los datos espaciales necesita la resolución de dos cuestiones: la geocodificación de los datos y la
descripción en términos digitales de las características espaciales. La geocodificación de los datos consiste en un procedimiento mediante el cual un objeto geográfico recibe directa o indirectamente una etiqueta que identifica su posición espacial con respecto a algún punto común o marco de referencia.

En segundo lugar se debe realizar una descripción de la posición geométrica de cada objeto y de las relaciones espaciales (topología) que mantiene con los restantes objetos geográficos existentes. Esta descripción se lleva a cabo mediante la abstracción o simplificación de todas las entidades existentes, creando un modelo de datos de los objetos a representar digitalmente. Un modelo de datos es, por lo tanto, “un conjunto de directrices para la representación lógica de los datos en una base de datos, consistente en los nombres de las unidades lógicas de los datos y de las relaciones entre ellos”, en definitiva, “una abstracción del mundo real que incorpora sólo aquellas propiedades que son relevantes a la aplicación de interés en cada caso”.

Existen varios tipos de modelos digitales de datos geográficos: el modelo vectorial, el modelo ráster y el jerárquico recursivo. Todos ellos son perfectamente válidos para la representación de los mapas planos formados por puntos, líneas y áreas, pero cada uno encaja mejor en una tarea concreta. Unos resultan más útiles para el análisis de los datos espaciales y otros para la cartografía de la información espacial. El modelo vectorial está formado por un conjunto de coordenadas y el modelo ráster por imágenes digitales. Ambos sistemas son complementarios y desempeñan papeles específicos e intercambiables.

El modelo vectorial.

Conceptos generales.

El modelo vectorial representa los elementos espaciales mediante la codificando explícita del límite o perímetro que separa el elemento de su entorno. Las líneas que definen esta frontera se representan vectorialmente mediante las coordenadas de los puntos o vértices que delimitan los segmentos rectos que las forman.

En la representación vectorial los elementos puntuales se representan mediante el par de coordenadas (X,Y) que definen su posición. Los elementos lineales se representan mediante las coordenadas (X,Y) de los vértices donde se cortan los segmentos lineales que se aproximan a la forma del elemento. Por último, los elementos superficiales se codifican mediante las coordenadas (X,Y) de los vértices donde se cortan los segmentos lineales que formando un recinto cerrado se aproximan a la forma poligonal del elemento.

Según esto, en la representación vectorial el segmento lineal es el elemento esencial siendo capaz de constituir cualquier tipo de objeto espacial. El segmento lineal queda delimitado por dos vértices, codificándose por las coordenadas (X,Y) de sendos vértices. El elemento puntual
es un caso concreto de segmento lineal de longitud cero que empieza y termina en el mismo vértice.

Estructura de datos en el modelo vectorial

Existen diferentes estructuras de datos que se ajustan al modelo vectorial definido anteriormente. Se puede diferenciar entre estructuras que no recogen la topología: espagueti, diccionario de vértices y las que permiten conocer la relación topológica de los elementos geométricos: ficheros DIME, modelo cadena/nodo, modelo en red.

Las más importantes son: la lista de coordenadas o estructura espagueti, el diccionarios de vértices, la organización DIME y la estructura arco/nodo.

Espagueti: Lista de coordenadas

Esta estructura almacena únicamente las coordenadas que definen la entidad. De cada elemento geográfico existente se registra su nombre, el número de vértices que definen su frontera y las coordenadas (X,Y) de cada vértice. Los elementos puntuales están formados por un único
vértice. En los elementos superficiales el primer y el último vértice son exactamente el mismo punto, indicando que se trata de una figura poligonal cerrada.
Esta estructura es la manera más sencilla y directa de estructurar datos geográficos en formato vectorial, pero presenta serias desventajas, registra la geometría espacial del objeto pero no su topología, despreciando la relación del elemento con los objetos que le rodean. Otra de las
desventajas es la duplicidad innecesaria de datos (vértices) con el riesgo de que el mismo vértice sea registrado de forma diferente en cada segmento recto al que pertenezca, provocando problemas en la representación gráfica y visual de los datos espaciales.

Diccionario de Vértices

Esta estructura mejora la lista de vértices registrando una sola vez las coordenadas de cada vértice, cada uno de los cuales ha sido previamente identificado con un nombre o etiqueta. En primer lugar se crea un listado de coordenadas de vértices en el que figuran el nombre o etiqueta del vértice y las coordenadas (X,Y) de su localización. A continuación se crea el diccionario de vértices que constituyen cada objeto espacial identificable en el mapa.

Esta estructura elimina los problemas causados por la duplicidad de los vértices pero la topología sigue sin estar suficientemente detallada.

Topología. Conceptos.

Una de las ventajas de los modelos vectoriales es la capacidad de almacenar, además de la información geométrica de las entidades, la topología y sus relaciones entre dichas entidades. Las estructuras de almacenamiento de información vectorial hasta ahora descritas no son
capaces de conservar la información topológica. Los modelos que a continuación se detallan estructuran la información geométrica de tal manera que añaden detalles topológicos de los elementos.

La topología es una rama de las Matemáticas, quizá la más reciente datada en el S.XVII, que analiza la posición de objetos, ocupándose de aquellas propiedades de las figuras que permanecen invariantes, cuando dichas figuras son plegadas, dilatadas, contraídas o deformadas, de modo que no aparezcan nuevos puntos, o se hagan coincidir puntos diferentes. Si la rama de la geometría se fija en distancias, ángulos, volúmenes; la topología se centra en proximidad, agujeros, intersecciones, etc. En términos topológicos, una elipse es igual a una circunferencia, un cubo a una esfera y una taza de café a un toro.

Un ejemplo muy claro de topología es el plano de una red de metro en el que hay elementos puntuales (estaciones) y elementos lineales (líneas de metro) que unen las estaciones. Pero esa representación no es geométricamente exacta, no conserva la forma real de las líneas con sus curvas, su longitud a escala ni tan siquiera la posición relativa de las estaciones. En cambio, el plano resulta muy útil y ofrece con exactitud la información que solicitada: la información topológica que mantiene intactos las estaciones y las líneas. Este ejemplo topológico está relacionado con la teoría de grafos y los modelos en red, constituidos por nodos, bordes y caras.

Ficheros DIME (Dual Independent Map Encoding)

La estructura vectorial de ficheros DIME recoge completamente la topología de los datos. Su utilidad principal es la de representar polígono. Se crea un listado de coordenadas de vértices con el nombre de cada vértice y sus coordenadas (X,Y) exactamente igual que en el Diccionario
de Vértices. Seguidamente se define la descripción de los segmentos rectos donde se codifican los segmentos lineales indicando el nombre del segmento, el vértice origen, el vértice final, el polígono que tiene a la izquierda y el polígono que tiene a la derecha. Por último, se genera la descripción de los polígonos codificando los polígonos mediante su nombre y los segmentos rectos que los componen.
Esta estructura recoge todos los elementos topológicos. Es posible averiguar con facilidad qué líneas conectadas, qué segmentos delimitan un polígono, qué polígonos son contiguos, etc.

Modelo cadena/nodo

La estructura de ficheros DIME se adapta perfectamente al registro de entidades espaciales geográficas de carácter artificial (límites administrativos, parcelas, etc.) cuya forma original se puede descomponer en un conjunto de segmentos rectos sin perder el aspecto del elemento geográfico.

La complejidad aumenta al codificar los fenómenos naturales (ríos, suelos, vegetación, etc.). El aspecto físico de estos fenómenos requiere una enorme cantidad de segmentos que dificultan la descripción topológica completa. Este problema se resuelve empleando la estructura cadena/nodo, en la cual el elemento base ya no es el segmento recto, si no la “cadena/nodo” o “arco/nodo” formado por la sucesión de todos aquellos segmentos rectos que tienen la misma topología. Un segundo elemento fundamental es el “nodo”, vértice en el que se cruzan tres o
más arcos o punto terminal de una línea o arco.
La estructura cadena/nodo está compuesta del listado de coordenadas de los puntos, tanto nodos como vértices de cada arco. En este listado figura el nombre del arco, las coordenadas del nodo origen, de los vértices intermedios, si los hubiera, y del nodo final. A continuación tres ficheros definen la topología de los elementos geográficos. Un fichero de topología de arcos donde se codifican los arcos mediante su nombre, el nombre del nodo origen, el del nodo final, el polígono que se encuentra a su izquierda y el polígono que se encuentra a su derecha. Otro fichero recoge la topología de polígonos que codifica los polígonos mediante su nombre y los arcos que lo componen. Por último la topología de los nodos codifica los nodos mediante el nombre del nodo y los arcos que en él confluyen.

Modelos en red

La topología se encuentra íntimamente ligada a la teoría de grafos. La teoría de grafos estudia las propiedades de los grafos, que son colecciones de objetos llamados vértices (nodos) conectados por líneas (arcos) que pueden tener orientación (dirección asignada). Típicamente, un grafo está diseñado por una serie de puntos (vértices) conectados por líneas (aristas).

Existen dos tipos de estructura de datos que describen un grafo:

Estructura de lista
1. De incidencia: La líneas se representan con un vector de pares (ordenados, si el grafo es dirigido) de nodos que conecta esa línea.
2. De adyacencia: Cada vértice tiene una lista de vértices adyacentes a él.
Estructura matricial:
1. De incidencia: Matriz de A (aristas) x V (vértices) donde el elemento [a x n] vale 0 o 1 indicando si hay o no conexión.
2. De adyacencia: Matriz cuadrada M x M (número de vértices). Si entre el vértice x e y hubiera una arista, el valor del elemento mx,y sería 1, 0 en caso contrario.

En cuanto a su representación, existen grafos planares y no planares. Los grafos planares son aquellos que se pueden dibujar sin que dos segmentos se crucen. No es fácil establecer que grafo es plano, y tiene que ver con la topología.

Un problema de grafos y de topología es el problema de los puentes de Konigsberg. Esta ciudad rusa tiene 7 puentes para salvar los dos brazos de un río que rodean a una isla (ver figura).

El problema consiste en localizar que trayectoria atraviesa los 7 puentes pasando solo una vez por cada uno de ellos. Euler demostró el porqué de la imposibilidad de resolver este problema.

Modelo espacial ISO

La normativa ISO que afecta a la estandarización de información geográfica vectorial y topología viene dada principalmente por las normas ISO19107 (esquemas espaciales), ISO19136 (GML) e ISO19137 (núcleos de perfiles de esquemas espaciales). La relativa a
imágenes, coberturas y datos ráster viene dada por las normas ISO19123 (esquema para coberturas), ISO19129 (marco de trabajo), ISO19130 (sensores y modelos de datos).

Los datos vectoriales definidos en ISO19107 se caracterizan por ser tridimensionales, estar formados por primitivas simples y/o complejas y mantener relaciones topológicas. Las primitivas geométricas fundamentales que define la norma son: el punto, la curva, la superficie y el sólido.

Cabe mencionar que todas estas normas son "adopciones" de ISO de las normas OGC (Open Geospatial Consortium, principal organismo de normalización en materia SIG).

El modelo raster.

Conceptos Generales

El modelo ráster, a diferencia del modelo vectorial, codifica el interior de los objetos geográficos registrando implícitamente la frontera del elemento. Esta codificación se consigue superponiendo al mapa analógico original una rejilla de unidades regulares, de igual forma y
tamaño. En cada unidad de la rejilla se registra el valor que el mapa analógico o vectorial adopta. La rejilla puede estar formada por tres tipos de figuras geométricas elementales: cuadrados (rectángulos), triángulos regulares o hexágonos.

Un parámetro fundamental en la rejilla cuadrada, la más utilizada de las tres, es la longitud de los lados de la cuadricula base o “píxel”, cuanto más pequeña sea más precisa será la representación digital del mapa. La longitud del píxel en unidades del terreno nos proporciona la
escala del mapa ráster generado.

El modelo ráster establece el origen de coordenadas (0,0) en la esquina superior izquierda del mapa. La razón de este origen se encuentra en la manera de trabajar de muchos equipos usados en la captura y tratamiento de datos ráster: scanner, sensores espaciales, impresoras, etc. El establecimiento del origen de coordenadas y la regularidad de la rejilla permiten recoger la topología del mapa ráster. De esta manera es posible conocer cuales son los vecinos de una celda de la rejilla.

Estructuras de datos en el modelo ráster

Como sucede con el modelo vectorial, el modelo ráster permite establecer varias estructuras de datos. Las diferencias entre ellas estriban en la manera de almacenar la información registrada en este modelo de datos.

Estructura sin compresión. Enumeración Exhaustiva

El valor de cada una de las unidades de la rejilla se registra individualmente. Esta estructura redunda información de manera innecesaria almacenando una gran cantidad de información. El mismo valor numérico aparece en píxeles contiguos.

Estructuras con compresión.

En un mapa ráster es habitual que la información digital de un pixel se repita en pixeles contiguos. Esta situación permite compactar el almacenamiento de esa información reduciendo considerablemente el tamaño de fichero original. A continuación se exponen estructuras de almacenamientos que haces uso de esta técnica de compactación.

Codificación Chain Code.

Método ideado para la codificación de elementos superficiales y regiones compactas irregulares. Las fronteras de las diferentes regiones se codifican partiendo de un origen y una secuencia de vectores unitarios en las direcciones cardinales. Estas direcciones se numeran (Este=0, Norte=1, Oeste=2, Sur=3) y a continuación se recorre la región partiendo del punto origen en el sentido de las agujas del reloj. Cada dirección (0,1,2,3) va acompañada de un superíndice que indica el número de pixeles frontera en esa dirección.

Codificación Run-Length.

Este sistema recoge en cada fila el valor temático existente en el pixel y el número de columnas en las que se va repitiendo. Se parte del primer pixel (columna 1) y se indica su valor y el número total de columnas en las que se repite recorriendo la fila hacia la derecha. A
continuación se pasa al siguiente valor, y así sucesivamente hasta completar la fila. La compactación del método run-lenght mejora considerablemente el almacenamiento de la información ráster, especialmente en aquellos casos en los que el volumen total de datos
suponga una limitación del sistema. Por otro lado, se precisan realizar procesos que descompriman la información ralentizando el tratamiento de información cartográfica.
Es un método idóneo para trabajos con áreas extensas y uniformes. En cambio no resulta útil para la codificación de fenómenos con variaciones continuas en las que cada pixel contiene un valor único y diferente a sus contiguos.

Estructura lineal comprimida de sentido único

La codificación “Run-Length” requiere realizar un barrido de la imagen línea a línea para comprimir/descomprimir la información del fichero ráster. La modificación que ofrece la compresión lineal de sentido único permite empalmar los valores finales de una línea con la
siguiente, todo ello representado en una única línea. Cuando se produce ese caso, se reduce considerablemente el tamaño del fichero.

Estructura lineal comprimida de doble sentido o en greca

Similar a la codificación “Run-Length” pero en este caso la imagen se barre enlazando el final de la primera línea con el final de la segunda y se avanza hacia el inicio de ésta. Posteriormente se enlaza con el inicio de la tercera y se avanza hacia su final para enlazar con el final de la
cuarta, y así sucesivamente. Este método no provoca saltos temáticos al pasar de una línea a la otra ampliando la capacidad de compactación.

Ordenación N de Morton.

Se realiza un barrido de la imagen mediante la secuencia de la figura 8 aumentando la correlación espacial entre pequeñas áreas contiguas de la imagen y haciendo mínima el tamaño de almacenamiento. La secuencia de exploración minimiza el número de saltos y la dota de una
estructura de ordenación jerárquica. Esta ordenación es aplicable únicamente en imágenes ráster cuadradas de tamaño N, potencia de 2.

Estructura Hilbert

En este caso la imagen se barre mediante la curva de Hilbert, cuya numeración se muestra en la siguiente figura.

Codificación por Bloques

El método run-length codifica los datos en una única dimensión a nivel de fila. Esta idea se puede extender a las dos dimensiones del ráster, fila y columna, descomponiendo la matriz original en bloques cuadrados. La estructura de datos consta de 3 números, el origen del
cuadrado expresado a través del par de coordenadas de uno de sus píxeles (el central o el inferior izquierdo) y el radio del bloque cuadrado.

Árboles binarios y Quadtrees

Los métodos de compactación más efectivos para ficheros ráster con información geográfica están basados en la sucesiva división jerárquica del espacio en 2n x2n regiones. Si la división se realiza dividiendo el área por la mitad, se denomina árbol binario. Si la división se realiza en cuadrantes y se observa que cada cuadrante pertenece a la misma región, se denomina quadtree, siendo el método más utilizado.

Un quadtree es una estructura en árbol en el que cada nodo interior puede tener hasta cuatro hijos (hojas según la terminología de las estructuras de datos arbóreas). Las regiones de subdivisión del quadtree pueden ser rectangulares, o pueden tener cualquier otra forma.

La estructura quadtree presenta ventajas respecto a otras estructuras, agiliza cálculos sobre las zonas, ofrecen una resolución variable representando únicamente aquellos detalles característicos de dicha resolución y permite separar zonas e incluir agujeros. Este método es
variante en la traslación siendo un problema característico de estas estructuras, es decir, dos áreas con la misma forma y el mismo tamaño pueden tener árboles quadtree diferentes haciendo. Este inconveniente provoca que análisis de forma y correlaciones de patrones sean
procesos irreversibles, especialmente en áreas que presentas continuos cambios en el tiempo.

Ventajas e inconvenientes de los modelos vector/ráster.

Comparando ambos métodos de representación digital de datos geográficos se extraen una serie de ventajas y desventajas entre ellos.

El modelo vectorial necesita menos espacio de almacenamiento que la técnica ráster mediante altas tasas de compactación. La representación de las entidades geográficas es más precisa sobre todo en las entidades lineal muy pequeño o entidades puntuales. También permite medir
distancias, superficies y volúmenes con alto grado de precisión. Soporta la descripción topológica de las entidades permitiendo el análisis de redes. Es posible aplicar transformaciones de coordinas y cambio de datum con facilidad. Además soporta la actualización, la búsqueda y
la generalización de entidades.

Las desventajas del modelo vectorial son el elevado consumo de recursos durante la visualización y la impresión de la información, especialmente en alta resolución, el análisis espacial es más lento, la captura vectorial de datos requiere más medios y más tiempo, además
de la complejidad de la estructura de los datos.

El modelo ráster presenta estructura de datos simples, la localización y manipulación de valores temáticos concretos es más sencilla, soporta análisis espaciales y filtros específicos, todos los elementos tienen la misma forma elemental y regular (el píxel) facilitando el modelado
matemático. Además la tecnología es más barata.

Su principal desventaja es el volumen de información que aumenta considerablemente si se quiere obtener una representación muy precisa. El uso de celdas de mayor tamaño reduce el tamaño de los ficheros suponiendo una pérdida de resolución espacial y de información.
Tampoco reconoce el explícitamente la existencia de objetos geográficos, limitando las operaciones de medición de distancias y superficies. Cualquier transformación de coordenadas consume muchos recursos cuyos resultados provocan distorsiones en los píxeles.

Orientación a Objetos

Los principios de la orientación a objetos son plenamente aplicables al modelo de la información geográfica de un SIG. El concepto de objeto cubre perfectamente las características espaciales del dato, siendo su geometría una propiedad más de los objetos modelados.

Estándares SIG y SIG distribuídos: Infraestructuras de datos espaciales (IDE).

Las Infraestructuras de Datos Espaciales

Metodología de los proyectos SIG.

Metodología de los proyectos SIG

Aplicaciones práctivas de los SIG

Campos de aplicación de los Sistemas de Información Geográfica

Referencias bibliográficas.

Bourrough, P. A.“Principles of Geographical Information System for Land Resources Assesment” 1986, OXFORD SCIENCE PUBLICATIONS (UK) 1ª edición.
Bernhardsen, Tor “Geographical Information Systems” TOR BERNHARDSEN 1992, VIAK IT (Noruega).
Longley, P. A., M.F. Goodchild, D.J. Maguire y D.W.Rhind. “Geographic Information Systems and Science”, 2001, JOHN WILEY and SONS.
NCGIA Core Curriculum in GIS Science
GISWiki
Bosque Sendra, J. (1992) Sistemas de Información Geográfica. Ediciones Rialp. ISBN 84-321-2922-4
Goodchild, M.F. (1984) Geocoding and Geosampling. Spatials Statistics and models.
Goodchild, M.F., Maguire, D. y otros (2001) Geographic Information Systems and Science. Editorial Wisley. ISBN 0-471-89275-0
Moldes Teo, F.J. (1995) Tecnología de los Sistemas de Información Geográfica. Editorial Ra-Ma. ISBN 84-7897-164-5
Burrough, P.A., McDonnell, R.A. (2000). Principles of Geographical Information Systems. Editorial Oxford. ISBN 0-19-823366-3
Kresse, W, Fadaie, Kian. (2004). ISO Standards for Geographic Information. Editorial Springer. ISBN 3-540-20130-0

Si te ha gustado esta entrada, suscríbete para recibir las próximas entradas por correo electrónico. Por favor, apoya este blog.

Oposiciones TIC

Pages - Menu

Sistemas de Información Geográfica