Analyse Spatiale et Modélisation de Données en SIG

Classé dans Informatique

Écrit le en français avec une taille de 12,41 KB

Fonctions d'Analyse Spatiale

Fonctions Focales

  • Somme focale : Assigne à chaque position de la couche de sortie la somme des valeurs de la variable dans les cellules d'un voisinage défini autour de la position de la couche d'entrée. La couche d'entrée devrait être au minimum de type intervalle et la variable de sortie est une proportion. Elle sert d'étape intermédiaire dans la détermination de la densité locale d'un phénomène.
  • Percentile focal : Assigne à chaque cellule de la couche de sortie le pourcentage de cellules du voisinage, dans la couche d'entrée, ayant une valeur inférieure à la sienne. Les variables ordinales peuvent être appliquées au minimum. Cela permet de localiser les maxima et minima locaux d'une variable.
  • Variété focale : Assigne à chaque cellule de la couche de sortie le nombre de valeurs distinctes de la variable dans son environnement immédiat dans la couche d'entrée. Elle peut être utilisée avec tous les types de variables et s'adapte aux liaisons entre les fonctions de l'environnement immédiat. Elle peut servir à approcher les limites des zones de la couche d'entrée.
  • Percentile focal (bis) : Assigne à chaque cellule d'une couche de sortie le pourcentage de cellules de son environnement immédiat ayant une valeur inférieure à la sienne dans la couche d'entrée. Les données doivent être au moins ordinales, car cela implique une comparaison d'infériorité. Cette fonctionnalité permet de localiser les maxima locaux de la couche d'entrée.
  • Focus proche : Assigne à chaque cellule de la couche de sortie la distance euclidienne vers la cellule la plus proche ayant une valeur non nulle dans la couche d'entrée. La variable de la couche d'entrée peut être de tout type.
  • Voisinage focal : Assigne à chaque cellule de la couche de sortie la valeur de la cellule la plus proche ayant une valeur différente de zéro dans la couche d'entrée. La variable thématique peut appartenir à l'un des quatre types.
  • Insularité focale : Affecte un identifiant unique à chaque groupe de cellules adjacentes ayant la même valeur pour la variable objet dans une seule couche. Il peut y avoir plusieurs groupes de positions contiguës disjoints les uns des autres, mais partageant la même valeur. Les positions de chacun de ces groupes correspondent à la même zone de départ, mais à des zones différentes dans la couche d'arrivée.
  • Gravitation focale : Assigne à chaque position de la couche de sortie la moyenne pondérée des valeurs non nulles de la couche d'entrée, le facteur de pondération étant l'inverse du carré de la distance. Elle s'applique uniquement aux variables numériques (intervalle ou ratio). Elle ne se limite pas aux huit positions adjacentes, s'étendant ainsi à un environnement élargi.

Opérations Locales et Zonales

  • Moyenne locale : Calcule pour chaque cellule de la couche de sortie la moyenne des valeurs de la même cellule à travers les couches d'entrée. Les variables d'entrée doivent être numériques (intervalle minimum) et la couche de sortie est du même type.
  • Maximum local : Calcule pour chaque cellule de la couche de sortie la valeur maximale parmi les couches d'entrée. Les variables d'entrée doivent être ordinales et la couche de sortie est du même type.
  • Mode local : Calcule pour chaque cellule de la couche de sortie la valeur modale (la plus fréquente) parmi les couches d'entrée. Les variables d'entrée doivent être nominales et la couche de sortie est du même type.
  • Dégradé incrémental : Calcule la variation spatiale d'une variable thématique. Cela concerne, dans l'environnement immédiat de chaque cellule, les valeurs explicites de la variable par rapport à la distance au foyer.
  • Somme zonale : Toutes les cellules de chaque groupe dans la couche de sortie reçoivent la valeur résultant de l'addition des valeurs correspondantes de la couche d'entrée.
  • Moyenne zonale : Toutes les cellules de chaque groupe reçoivent la valeur résultant de la moyenne des valeurs de la couche d'entrée. Applicable aux variables d'intervalle ou de ratio (ex: altitudes moyennes).
  • Maximum, minimum et mode zonal : Toutes les cellules de chaque groupe dans la couche de sortie reçoivent la valeur résultant du calcul du maximum, du minimum ou du mode des valeurs du groupe correspondant dans la couche d'entrée.

Types de Variables et Modèles de Données

Types de Variables Thématiques

  • Variables de proportion (Ratio) : Valeurs basées sur une échelle étalonnée avec une origine fixe, où le ratio entre deux valeurs est significatif.
  • Variables d'intervalle : Valeurs basées sur une échelle étalonnée sans origine fixe, où la différence entre deux valeurs est significative.
  • Variables ordinales : Valeurs basées sur des échelles non calibrées, où seule la comparaison de supériorité ou d'infériorité est significative.
  • Variables nominales (Ratings) : Valeurs représentant des qualités plutôt que des quantités, sans rapport avec une échelle numérique.

Théorie des Systèmes d'Information Géographique

Principes des Opérations Zonales et Dictionnaires

La couche de résultats d'une opération zonale garde-t-elle le même nombre de zones que la couche d'entrée ? Le résultat des opérations effectuées avec des données groupées selon des zones peut correspondre à deux ou plusieurs d'entre elles. Ainsi, le nombre de zones en sortie est au plus égal au nombre de zones en entrée, mais peut être inférieur.

Rôle des dictionnaires de données : Ils permettent d'établir et de construire des structures de données pour interpréter adéquatement les fichiers organisés dans un environnement SIG.

Stockage de l'Information Spatiale en Bases Relationnelles

  • Types de données : Chaque colonne et ligne contient la valeur d'une coordonnée. Des tables de points, de lignes ou de polygones peuvent être construites et liées via des relations.
  • Colonnes de type « bitstream » : La séquence complète des coordonnées d'une entité est stockée dans une seule colonne. Cela permet de traiter la position comme un tout sans violer la première forme normale.
  • Polygones fictifs ou lambeaux (slivers) : Ces polygones étroits proviennent de disparités entre des lignes géométriques qui devraient coïncider. Ils apparaissent lors de l'intégration de données de sources différentes ou d'erreurs de numérisation. On les identifie par un seuil sur le ratio entre leur superficie et le carré de leur périmètre.

Opérateurs et Indexation

Définition de l'opérateur spatial de base : Un opérateur spatial est élémentaire s'il appartient à un ensemble complet et minimal ; pour toute localisation spatiale, il existe un et un seul opérateur s'y appliquant.

Index géométrique : Basé sur un revêtement de cellules (grille), il associe les identifiants des cellules aux entités spatiales (géométries, primitives) pour accélérer la localisation de points, de zones ou les relations spatiales.

Algorithmes et primitives topologiques : Les opérateurs spatiaux discriminants se basent sur les ensembles d'entités primitives et le nombre de résultats issus des transactions entre ces ensembles.

Entités composées : Groupes d'entités simples ou composites (récursivité). Utilisées pour représenter des objets géométriques complexes, des entités à géométries multiples ou des entités partageant des attributs constants et variables.

Gestion des Bases de Données Relationnelles

Unités de Données et Manipulation

L'unité minimale pouvant être mise à jour ou sélectionnée est la colonne (sans violer la première forme normale). L'unité minimale pouvant être insérée ou supprimée est la ligne, car la cardinalité doit rester cohérente pour toutes les colonnes.

Modèle Entité-Relation (E-R)

  • Entité : Représentation d'un phénomène réel.
  • Attribut : Propriété d'une entité.
  • Domaine : Ensemble des valeurs possibles pour un attribut.
  • Relation : Association entre entités.
  • Classe d'entité : Ensemble d'entités de même nature.

Représentation : Chaque classe est une table, chaque entité est une ligne, et chaque attribut est une colonne. Les relations 1:1 ou 1:N sont des liens directs (clés étrangères), tandis que les relations N:N utilisent une table de jonction.

Formes Normales

  • Première forme normale (1NF) : Pas de lignes en double, valeurs atomiques (indivisibles), et indifférence à l'ordre des lignes/colonnes.
  • Deuxième forme normale (2NF) : En 1NF + dépendance fonctionnelle complète des colonnes non-clés envers la clé primaire.
  • Troisième forme normale (3NF) : En 2NF + absence de dépendances transitives.
  • Forme normale de Boyce-Codd (BCNF) : En 3NF + chaque déterminant doit être une clé candidate.

Intégration et Harmonisation des Données

Processus d'Intégration

L'intégration implique la conversion de formats, l'unification des classifications et la gestion de la densité des points lors des projections. Les transformations de systèmes de projection (cartographique, ellipsoïde, datum) sont non linéaires.

Harmonisation et Détection d'Erreurs

L'harmonisation fusionne les représentations multiples d'une même entité. Elle peut être verticale (données superposées) ou horizontale (ajustement des frontières entre régions adjacentes).

Détection d'erreurs géométriques :

  • Espace commun : Comparaison de l'intersection et de l'union des zones.
  • Rapport d'allongement : Comparaison du ratio [Zone / périmètre²], qui doit être proche de 1 pour des formes régulières.
  • Écart linéaire : Distance maximale autorisée entre les périmètres.

Critères de fusion horizontale : Angle de déviation maximal, distance maximale entre extrémités et longueur minimale des segments.

Modèles Vectoriels et Raster

Topologie du Modèle Vectoriel

Au niveau zéro, les données de position sont des propriétés directes des entités, ce qui entraîne des duplications et des incohérences. Aux niveaux supérieurs, les données sont associées à des primitives (nœuds, arcs) partagées, évitant les chevauchements inutiles.

Orientation des colonnes : Utilisée dans les tables arc-ligne et arc-face pour garantir la cohérence du parcours des limites (sens horaire pour l'extérieur, anti-horaire pour l'intérieur).

Importance du Remplissage en Modèle Raster

Pourquoi enregistrer des valeurs dans toutes les cellules ? Dans le modèle raster, la distribution spatiale est déduite de la séquence ordonnée des cellules. Omettre une valeur rendrait l'inférence de localisation impossible. Chaque position doit donc avoir une valeur, même nulle.

Environnements SIG

  • Environnement unité sur fichier : Utilise des dictionnaires. Inconvénients : gestion manuelle des fichiers, conflits d'accès simultanés, limites de taille du système d'exploitation.
  • Environnement unité sur base de données : Résout les problèmes de gestion mais peut souffrir de dégradations de performance si le volume de données spatiales est trop important.
  • Environnement hybride : Les données de position sont dans des fichiers (traitement graphique rapide) et les données descriptives sont dans des tables relationnelles.

Entrées associées :