Sites


Guide du SIG libre

01 Notions centrales de la géomatique et du libre

Projet Espace OpenStreetMap Francophone

v1.0, 18/12/2014

88x31.png

Publié sous licence Creative Commons Attribution-ShareAlike 3.0 Unported License

Paternité (BY) - Partage des Conditions Initiales à l'Identique (SA)

http://creativecommons.org/licenses/by-sa/3.0/



L’information géographique et les outils associés s’appuient sur des concepts et des disciplines parfois complexes qu’il est nécessaire de maîtriser si l’on souhaite s’engager vraiment dans ce champ à un niveau scientifique ou professionnel. Ils font l’objet d’une documentation riche et abondante, mais qui d’expérience présente le travers, soit d’expliquer ces concepts de manière trop succincte, soit de le faire de manière très détaillée à destination des experts ou futurs experts du champ, ce qui limite leur maîtrise effective au-delà des non-spécialistes, qu’il s’agisse parfois même des professionnels ou des étudiants du champ. Ce chapitre ambitionne d’exposer ces concepts de manière simple, mais avec le niveau de détail nécessaire à une pleine maîtrise.

Information géographique et géomatique

Héritière de la cartographie, la géomatique regroupe l'ensemble des sciences et techniques de manipulation de l'information géographique numérique sous quelque forme que ce soit. La géomatique comprend l'ensemble des techniques et théories traitant de l'information géographique et plus généralement de l'information comprenant une référence spatiale.

 

Elle a pour objet de produire et mettre à disposition les théories et techniques permettant de :

  • collecter (acquisition de données),

  • emmagasiner et cataloguer,

  • traiter et analyser,

  • représenter et modéliser,

  • partager l'information géographique.

 

Par extension, les applications mettant en oeuvre ces théories et techniques sont aussi considérées comme appartenant au champ de la géomatique, quel que soit leur domaine thématique.

Des domaines aussi variés que l'analyse spatiale, la télédétection, la cartographie, la topographie, voire la gestion de bases de données, les statistiques, la sémiologie, les sciences de l'information, la modélisation et le web sémantique (dans leur composante spatiale) peuvent donc être considérés comme faisant partie de la géomatique.

La géomatique permet de donner sens au monde tel qu'il nous est donné (data) de le voir en abordant les processus menant de la donnée à l'information spatialement référencée via différents systèmes, canaux ou capteurs (capta) : on obtient alors de la donnée spatialisée filtrée, structurée, thématique. Celle-ci peut ensuite être analysée, modélisée, schématisée, simplifiée pour être rendue intelligible (information), puis communiquée, partagée et informer des décisions et actions.

Données géographiques et leurs composantes

Les données géographiques comportent plusieurs composantes :

  • une composante géométrique, spatiale (les contours de l'objet ou du phénomène cartographié)

  • une partie non spatiale, dite sémantique (grandeur, éléments de description ou attributs caractéristiques de l'objet ou du phénomène).

 

À ces deux composantes constituant le coeur de la donnée doivent normalement s'ajouter des éléments descriptifs de deux ordres :

  • une représentation de la donnée et son descriptif (légende, stylage)

  • un ensemble d'informations complémentaires sur la donnée (métadonnées)

 

Les objets ou phénomènes peuvent interagir spatialement (relations topologiques), sémantiquement (réseau sémantique) ou causalement (historique).

 

Ces données géographiques peuvent être représentées (codées) de deux façons privilégiées, suivant la nature de la réalité géographique à décrire (suivant la question à laquelle les données permettent de répondre). Schématiquement :

  • qu'est-ce que j'ai ici ? quoi ? (ou qui ?), où ? (localisation, objet) : l'objet ou le phénomène est soit présent à un endroit donné, soit il n'y est pas. On aura alors naturellement recours à une représentation vectorielle (données vecteur), c'est-à-dire des points, lignes et/ou surfaces (polygones) pour représenter l'extension spatiale des objets. Ces données spatiales vectorielles représentent des données dites de base (ou encore "de référence" car provenant de référentiels géomatiques comme le RGE-Référentiel à Grande Échelle français maintenu par l'Institut Géographique National dont sont dérivés des produits cartographiques à différentes échelles, parmi lesquels la fameuse série au 1/25 000 des cartes 'Top 25') ou des données dites thématiques portant sur des thèmes d'activité humaine (transports, services aux populations). Des fichiers GPS de points d'intérêt ou d'enregistrement d'itinéraires constitués par des travailleurs humanitaires, des bases de données géoréférencées de lieux de peuplement ou de services de santé constituent des exemples concrets de l'information géographique en mode vecteur.

  • combien de… ai-je en tout lieu de l'espace géographique ? On ne fait plus référence à des objets, mais à un champ de valeurs qui remplissent tout ou partie de l'espace géographique. La représentation sous forme d'une matrice ou grille de valeurs recouvrant l'espace géographique (données raster) est alors préférée. Les données spatiales brutes dites raster (ou encore image) sont intensément utilisées en géomatique appliquée à l'humanitaire et au développement pour représenter des phénomèmes continus dans l'espace, comme les images satellites, les photos aériennes (par avion ou par drones), des documents cartographiques géo-référencés ou des modélisations de l'altitude, des températures ou encore des précipitations en tout point. Loin d'être utilisées de façon compartimentée, information thématique, information géographique en mode vectoriel de type carte de base ou carte thématique et information géographique en mode raster sont souvent associées. Les SIG sont des systèmes d'information capables de mettre en pratique les concepts de la géomatique, en permettant la création, l'organisation et l'analyse des informations à référence spatiale classées sous formes de couches et sauvegardées dans des bases de données spatiales.

 

D'autres questionnement spatiaux peuvent aussi être envisagés :

  • quand ? Celle-ci peut être abordé via la table attributaire (champ date), les métadonnées associées, ou via une série temporelle.

  • comment ? C'est en particulier grâce aux outils d'analyse spatiale qu'on peut y répondre.

Référence spatiale

Les objets décrits dans une base de données géographique ont une composante spatiale aussi appelée géométrie. Pour représenter ces géométries, il faut pouvoir les repérer convenablement dans l'espace géographique. Plusieurs possibilités existent. Le géocodage consiste à attribuer des adresses (des codes) aux différentes parties de l'espace géographique et d'utiliser ces codes pour localiser les objets. Cela nécessite de conserver un document indiquant quelle partie de l'espace a reçu quel code. Ce document sert de référence spatiale.

Une autre méthode consiste à convenir d'un système de coordonnée permettant d'attribuer de façon univoque un ensemble de coordonnées pour tout point de l'espace géographique. Un système de référence spatial possède une origine (où les coordonnées ont une valeur égale à zéro), une norme (unité de distance et/ou d'angle), et une direction (axe à partir duquel sont décomptés les angles ou les distances). Un système de coordonnée peut être géographique (représentation sur le globe terrestre, c'est-à-dire sur la surface d'un géoïde/ellipsoïde/sphère) ou projeté (représentation plane de la donnée, carte). On parle alors de projection.

Géodésie et Systèmes de Coordonnées de Référence

La notion de système de référence géographique et de projection est au coeur de la cartographie et des Systèmes d'Information Géographique (SIG). Il est indispensable d'en connaître les principales notions pour pouvoir travailler avec des couches de données géographiques dans QGIS.

Les paragraphes qui suivent présentent de façon synthétique ces éléments fondamentaux et renvoient à des sources plus complètes pour ceux qui désireraient en savoir plus.

Formuler la complexité de la surface de la Terre sous une formule mathématique pour pouvoir la représenter et la calculer - la géodésie

La représentation de la terre s’appuie sur les travaux de la géodésie, la science qui mesure et représente la surface terrestre et ses champs de pesanteur. On le sait, la Terre n’est pas une sphère parfaite : elle est globalement un peu aplatie sur ses pôles et possède une surface très irrégulière avec des variations d’altitude variant d'environ 10 km vers le Haut (Himalaya) et le bas (fosses océaniques, notamment celle des Mariannes dans l’océan Pacifique). Elle ne se prête donc pas du tout à une description mathématique.

La représentation mathématique la plus précise de la surface terrestre est un géoïde, qui correspond à une surface en trois dimensions qui intersecte en tout point à angle droit la direction de la pesanteur. Cette surface est en fait très proche de la surface des océans et des mers, qui est contrôlée essentiellement par les champs de pesanteur de la Terre, que marées, courants marins, variations de salinité, houle créée par les vents ou variations de la pression atmosphérique ne font que perturber. Le niveau moyen des mers (MSL pour Mean Sea Level en anglais) est donc très proche de la surface du géoïde.  La précision du géoïde est de l’ordre du centimètre dans les zones océaniques, de l’ordre du décimètre pour les terres émergées. L’altitude exprime l’éloignement d’un point par rapport à la surface du géoïde, qui sert donc d'altitude zéro pour des mesures précises.

 

730px-Geoida.svg.png

1. Océan — 2. Ellipsoïde — 3. Déformation locale — 4. Continent — 5. Géoïde

 

Cependant, le géoïde est une surface très complexe qu'il est difficile d’intégrer dans des calculs. Pour ceux ne nécessitant pas une très grande précision, le géoïde est remplacé par une ellipsoïde de révolution (parfois appelée sphéroïde), dont la définition mathématique est plus simple, mais qui est forcément moins proche de la surface réelle de la Terre qu'un géoïde. C'est ce que montre bien l'illustration ci-dessus, dans laquelle l'ellipsoïde est représentée par un trait vert en pointillés qui est moins proche de la réalité que le géoïde qui suit de près le niveau moyen des mers.

Une ellipsoïde est définie par la longueur de son plus grand demi-axe (a) et un coefficient d'aplatissement qui détermine la longueur du demi-axe le plus petit (b).

ellipsoid_icsm_gov_au_datum.jpg

Plusieurs ellipsoïdes ont été définies au cours du temps et certaines sont toujours en usage, parmi lesquelles Clarke 1880, NAD83 (North American Datum 1983) ou WGS84 (World Geodetic System 1984) ; cette dernière est devenue le système géodésique standard mondial pour la cartographie et le système GPS.

Pour pouvoir être utilisée en géodésie, il est nécessaire d'adjoindre deux paramètres à une ellipsoïde : la position de son centre (O) par rapport au centre de masse de la Terre (l'écart varie de quelques centimètres à plus d'une centaine de mètres) et l'orientation de ses axes (Ox, Oy, Oz). L'ensemble constitue un système ou datum géodésique.

Représenter la Terre sur une surface plane - les projections

Cette représentation mathématique de la Terre est encore en trois dimensions. Si l'on désire représenter le globe ou l'une de ses parties sur une surface plane - ce qu'est une carte - il faut procéder à une projection géométrique.

A la différence de la formulation mathématique de la Terre en trois dimensions où, grâce aux progrès de la géodésie, géoïdes et sphéroïdes sont de plus en plus précis, la représentation du globe en seulement deux dimensions ne peut parvenir à un résultat présentant une exactitude d'ensemble comparable. Pour en faire l'expérience, une démonstration classique est d'éplucher soigneusement un agrume (de préférence un peu aplati) et obtenir une peau en seul morceau. On se rend vite compte qu'il est impossible de mettre la peau à plat sans la déformer ou la déchirer. Une vidéo canadienne datant de 1947, à la fois claire, concise et didactique, en fait la démonstration avec des pamplemousses :http://www3.onf.ca/animation/objanim/fr/films/film.php?sort=title&id=938

 

Ainsi, la projection de la Terre va forcément entraîner des déformations. Il existe trois grands types de projections en ce qui concerne les propriétés géométriques des objets projetés et ce qu'elles ne déforment pas :

  • une projection dite équivalente conserve les surfaces, du moins localement

  • une projection dite conforme conserve les angles, du moins localement, donc la forme des objets.

  • aucune projection ne peut être à la fois équivalente et conforme, mais certaines projections ne sont ni l'un ni l'autre, mais peuvent posséder d'autres propriétés comme être équidistantes, c'est-à-dire qu'elles conservent les distances le long des méridiens

 

Il n'y a donc pas de projection meilleure qu'une autre dans l'absolu, chacune est adaptée à un usage précis, fonction de la position et l'étendue de la région du globe cartographiée ou de l'usage qui doit être fait de la carte, comme par exemple mesurer des distances ou au contraire plutôt des surfaces.

 

Les projections de l’ellipsoïde sont souvent faites sur une surface dite développable qui peut être facilement représentée à plat, comme le cylindre, le cône ou le plan :

projection_families.png



le plan (projections dites azimutales, souvent utilisées pour représenter les pôles), sécant à l'ellipsoïde en un point ou une ellipse

le cône, tangent à l'ellipsoïde en une ellipse ou sécant en deux ellipses. Il est ensuite déroulé pour représenter la projection en deux dimensions. Il est notamment employé  pour la projection Lambert, utilisée en France pour la cartographie du territoire métropolitain.

 

le cylindre, tangent à la grande ellipse (c'est à-dire l'Equateur) de l'ellipsoïde ou sécant en deux ellipses. Lui aussi est ensuite déroulé pour représenter la projection en deux dimensions.

 

Deux projections cylindriques sont particulièrement utilisées :

1. La projection de Mercator (du nom du mathématicien et géographe qui l’a créée au XVIe siècle). Cette projection conforme est celle qui est employée le plus souvent dans les mappemondes. Elle a le défaut de déformer considérablement les hautes latitudes et ne peut représenter les pôles. Comme les surfaces ne sont pas conservées, l'Afrique notamment apparaît moins étendue qu'elle n'est réellement, alors qu’avec 30 millions de km², elle est plus grande que l'Inde, la Chine, les États-Unis, l'Europe et le Japon réunis.

2. La projection UTM (pour Universal Transverse Mercator, soit en français projection Transverse Universelle de Mercator) qui est tangente au sphéroide le long des deux méridiens de part et d'autres des pôles. Le cylindre n'est donc pas parfaitement cylindrique, mais légèrement aplati aux pôles pour épouser la forme de l'ellipsoïde.

La Terre est couverte à travers un découpage de 60 fuseaux de 6° (qui couvrent donc les 360° de la rotation terrestre), pour un total de 120 zones, 60 pour l'hémisphère Sud, 60 pour l'hémisphère Nord. Par exemple, la zone 40 de l’hémisphère Sud sera souvent désignée (par exemple dans QGIS) sous la forme contractée “UTM Zone 40S”.

 

Lorsque ce ne sont pas des coordonnées géographiques mais des coordonnées projetées qui sont utilisées, les zones sont découpées en 20 bandes de latitudes de 8° identifiées par une lettre commençant par “C” depuis la bande 80°S et terminant par “X” à 84°N, en sautant les lettres O et I. En Afrique, le découpage est le suivant :

 

N'importe quelle projection peut être théoriquement associée à n'importe quel système géodésique. Aujourd'hui le système géodésique employé est généralement basé sur WGS84, mais il convient toutefois, pour éviter les ambiguïtés, d'associer les noms du système géodésique et de la projection. Dans QGIS, l’association entre système géodésique et projection prend l'appellation de “Système de Coordonnées de Référence” (SCR). On peut trouver ailleurs l’expression de “Système de Référence Spatial” (SRS).

Coordonnées géographiques et coordonnées projetées

La géodésie et les projections permettent non seulement de décrire mathématiquement la surface terrestre et de la représenter à plat, mais également de pouvoir décrire les objets présents sur cette surface à l’aide de références spatiales qui vont permettre de les localiser et d’effectuer des calculs spatiaux : les coordonnées.

 

Les coordonnées géographiques sont celles qui s’appuient sur la représentation de la Terre en trois dimensions et s'expriment en latitude (valeur angulaire le long des méridiens) et longitude (valeur angulaire le long des parallèles à l’Equateur). Les valeurs sont exprimées soit en système sexagésimal (système de numération utilisant la base 60) en degrés, minutes, secondes, soit en degrés dits décimaux qui facilitent grandement les calculs. L’avantage est que les coordonnées géographiques couvrent l’ensemble du globe. Les récepteurs GPS utilisent par défaut des coordonnées géographiques exprimées dans le datum WGS84.

Les coordonnées projetées sont exprimées non pas en degrés mais dans un système métrique (en kilomètres). Il est donc possible de calculer directement des distances approximatives à partir des coordonnées projetées. Un point de la zone UTM 30 qui a pour coordonnées (30 km, 50 km) est exactement à 1 kilomètre du point de la zone 30 (30 km, 51 km), à condition d’être sur le même méridien. Par contre, cette possibilité disparaît dès que l’on change de zone : chaque système de coordonnées projetées a une extension sur la surface du globe.

 

Pour profiter de leurs avantages respectifs et permettre de se localiser avec un récepteur GPS, beaucoup de cartes récentes affichent sur leur marges à la fois des coordonnées géographiques qui se réfèrent au système géodésique WGS84 et des coordonnées projetées qui peuvent être issues de la projection UTM (avec pour datum WGS84) et/ou d’une projection nationale ou locale, qui se réfère à un autre système géodésique (comme NTF -  Nouvelle Triangulation Française pour la France).

 

Un logiciel SIG comme QGIS peut cependant être paramétré pour être capable de calculer des distances sur un SCR non projeté.

Liste des systèmes de référence spatiale et leurs identifiants - EPSG

Des identifiants existent pour caratériser chaque Système de Cordonnées de Référence et faciliter leur usage, notamment dans les logiciels SIG. La liste d'identifiants la plus utilisée est celle créée par le European Petroleum Survey Group (EPSG), un institut de recherche en lien avec l'industrie pétrolière européenne et utilisant la géodésie, les enquêtes de terrain et la cartographie pour favoriser l’exploration pétrolière.  Depuis 2005, l’EPSG a été absorbé par l’OGP (International Association of Oil & Gas Producers, soit l'Association Internationale des Producteurs de Pétrole et de Gaz) dont le comité de géomatique maintient désormais le référentiel EPSG.

Chaque SCR (et même chaque composant d'un SCR) est identifié par un nombre à 4 chiffres. Les identifiants EPSG les plus connus sont :

  • 4326 pour le WGS84 non projeté utilisé notamment par le système GPS.

  • 3857 pour le WGS84 dit Pseudo Mercator utilisé par les rendus d'OpenStreetMap et par défaut dans JOSM. Sa version antérieure, désormais dépréciée, est 3785.

 

Chaque SCR est décrit de façon précise. Pour le EPSG:4326 par exemple, le datum, le méridien de référence et l'unité de mesure sont précisés :

GEOGCS["WGS 84",
   DATUM["WGS_1984",
       SPHEROID["WGS 84",6378137,298.257223563,
           AUTHORITY["EPSG","7030"]],
       AUTHORITY["EPSG","6326"]],
   PRIMEM["Greenwich",0,
       AUTHORITY["EPSG","8901"]],
   UNIT["degree",0.01745329251994328,
       AUTHORITY["EPSG","9122"]],
   AUTHORITY["EPSG","4326"]]

 

Dans le cas d'un SCR comprenant une projection, les informations sur celle-ci vont s'ajouter. Par exemple, pour le EPSG:2029 correspondant au SCR "UTM, Zone 17N, NAD27 révisé 1976" :

 

PROJCS["NAD27(76) / UTM zone 17N",
   GEOGCS["NAD27(76)",
       DATUM["North_American_Datum_1927_1976",
           SPHEROID["Clarke 1866",6378206.4,294.9786982138982,
               AUTHORITY["EPSG","7008"]],
           AUTHORITY["EPSG","6608"]],
       PRIMEM["Greenwich",0,
           AUTHORITY["EPSG","8901"]],
       UNIT["degree",0.01745329251994328,
           AUTHORITY["EPSG","9122"]],
       AUTHORITY["EPSG","4608"]],
   UNIT["metre",1,
       AUTHORITY["EPSG","9001"]],
   PROJECTION["Transverse_Mercator"],
   PARAMETER["latitude_of_origin",0],
   PARAMETER["central_meridian",-81],
   PARAMETER["scale_factor",0.9996],
   PARAMETER["false_easting",500000],
   PARAMETER["false_northing",0],
   AUTHORITY["EPSG","2029"],
   AXIS["Easting",EAST],
   AXIS["Northing",NORTH]]

 

Face à un système de coordonnées ou un identifiant EPSG inconnu, toutes les informations nécessaires peuvent être trouvées sur ce site :http://www.spatialreference.org/

 

Système d'Information Géographique (SIG)

L'Information Géographique (IG) peut être définie comme une information ayant une double référence thématique et spatiale qui, constituée en bases de données (ou encore en systèmes d'information géographique - SIG), permet de collecter (acquisition de données), emmagasiner et cataloguer, traiter, analyser, représenter, modéliser et enfin partager de larges volumes de données.

Les SIG ne se réduisent pas comme beaucoup le croient, à tort, à la seule partie logicielle (le "logiciel SIG"), mais comportent toutes les composantes d'un système d'information : une composante immatérielle comprenant notamment le(s) ordinateur(s) et serveur(s) qui hébergent la composante immatérielle que sont les données spatiales et les outils de traitement (le ou les logiciels SIG) qui reproduisent la composante spatiale du système ; enfin, une composante humaine avec les différents acteurs impliqués dans le projet.

Couches de données

Un jeu de données (vecteur ou raster) est aussi appelé une couche et constitue un ensemble couvrant de façon dense (raster) ou discrète (vecteur) un secteur géographique. Les données d'une couche sont relatives à une thématique.

En effet, à la partie géométrique de la donnée est reliée une information thématique. Une valeur, généralement numérique (celle contenue dans la cellule de la grille couvrant le lieu étudié) pour les rasters, un ensemble de valeurs (une par champ ou attribut) d'un enregistrement de table de données pour les vecteurs.

Bases de données spatiales

Une autre façon de stocker et manipuler les données passe par la constitution d'une base de données spatiale, analogue à une base de données relationnelle classique, à la différence près qu'aux tables et relations entre tables s'ajoute la notion d'objet spatial (géométrie) et de relation entre ces géométries et les tables. La sélection de données dans cette base se fait en questionnant la base via des requêtes, le résultat d'une requête renvoyant une thématique particulière présente dans la base. On retrouve alors la notion de couche.

Une autre façon de concevoir une base de données géographiques/spatiales est représentée par l'approche utilisée dans la base OpenStreetMap. Dans celle-ci, à la géométrie de chaque objet est attaché l'équivalent d'une table d'attributs conçue sur mesure en fonction des informations à y associer. Il y a donc potentiellement autant de tables et autant de structures de tables que d'objets. Dans la base OSM un attribut est appelé "clé" une "valeur" y est associée. Le couple clé-valeur est communément appelé "étiquette" ou "balise" (traduction du mot "tag").

Si une base de données spatiale peut contenir des rasters (l'objet est alors une "image") aussi bien que des vecteurs, il est plus fréquent d'y rencontrer les seconds. D'autre part, la base OSM est conçue exclusivement comme une base vecteur.

Partager les outils et les données

Open Source

La désignation open source, ou « code source ouvert », s'applique aux logiciels dont lalicence respecte des critères précisément établis par l'Open Source Initiative, c'est-à-dire les possibilités de libre redistribution, d'accès au code source et de créer des travaux dérivés.

Le code source est disponible pour le public et quiconque peut le copier, réutiliser ou modifier cette copie, éventuellement en faire un produit différent.

Un code Open Source est en général le fruit d'un effort collaboratif dans lequel les programmeurs travaillent ensemble à l'amélioration et au développement du code, et mettent en partage le fruit de leur travail pour le bénéfice de la communauté. Le mouvement Open Source vient en réponse aux logiciels propriétaires qui brident la créativité et rendent difficile le partage et la collaboration désintéressée.

Open Data   

Une donnée ouverte est une donnée numérique d'origine publique ou privée. Elle est produite par une collectivité ou un service public. Elle est diffusée de manière structurée selon une méthodologie et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière.

L'ouverture des données (en anglais open data) représente à la fois un mouvement, une philosophie d'accès à l'information et une pratique de publication de données librement accessibles et exploitables. Elle s'inscrit dans une tendance qui considère l'information publique comme un bien commun dont la diffusion est d'intérêt public et général.

opendata.jpeg

Le logo de l'open data

Cependant des communautés ad hoc (sans structure ni légitimité officielle) peuvent se constituer et produire des données à destination à la fois de la communauté et du public en général, avec possibilité pour l'utilisateur de copier, réutiliser et modifier cette donnée. Ce mouvement des communautés a en l'occurrence été le déclencheur de l'ouverture des données produites par les collectivités et services publics.

Des exemples de ces données ouvertes hors cadre officiel sont Wikipedia (encyclopédie collaborative) et OpenStreetMap pour les données géographiques.

Il y a une erreur de communication avec le serveur Booktype. Nous ne savons pas actuellement où est le problème.

Vous devriez rafraîchir la page.