Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique




НазваPrérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique
Дата канвертавання19.12.2012
Памер43.84 Kb.
ТыпДокументы
API Géocodage

API : Application programming interface

Fonctionnalités utilisateur :


3 types de géocodages sont disponibles :

  • Le géocodage à la commune permet d’obtenir le code INSEE à partir du code postal et du nom de la commune,

  • Le géocodage à l’IRIS permet d’obtenir le code IRIS à partir du code INSEE et de l’adresse,

  • Le géocodage à la rue permet d’obtenir la position (X ;Y) à partir du code INSEE et de l’adresse.

Pour un géocodage unitaire, l’API retourne le code INSEE, le code IRIS ou la position de l’adresse géocodée sous la forme d’un objet « Resultat ».

Pour un géocodage en masse, l’API lit en entrée un fichier d’adresses au format texte séparateur tabulation et génère en sortie un fichier équivalent avec les colonnes d’information supplémentaires : codes INSEE / IRIS / position XY, indicateur de qualité de localisation et indicateur de qualité de comparaison.

Prérequis techniques :


  • Framework .net 4.0 (téléchargé à l’installation du logiciel)

  • Plateforme Windows 32/64 bits

  • Langage C# .Net

Référence technique :

Géocodage à l’Insee

Le référentiel 


Le référentiel INSEE utilisé est celui de Cartes & Données Géocode France 5.0. C’est une table qui contient la correspondance entre les codes postaux, les noms de villes et les code INSEE et qui a été constituée en 2003.

Le référentiel est stocké dans une base au format sdf : db_insee.sdf

Le modèle physique est le suivant (les noms des champs peuvent varier) :


Normalisation des adresses


Les noms de communes du référentiel ainsi que les noms de communes à géocoder sont normalisés de la même manière afin de pouvoir être comparés. Voici la description du traitement de normalisation :

  • Remplacement des caractères accentués par leur équivalent non accentué,

  • Remplacement des caractères parenthèses, traits d’union et anti-slash par des espaces,

  • Suppression des espaces en début et en fin de chaine,

  • Remplacement des chaines « SAINT(E) » par « ST(E) » si la chaine n’est pas le dernier mot

Méthode de géocodage


Le moteur de géocodage à l’INSEE fonctionne en 4 étapes, de la plus stricte à la moins stricte. A chaque étape, on peut trouver :

  • une seule réponse auquel cas c’est celle qui est retenue,

  • plusieurs réponses que l’on propose alors à l’utilisateur,

  • aucune réponse : on poursuit alors la recherche en passant à l’étape suivante.

Les 4 étapes de recherche du code INSEE sont les suivantes :

  1. Recherche par le code postal et le nom de commune

  2. Recherche par le code postal et un mot du nom de commune

  3. Recherche par le code département et le nom de commune

  4. Recherche par le code département et un mot du nom de commune.

Géocodage à l’IRIS

Le référentiel


Le référentiel à l’IRIS est constitué à partir du CD-ROM Correspondances…Adresses 2004 de l’INSEE.

Le référentiel est stocké dans une base au format sdf : db_irisStreets.sdf

Le modèle physique est le suivant (les noms des champs peuvent varier) :




Normalisation des adresses


On part de l’adresse brute issue du référentiel ou bien de l’utilisateur et on applique les traitements suivants :

  • Suppression des espaces en début et fin de chaine

  • Suppression des caractères spéciaux

  • Mise en majuscules

  • Remplacement des apostrophes par des espaces

  • Suppression des espaces en début et fin de chaine


Découpage des adresses


On part de l’adresse normalisée sur laquelle on applique des traitements pour obtenir les champs suivants :

  • le numéro de voie,

  • le type de voie,

  • le nom de voie,

  • le nom de voie commun,

  • le mot directeur,

  • le nom de voie commun phonétisé,

  • le mot directeur phonétisé.


Obtention du numéro de voie


On extrait le premier mot de l’adresse normalisée dans lequel on remplace les caractères spéciaux suivants pas des espaces :



Caractères spéciaux

Nom

-

Trait d’union

_

Souligné

&

Et commercial



Guillemets

/

Slash

\

Antislash

(

Parenthèse ouvrante

)

Parenthèse fermante

+

Plus

,

Virgule

.

Point

:

Deux points



On extrait alors le premier mot de la chaîne ainsi obtenue et on teste si celui-ci est un nombre. Si c’est le cas, ce nombre correspond au numéro de voie. En revanche, si ce n’est pas le cas, on considère que l’adresse ne dispose pas de numéro de voie.

Obtention du type de voie


On extrait le premier mot de la chaîne de l’adresse normalisée sans le numéro de voie. Si ce mot se termine par un caractère « point » (pour signifier une abréviation), on supprime ce caractère.

Il convient également de normaliser le type de voie. On utiliser pour cela la table « streetTypes » qui contient une liste des types de voie usuels (colonne 0) avec leur équivalent normalisé (colonne 1).

Obtention du nom de voie


Le nom de voie est obtenu dans la continuité de l’opération précédente. Il correspond à la chaîne restante, c’est-à-dire sans le numéro de voie et sans le type de voie.

Obtention du nom de voie commun


Le nom de voie commun est obtenu à partir du nom de voie. On teste pour chaque mot de la chaîne s’il fait parti de l’ensemble des « mots auxiliaires » suivants : LA, LE, LES, SUR, SOUS, LEZ, DU, DES, DE, L, ET, EN, D, AU, AUX. Si c’est le cas, on supprime le mot de la chaîne.

Obtention du mot directeur


Par défaut, on choisit comme mot directeur le dernier mot de l’adresse. Cependant, si ce dernier mot est un nombre, deux cas se présentent :

  • l’avant dernier mot est un mois : on supprime le nombre (l’année). Si le mois est précédé d’un nombre, on rajoute ce nombre en préfixe du mot directeur (ex : 8 MAI 1945 => 8 MAI),

  • l’avant dernier mot est un prénom : on conserve le prénom suivi du nombre (ex : LOUIS 16).



Enfin, si le dernier mot est un mois et que l’avant dernier mot est un nombre, le mot directeur est le nombre suivi du mois (ex : 8 MAI).

Pour tester si un mot est un prénom, on utilise la table « firstNames » qui répertorie 2331 prénoms (colonne 0).

Obtention du nom de voie commun phonétisé


En premier lieu, il faut déjà disposer du nom de voie commun. Ensuite, on effectue les traitements suivants pour chaque mot :

  • déduplication des lettres identiques successives,

  • suppression des muettes de fin suivantes : D, G, P, Q, S, T, X, Z,

  • détection des abréviations courantes et correction par leur équivalent étendu. Pour cela, on utilise la table « abbreviations » qui contient les abréviations courantes en colonne 0 et leur équivalent corrigé en colonne 1,

  • transformation des chaînes suivantes par leur équivalent :



Chaîne

Equivalent

AILL

AY

EILL

EY

ASN

AN

AISN

AIN

EAU

O

ESN

EN

CHR

CR

AO

O

AU

O

GE

JE

GI

JI

MB

NB

MP

NP

PH

F

TH

T

CQU

K

QU

Q

CQ

K

CC

X

Y

I



Obtention du mot directeur phonétisé


L’obtention du mot directeur phonétisé repose sur le même principe que pour obtenir le nom de voie commun phonétisé : ont part du mot directeur et on applique les traitements pour obtenir le mot directeur phonétisé.


Méthode de géocodage




  1. Etape prélimaire

Cette étape consiste à rechercher si la commune recherchée est référencée dans la base des communes (par le code INSEE) et si c’est une commune découpée en IRIS. 3 cas peuvent alors se présenter :

  • la commune existe mais n’est pas découpée en IRIS : on ajoute 4 zéros au code INSEE pour constituer le code IRIS

  • la commune n’existe pas dans la base : on ne peut pas géocoder

  • la commune existe et est découpée en IRIS : on passe à l’étape 2



  1. Etape 2

Le moteur de géocodage à l’IRIS fonctionne selon 6 étapes de rapprochement des adresses, de la plus stricte à la moins stricte :

  1. Recherche par le nom de voie typé (ex : rue du clos besnard)

  2. Recherche par le nom de voie non typé (ex : du clos besnard)

  3. Recherche par le nom de voie commun (ex : clos besnard)

  4. Recherche par le mot directeur (ex : besnard)

  5. Recherche par le nom de voie commun phonétisé (ex : clo benar)

  6. Recherche par le mot directeur phonétisé (ex : benar)



  1. Résultats

Pour chaque étape (à l’exception de l’étape préliminaire), on peut trouver :

  • un seul tronçon avec correspondance des numéros,

  • un seul tronçon sans correspondance des numéros mais c’est l’unique tronçon de la voie,

  • un seul tronçon sans correspondance des numéros mais l’adresse n’a pas de numéro ou le numéro ne figure pas dans le référentiel,

  • plusieurs tronçons situés dans plusieurs iris (on ne peut pas géocoder),

  • plusieurs voies de même nom (on ne peut pas géocoder),

  • aucune réponse : on poursuit alors la recherche en passant à l’étape suivante.



Géocodage à la rue

Le référentiel




Le référentiel utilisé est celui de TeleAtlas Multinet. Nous utilisons uniquement les référentiels de géocodage (gc) et de numéros de maisons intermédiaires (ih).


Les fichiers gc sont composés de quatre fichiers :

  • .shp -> forme géographique des enregistrements dbf (flux d’octet)

  • .dbf -> format Dbase (UTF-8)

  • .shx -> fichier d’index pour lire le shp (flux d’octet)

  • .prj -> format de la carte (inutilisé dans notre cas)


Le fichier ih ne contient qu’un seul fichier : le fichier .dbf


Pour chaque département ces 4 fichiers sont présents. Voici la forme des noms de fichiers :

fraf2437_________gc.dbf

24 correspond à la région centre et 37 au département de l’Indre et Loire.


Voici le schéma de la base de données : d:\bibliographie\geocodage\schéma sql.png

Chargement du référentiel en base de données :



Les données sont stockées dans plusieurs bases de données SQL Server CE. Ce sont des bases de données locales ne nécessitant aucune installation supplémentaires. Au vu de la quantité de données à stocker, celles-ci sont réparties en plusieurs bases dont voici le schéma :

  • Db_InseeCommon.sdf : Tables Régions, Départements, Communes, StreetTypes, firstNames et abbreviations.

  • Db_StreetNames.sdf : Noms des rues

  • Db_Streets.sdf : Liste des rues par commune

  • Db_StreetSections_XX.sdf : Plusieurs tables contenant les jonctions de route. Il existe une table différente par région.


La classe BddRepository permet de gérer les différentes connexions avec les bases. Voici la liste des bases de StreetSections avec les régions correspondantes (id Multinet) :


10 : Poitou Charente + Limousin

11 : Aquitaine

12 : Midi-Pyrénées

13 : Languedoc-Roussillon

14 : Provence-Alpes Cote d'Azur + Corse

15 : Rhône-Alpes sans 42 ni 07

16 : Auvergne + 47 et 07

17 : Bourgogne + Franche-Comté

18 : Alsace + Champagne-Ardenne + Lorraine

19 : Nord-Pas-de-Calais + Picardie

20 : Ile-de-France

21 : Basse-Normandie + Haute-Normandie

22 : Bretagne

23 : Pays de la Loire

24 : Centre


Algorithme utilisé pour charger un département :

Chargement des données InseeCommon : A FAIRE EN PREMIER


Chargement des fichiers gc(.dbf et .shp) et ih

Pour toutes les sections du .dbf

Chargement des infos de la jonction (et ih si présent)

Normalize et parse l’adresse Multinet

Si le nom de rue n’existe pas

Insertion de la rue

Si la rue n’existe pas dans la commune

Insertion de la rue pour cette commune

Si la rue existe dans deux communes (à gauche et droite)

Ajout dans la 2ème commune

Insertion du tronçon en base


Normalisation des adresses Multinet :

La normalisation des adresses se base sur les mêmes algorithmes que pour les Iris. Cependant, il n’y a pas de numéro de maison ce qui facilite les recherches. Voici l’algorithme utilisé :


Normalisation de l’adresse

Recherche du type de rue (toujours le premier mot)

Si il y a un type de rue

normalisation du type de rue

ajout du type de rue

Nom de voie typé = type de rue normalisé + reste de la rue

Sinon

Pas de type de rue

Nom de voie = toute la voie


Obtention du nom de voie non typé


Même méthode que pour les Iris
Obtention du nom de voie commun

Obtention du mot directeur

Obtention du nom de voie phonétisé

Obtention du mot directeur phonétisé


Stockage de la forme des objets

Les formes des routes sont stockés dans le .shp. Pour les stocker dans la base de données, nous utilisons le foramt WKT. Ainsi les objets géométriques sont stockés sous forme de chaînes de caractères.


Stockage du fichier IH

Le fichier IH correspond aux tronçons dont les maisons n’ont pas des numéros réguliers sur la droite et/ou la gauche de la route.


S’il existe des numéros de maisons intermédiaires pour un tronçon, les champs :

 isInterRightNb et isInterLeftNb l’indique.


Les numéros de maisons intermédiaires sont elles aussi stockés sous forme de chaines de caractères, chaque numéro étant séparé par des virgules (ex : 2,10,12,20).

Méthode de géocodage



Дадаць дакумент у свой блог ці на сайт

Падобныя:

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconРезюме програміста C# / dot. Net / asp. Net
Робота у якості провідного програміста, аналіста або розробника web / лідера групи розробників

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique icon1. Лекция: Что такое asp. Net
Дается обзор различных web-технологий. Объясняется преимущество asp. Net. Описывается процесс подготовки среды разработки приложений....

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconРеализация интерпретатора типизированного лямбда-исчисления
Был реализован интерпретатор языка программирования, предназначенный для изучения систем типизации в лямбда-исчислении. Интерпретатор...

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconCefr common European Framework of Reference clil

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique icon"European Reference Framework on Dangerous Goods Transport"

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconNausicaa. Net

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconTitles selected for whichbook net to August 06

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconCompetition Start Sheet national net 2011

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique icon3- symposium on electromagnetic windows, proceedings. Volume II. Electrical theory and design radant and other techniques

Prérequis techniques : Framework net 0 (téléchargé à l’installation du logiciel) Plateforme Windows 32/64 bits Langage C#. Net Référence technique iconВстреча партнеров проекта ibi net, Минск, Беларусь

Размесціце кнопку на сваім сайце:
be.convdocs.org


База данных защищена авторским правом ©be.convdocs.org 2012
звярнуцца да адміністрацыі
be.convdocs.org
Галоўная старонка