Les données des sémaphores : de l'observation à la restitution spatio-temporelle du trafic maritime Annalisa Minelli 1 *, Iwan Le Berre 1 , Ingrid Peuziat 1 1 LETG-Géomer, UMR 6556 CNRS, IUEM-UBO Technopôle Brest-Iroise, Plouzane, France. ________________________ Introduction A l'origine destinés à faciliter la transmission d'information, les sémaphores sont aujourd'hui dévolus aux missions de surveillance continue et d'enregistrement du traic maritime, dans un but de sécurité et de service public (Lecouturier et Lucas, 1988). Même si les données d'observation collectées au sein du réseau français de sémaphores fournissent de précieuses informations sur le traic maritime, elles restent encore sous exploitées. Pourquoi utiliser les données des sémaphores ? En premier lieu, l'acquisition des données repose sur une observation permanente du traic maritime. De plus, les navires et leurs activités sont identiiés et les observations consignées dans des feuilles de calcul archivées quotidiennement (nom, numéro d'immatriculation, type d'embarcation, route suivie, heure d'observation). Enin, les données consignées concernent potentiellement tous les types de traic, y compris la navigation de plaisance et les bateaux de petite taille qui ne sont généralement pas enregistrés par les modes d'observation usuels comme l'AIS, le radar et le satellite. Or, les bateaux de plaisance peuvent représenter localement jusqu'à 50-60% du traic total maritime (Gray et alii, 2011; Smallwood et alii, 2011). Protocole de traitement Malgré un support de saisie standardisé à l'échelle nationale, les données brutes présentent de nombreuses variations de syntaxe devant être corrigées. De plus la nature sémantique de ces données impose un traitement particulier avant de pouvoir les analyser. Le protocole développé à partir de l'exemple des sémaphores de l'Iroise repose sur quatre étapes : (a) concaténation des ichiers originaux (2 dossiers par jour, soit 730 feuilles de calcul par an) dans un unique ichier annuel, dont la date et l'heure d'observation sont formatées ; (b) nettoyage des ichiers : une procédure semi-automatique (code Python) permet l'apprentissage et la standardisation de la terminologie au sein de 3 dictionnaires (type de bateaux, usage et route) à partir desquels sont nettoyés les ichiers d'origine ; (c) spatialisation des données : pour reconstituer l'itinéraire potentiel suivi par chaque bateau, un réseau synthétique créé dans GRASS (Neteler et Mitasova, 2008) permet de relier les points d'origine et de destination (portes) enregistrés selon la règle du plus court chemin. Chaque passage de bateau est enregistré dans chaque segment de la grille et dans