Une ontologie pour ´ editer des sch´ emas de description audiovisuels, extension pour l’inf´ erence sur les descriptions Thomas Dechilly, Bruno Bachimont Institut national de l’audiovisuel, Direction de la Recherche 4, av. de l’Europe - 94366 Bry-sur-Marne tdechilly,bbachimont @ina.fr et http://www.ina.fr/ R´ esum´ e La convergence actuelle des technologies de l’in- formatique, des r´ eseaux et de l’audiovisuel motive la mise en place de nouveaux syst` emes informatiques pour le stockage, le catalogage, l’indexation et la pu- blication des documents audiovisuels. Dans ce cadre nous proposons une instrumentation de l’indexation audiovisuelle ` a partir de deux paradigmes informa- tiques: l’ing´ enierie documentaire et l’ing´ enierie des connaissances. Ces derni` eres technologies nous per- mettent de mettre en place un syst` eme informatique autorisant la description des documents audiovisuels (s’inscrivant dans le cadre des recherches men´ ees au- tour du format MPEG-7) en contrˆ olant tout au long de la chaˆ ıne documentaire la s´ emantique des descripteurs mobilis´ es ` a l’aide d’une ontologie. Mots clef : MPEG-7, indexation, ontologie, XML, au- diovisuel, structuration des connaissances. 1 Introduction La convergence actuelle des technologies de l’informa- tique, des r´ eseaux et de l’audiovisuel motive la mise en place de nouveaux syst` emes informatiques pour le stockage, le ca- talogage, l’indexation et la publication des documents audio- visuels (AV). A l’Institut national de l’audiovisuel 1 (INA) et dans le cadre de notre propos, le centre de ces modifications concerne l’indexation des documents audiovisuels. L’indexation, suivant l’AFNOR, est le processus destin´ e` a repr´ esenter par des ´ el´ ements d’un langage documentaire ou naturel des donn´ ees r´ esultats de l’analyse d’un document ou d’une partie de ce document. L’objectif de ce processus est de permettre ou de faciliter la recherche de documents par leur contenu. Si l’on consid` ere les documentsAV, il est im- portant de noter quelques caract´ eristiques influenc ¸ant leur in- dexation : – un document AV n’offre pas a priori d’unit´ es discr` etes signifiantes ` a partir desquelles il serait possible de construire l’indexation (l’´ equivalent des mots pour le texte); – un document AV est une organisation complexe d’images et de sons qu’il n’est pas possible de d´ ecrire objectivement. Il n’existe pas de th´ eorie effective sur ces combinaisons; – un document AV ne pr´ esente pas de structure inh´ erente ´ evidente autre qu’un d´ ecoupage plans/transitions. A l’INA, l’indexation consiste pour le moment en la cr´ eation de notices documentaires r´ esumant textuellement l’analyse du contenu AV. Ces notices, dissoci´ ees physique- ment du contenu AV, poss` edent deux fonctions importantes, a) la prescription d’un acc` es au contenu AV, b) l’explicitation du contenu AV qui n’est pas, d’embl´ ee, interpr´ etable de fac ¸on univoque. En effet d’apr` es les caract´ eristiques ´ enonc´ ees plus haut, il est n´ ecessaire de cr´ eer une description interm´ ediaire pour repr´ esenter le contenu AV et y acc´ eder. D` es lors, cette description prescrit un acc` es particulier en proposant ` a l’uti- lisateur un ensemble de termes choisis [9]. Cette description normalise un rapport au contenu AV puisqu’elle doit per- mettre ` a plusieurs utilisateurs d’acc´ eder aux mˆ emes docu- ments AV pour les mˆ emes valeurs s´ emantiques. La num´ erisation des contenus AV ´ etend largement les fonctions de l’indexation. En effet, les documents AV et les descriptions associ´ ees se retrouvant dans des formats num´ eriques, autorisent la mise en place de nouvelles mani- pulations des contenus. Ainsi, il devient possible de publier au travers des r´ eseaux ou des nouveaux supports (DVD) les contenus AV accompagn´ es de leurs descriptions. Les descrip- tions portant l’indexation des documents AV deviennent de r´ eelles m´ etadonn´ ees non seulement mobilisables pour retrou- ver les contenus mais ´ egalement pour de nouvelles exploita- tions comme la publication hyperm´ edia, le raisonnement sur les contenus. . . Nos travaux s’inscrivent dans ce contexte de convergence num´ erique. Il s’agit dans ce cadre, de mettre en place une nouvelle strat´ egie pour l’indexation des documents AV per- mettant ` a la fois de conserver les fonctions actuelles (acc` es au contenu AV, explicitation de ce contenu) et d’autoriser de nouvelles utilisations. Notamment, il s’agira de veiller au maintien d’une continuit´ e s´ emantique entre les diff´ erents usages li´ es aux documents AV index´ es. C’est-` a-dire, de faire 1. L’INA archive les programmes des chaˆ ınes de t´ el´ evision franc ¸aise depuis 1949 et de radio depuis 1929. Les fonds comportent ` a ce jour plus de 3 millions de documents repr´ esentant environ 400 000 heures de vid´ eo et 500 000 heures de programmes audio.