SemBib, un dépôt local d’articles scientiﬁques sémantiquement décrits Jean-Claude Moissinac 1 (1) Telecom ParisTech 46 Rue Barrault, 75013 Paris France jean-claude.moissinac@telecom-paristech.fr, RÉSUMÉ Le projet SemBib est une initiative au sein de Telecom ParisTech pour constituer et exploiter une base de connaissances sur nos publications scientiﬁques. Face à de grands entrepôts de références bibliographiques, nous considérons qu’une fédération de projets analogues à SemBib a du sens. Nous présentons ici les avancées actuelles du projet SemBib et ses relations avec d’autres projets. ABSTRACT SemBib, local repository of scientiﬁc publications with semantic description MOTS - CLÉS : RDF, web sémantique, RDFa, SPARQL, LOD, publications scientiﬁques. KEYWORDS: RDF, semantic web, RDFa, SPARQL, scientiﬁc publications. 1 Introduction et contexte De nombreuses initiatives visent à améliorer les parcours dans la masse de connaissances que constituent les publications scientiﬁques. Certaines s’appliquent à donner une vision analytique d’un ensemble de citations. Citons par exemple le travail de (Sateli et al., 2016) pour associer des compétences à des personnes en analysant leurs publications. D’autres, par exemple, aident à trouver des documents pertinents sur un sujet donné comme (Rizzo et al., 2015). Cela est souvent fait en cherchant à associer des thématiques à un article ou à un groupe d’articles, par exemple (Sateli and Witte, 2015). Plusieurs acteurs majeurs de l’informatique proposent l’accès à des ressources bibliographiques. Google Scholar est un puissant outil de recherche interactive; cependant il ne fournit pas d’accès par programme et ne permet donc pas de bâtir des explorations personnalisées. Microsoft Academic 1 a construit un graphe qui peut être interrogé via une API ; le modèle propose un accès gratuit jusqu’à une certaine limite de requêtes, au delà duquel l’accès devient payant. D’autres initiatives, comme HAL, proposent un accès de ce type. L’inconvénient de ces ressources est qu’elles dépendent largement de la qualité des données qu’elles ont pu récolter et sur lesquelles elles ont peu de moyen d’évaluation; l’amélioration des données concernant une institution s’avère, au mieux, complexe. A titre d’exemple, DBLP contient environ 300 articles associés à Telecom ParisTech et HAL, environ 3000, alors que notre base bibliographique en contient plus de 11000. 1. https ://academic.microsoft.com