JADT 2010 : 10 th International Conference on Statistical Analysis of Textual Data Il lessico e i temi della statistica uffciale in Italia. Un’analisi lessicometrica del Programma Statistico Nazionale degli ultimi dieci anni Isabella Mingo 1 , Cristina Panattoni 2 1 Dipartimento di Sociologia e Comunicazione –Università Sapienza Roma- Italia 2 Segreteria tecnica della Commissione per la Garanzia dell’Informazione Statistica – Presidenza del Consiglio dei Ministri – Italia Riassunto Una adeguata valutazione della completezza dell’informazione statistica uffciale italiana presuppone una cono- scenza approfondita e una attenta analisi del principale documento di pianifcazione e coordinamento delle stati- stiche prodotte dagli enti del Sistema statistico nazionale (Sistan): il Programma Statistico Nazionale (PSN). Infatti, il d.lgs. 322/89, istitutivo del Sistan, stabilisce che nel PSN debba essere inserita tutta la produzione stati- stica di interesse pubblico realizzata in ciascun triennio dagli enti del Sistema. Nel tempo la struttura e i contenuti del PSN sono cambiati in funzione sia dei mutati fabbisogni informativi del Paese e dell’emergere di nuovi settori tematici di indagine su cui acquisire dati, sia della maggiore attenzione posta alla qualità dell’intero processo di produzione dell’informazione statistica. In tale contesto il presente lavoro propone, mediante un approccio lessicometrico, una analisi longitudinale dei Programmi statistici nazionali – dal triennio 2000-2002 al triennio 2008-2010 – con un duplice obiettivo: porre le basi per la costruzione di un lessico della statistica uffciale e delineare, sia sul piano lessicale che su quello delle tematiche, i cambiamenti intervenuti nel corso dell’ultimo decennio. La dimensione totale del corpus analizzato è di circa 600 mila occorrenze. Ai fni di un approfondimento tematico sono stati analizzati anche sub-testi estratti dal corpus, costituiti dai lavori proget- tati per ciascun triennio. Abstract An adequate assessment of the completeness of the Italian offcial statistics requires a knowledge and careful analysis of the main document for planning and coordination of statistics produced by National Statistical System (Sistan): National Statistical Program (NSP). Indeed, the legislative act of the government no. 322/89 (d.lgs. 322/89), establishing the Sistan, states that the NDP should include the statistical production of public interest carried out in each three years by institutions of the system. Over time the structure and contents of the NSP have changed, both the changing information needs of the country and the emergence of new issues of inquiry, both the increased attention to the quality of the production process of statistics. In this context the present work proposes, through a lexicometric approach, a longitudinal analysis of National Statistical Programs – from the period 2000- 2002 to the 2008-2010 – with a dual aim: to lay the foundations for a lexicon of offcial statistics and outline, in terms of content, changes in the issues during the last decade. The total size of the corpus analysis is about 600 thousand hits. A signifcant gain of thematic deepening was also obtained analyzing sub-tests taken from the corpus, consisting of the works designed for each triennium. Keywords: offcial statistics, lexicometric analysis, textual analysis.