AIDAinformazioni Anno 26 gennaio-giugno Numero 1-2/2008 165 L’attribuzione di testi con metodi quantitativi: riconoscimento di testi gramsciani [1] CHIARA BASILE, MAURIZIO LANA This contribution takes account of some theoretical considerations and experimental results developed by a quite heterogeneous group of scientists while studying the problem of quanti- tative authorship attribution (stylometry) in a selection of newspaper articles written by Antonio Gramsci and his co-workers. Methodological and historical issues of stylometry are discussed, concentrating particularly on the relatively recent spread of methods based on very simple indicators with no syntactical meaning. Two methods for the recognition of author- ship are then described and experimented on the Gramscian corpus, both based on a mathematical model of texts and the author/text relationship, and both using similarity distances. The first method compares the statistics for sequences of n characters (n-grams) in the texts, while the second is based on the very deep concept of entropy of a symbolic sequence and on some techniques for data compression. Keywords: Stylometry – attribution by quantative methods – stylistic fin- gerprinting – similarity differences – n-grams, data compression Presentazione La ricerca qui descritta trae origine da una scelta innovativa della Fondazione Istitu- to Gramsci, nelle persone del presidente, Giuseppe Vacca, e del curatore di una delle annate dell’”Edizione Nazionale delle opere di Antonio Gramsci”, Leonardo Rapone: chiedere l’intervento di un gruppo di esperti in attribuzione di testi con metodi quanti- tativi per individuare gli scritti gramsciani all’interno di un corpus di articoli giornalisti- ci pubblicati anonimi [2] negli anni 1913-1926 sui quotidiani ai quali Gramsci colla- borava (Il Grido del Popolo, Avanti!, La Città Futura, …), allo scopo di offrire ai curato- ri delle varie annate degli scritti di Gramsci una nuova chiave di lettura per valutare l’inclusione (o esclusione) di testi nell’Edizione Nazionale. La ricerca è condotta da un gruppo formato da Dario Benedetto e Emanuele Caglioti, fisici matematici all’Univ- ersità La Sapienza di Roma, Mirko Degli Esposti, fisico matematico dell’Università di Bologna, e dagli autori di queste pagine. Della ricerca nel suo complesso renderanno conto due contributi di imminente pubblicazione in un volume metodologico dell’Edizione Nazione delle Opere di Antonio Gramsci [3].