Stochastic orderings and their use in statistics: the case of association between two variables Ordinamenti stocastici e loro uso in statistica: il caso della associazione tra due variabili Alessandra Giovagnoli ( 1 ) Dipartimento di Scienze Statistiche ‘‘Paolo Fortunati” Universit` a di Bologna giovagno@stat.unibo.it Riassunto: Il concetto di associazione tra variabili categoriche nominali (connessione) viene qui identificato da una relazione di pre-ordinamento. Sono possibili diversi ordina- menti che esprimono connessione sia quando le variabili intervengono simmetricamente (caso dell’interdipendenza), che nel caso di dipendenza di una delle due dall’altra. Si cerca di rispondere alle domande: 1. Quand’e’ che, rispetto a un particolare concetto di associazione, una coppia di variabili e’ “ugualmente associata” oppure “meno associata” di un’altra coppia di variabili? Quali operazioni sulle variabili lasciano inalterata quella particolare relazione di associazione tra esse? Quali la aumentano o la diminuiscono? 2. Quali sono gli indicatori che rispettano l’ordinamento relativo a quel particolare legame associativo? La presentazione si focalizza poi sul raters’ agreement. Il “grado di ac- cordo” tra due osservatori puo’ essere visto come un particolare tipo di connessione tra le variabili che rappresentano le osservazioni di due diversi esperti che in parte concordano e in parte no. L’esempio che mi motiva e’ quello degli esami citologici di laboratorio. Keywords: Categorical Variables, Cohen’s kappa, Cross-classification Tables, Depen- dence, Stochastic Matrices. 1. Introduction: defining association Interest in assessing the association between two statistical or random variables, meaning the strenght of their mutual dependence or dependence of one on the other, has a long his- tory in the statistical literature and a fundamental survey is that by Goodman and Kruskal (1979). Usually the interest lies in how to measure the association: several measures are possible, which reflect different goals we may have in mind for specific applications (Haberman, 1982). This paper, on the other hand, focuses on describing and comparing various concepts of association, a mental operation which logically seems to come before resorting to a given measure. Many concepts in statistics (association is one of them, but the same could be said of variability, concentration . . . ) are not amenable to a direct defi- nition, much as we are at a loss when we try to explain the idea of beauty, but just as for beauty, we can define them through a series of comparisons. In fact, a pair of variables is not described just by possessing the attribute in question, i.e. being or not as- 1 The author wishes to thank the Cytology Chair of the Second School of Medicine, “La Sapienza” University, Rome, for kindly providing the clinical references and the data. She also wishes to thank Professor Antonio Forcina for useful comments and Dr Simone Giannerini for technical help. The research is sponsored by the CNR Project “Metodi e Sistemi per il Supporto alle Decisioni” (MSSD). – 95 –