Distribution of some similarity coefficients for dyadic binary data in the case of associated attributes |
| |
Authors: | Tom A. B. Snijders Maarten Dormaar Wijbrandt H. van Schuur Chantal Dijkman-Caes Ger Driessen |
| |
Affiliation: | (1) Department of Statistics and Measurement Theory, FPPSW, University of Groningen, Oude Boteringestraat 23, 9712 GC Groningen, The Netherlands;(2) Department of Social Psychiatry, University of Limburg, P.O. Box 616, 6200 MD Maastricht, The Netherlands |
| |
Abstract: | Parameters are derived of distributions of three coefficients of similarity between pairs (dyads) of operational taxonomic units for multivariate binary data (presence/absence of attributes) under statistical independence. These are applied to test independence for dyadic data. Association among attributes within operational taxonomic units is allowed. It is also permissible for the two units in the dyad to be drawn from different populations having different presence probabilities of attributes. The variance of the distribution of the similarity coefficients under statistical independence is shown to be relatively large in many empirical situations. This result implies that the practical interpretation of these coefficients requires much care. An application using the Jaccard index is given for the assessment of consensus between psychotherapists and their clients.
La distribution des coefficients de similarité pour les données binaires et les attributs associés Résumé Les paramètres de la distribution de trois coefficients de similarité entre paires d'éléments taxinomiques opérationels de données multivariables binaires (présence/absence) ont été dérivés dans l'hypothèse d'indépendance statistique. Ces paramètres sont utilisés dans un test d'indépendance pour les données dyadiques. L'existence est autorisée, dans la population d'éléments, d'une association entre plusieurs attributs. Il est également permis que les deux éléments de la dyade soient tirés de deux populations différentes, ayant différentes probabilit és quant à la présence des attributs. Dans beaucoup de situations empiriques, la variance des coefficients de similarité peut être relativement élevée dans le cas d'indépendance statistique. Par conséquence, ces coefficients doivent être interprétés avec précaution. Un exemple est donné pour le coefficient de Jaccard, qui a été employé dans une recherche sur la concordance entre des psychothérapeutes et leurs clients. |
| |
Keywords: | Consensus Dice coefficient Jaccard coefficient Simple Matching coefficient Multivariate binary data Observer agreement Similarity coefficients Beta distribution |
本文献已被 SpringerLink 等数据库收录! |
|