Protocole de validation des méthodes d’analyse
RESOLUTION OENO 6/2000
PROTOCOLE DE VALIDATION DES METHODES D’ANALYSE
L’ASSEMBLEE GENERALE,
VU l’article 5, alinéa 4 de la Convention internationale d’unification des méthodes d’analyse et d’appréciation des vins du 13 octobre 1954,
SUR PROPOSITION de la Sous-Commission des méthodes d’analyse et d’appréciation des vins,
DECIDE
D’INTRODUIRE dans l’Annexe A du Recueil des méthodes internationales d’analyse des vins, « le Protocole pour la planification, la conduite et l’interprétation des études de performance des méthodes d’analyse » suivant: (révisé en 1994 - Rapport technique)
Synopsis. Les méthodes d'analyse doivent être validées pour être opposables à un examen sérieux de type professionnel et à des contestations juridiques. Le protocole révisé incorpore les changements suggérés à la suite de l'expérience acquise par l'usage du Premier Protocole sur le plan international, Cf. Pure Appl.Chem., 67.2, 331-343 (1995). Il incorpore également des révisions mineures dans la rédaction pour améliorer la lecture du Premier Protocole.
INTRODUCTION
Après un certain nombre de rencontres et d'ateliers, un groupe de représentants de 27 organisations a adopté par consensus un "Protocole pour la planification, la conduite et l'interprétation des études collaboratives", publié dans Pure & Appl. Chem. 60, 855-864, (1998). Un certain nombre d'organisations ont accepté et utilisé ce protocole. En se basant sur leur expérience et les recommandations du "Codex Committee on Methods of Analysis and Sampling" (programme commun FAO/WHO pour Food Standards. Rapport de la Dix huitième Session, 9-13 Novembre 1992; FAO, Rome, Italie, ALINORM 92/93, sections 34-39), il a été recommandé d'inclure 3 révisions mineures au protocole original. Ce sont : (1) Enlever le plan avec double division des niveaux de teneurs (en anglais : double split level) parce que le terme d'interaction qu'il génère dépend du choix des niveaux et si l'interaction a une signification statistique, elle ne peut pas être interprétée d'un point de vue physique (2). Développer la définition de "matériau" (3). Faire passer de 1 à 2,5 % le critère utilisé pour éliminer un résultat aberrant.
Le protocole révisé qui inclut ces changements est reproduit ci-dessous. Quelques révisions dans la rédaction ont aussi été faites pour améliorer la lecture. Le vocabulaire et les définitions du document "Nomenclature des Etudes Inter-laboratoires (Recommandations 1994)" [publié dans Pure Applied Chem., 66, 1903-1911 (1994)] ont été inclus dans cette révision, ainsi que, autant que possible, les termes appropriés de l'International Organization for Standardization (ISO) modifiés pour les appliquer à la chimie analytique.
PROTOCOLE
1.0. Travail préliminaire
Les études (collaboratives) de performance des méthodes exigent un effort considérable et devraient être entreprises seulement pour des méthodes qui ont reçu ou subi un test préliminaire adéquat. Ce test interne au laboratoire, devrait inclure si possible (quand cela est applicable), l'information sur les points suivants :
1.0.1. Estimation préliminaire de la fidélité
Estimation de l'écart-type total des résultats analytiques intralaboratoire sur l'intervalle de concentration intéressant, étudié au moins à la limite supérieure et à la limite inférieure de l'intervalle de concentration, avec une insistance particulière sur la valeur standard ou la valeur de la spécification.
NOTE 1 : L'écart-type total intralaboratoire est une mesure du manque de fidélité plus globale que celle de l'écart-type de répétabilité de l'ISO, §3.3 ci-dessous. Cet écart-type représente la variation intralaboratoire la plus grande qui peut être attendue des performances de la méthode; elle inclut au moins la variabilité entre jours différents et aussi de préférence entre droites d'étalonnage différentes. Elle inclut les variations entre-séries (entre-lots) et intra-série, (intra-lot). En ce sens elle peut être considérée comme une mesure de la reproductibilité à l'intérieur du laboratoire. Si cette valeur est vraiment dans les limites acceptables, il ne faut pas s'attendre à ce que l'écart type entre laboratoires (écart-type de reproductibilité) soit meilleur. Cette fidélité n'est pas estimée à partir de l'étude minimum décrite dans ce protocole.
NOTE 2 : L'écart-type total intralaboratoire peut aussi être estimé à partir d'essais de robustesse qui indiquent avec quelle rigueur les facteurs expérimentaux doivent être contrôlés et quelles sont les limites de variations autorisées. Ces limites déterminées expérimentalement devraient être incluses dans la description de la méthode.
1.0.2. Erreurs systématique (biais)
Estimations de l'erreur systématique des résultats analytiques sur l'intervalle de concentration et pour les substances à analyser, étudiées au minimum aux limites supérieure et inférieure de l'intervalle de concentration, avec une insistance particulière sur la valeur standard ou de la valeur de la spécification. Les résultats obtenus en appliquant la méthode aux matériaux de référence adéquats doivent être notés.
1.0.3. Recouvrement
Recouvrement d’ »ajouts » effectués sur des matériaux vrais, sur des extraits, sur les solutions de digestion, ou d'autres solutions issues de leur traitement .
1.0.4. Domaine d'application
Possibilité qu'a la méthode d'identifier et de mesurer les formes physiques et chimiques de l'analyte susceptibles d'être présentes dans les matériaux, en tenant compte des effets de matrice.
1.0.5. Interférence
Effet des autres constituants qui sont susceptibles d'être présents à des concentrations appréciables dans les matrices considérées et qui peuvent interférer sur le dosage.
1.0.6. Comparaison de méthode
Résultats de comparaison de la méthode à des méthodes existantes testées et destinées à des usages similaires.
1.0.7. Procédures d'étalonnage
Les procédures spécifiées pour l'étalonnage et la correction de blanc ne doivent pas introduire de biais important dans les résultats.
1.0.8. Description de méthode
La méthode doit être écrite de façon claire et sans ambiguïté.
1.1. Chiffres significatifs
Le laboratoire qui initie l'étude devrait indiquer le nombre de chiffres significatifs qui doit être reporté en se basant sur les données sortant de l'instrument de mesure.
NOTE : En faisant des calculs statistiques à partir des données, il faut utiliser pleinement la puissance du calculateur ou de l'ordinateur et ne pas arrondir ou tronquer les résultats avant de donner la moyenne finale ou les écarts-type. Arrivé à ce stade, les écarts-type sont arrondis à deux chiffres significatifs et les moyennes et déviations correspondantes sont arrondies pour fournir les chiffres significatifs de l'écart-type. Par exemple, si sR = 0,012, x est reporté comme 0,147 et non pas comme 0,1473 ou 0,15 et le coefficient de variation donné est 8,2 % (les symboles sont définis dans l'Appendice 1). Si les calculs d'écarts-type doivent être établis manuellement par étapes avec transfert des résultats intermédiaires, le nombre de chiffres significatifs à retenir pour les nombres au carré devrait être au moins 2 fois le nombre de chiffres fournis par les données plus 1.
2.0. Plan d'étude de performance de la méthode
2.1. Nombre de matériaux
Pour un type unique de substance, il faut utiliser au moins 5 matériaux (matériaux d'essai); ce nombre minimum peut être réduit à 3, seulement si un niveau unique est spécifié pour une matrice unique. Pour ce paramètre du plan d'expériences, les deux parties provenant d'un niveau de teneurs (en anglais : split level) divisé et les deux parties individuelles de répliques effectuées en aveugle (en anglais : blind duplicate) par laboratoire, sont considérées comme un matériau unique.
NOTE 1 : Un matériau est une combinaison "analyte/matrice/concentration" à laquelle s'appliquent les paramètres de performance de la méthode. Ce paramètre détermine l'applicabilité d'une méthode. Pour appliquer la méthode à un certain nombre de substances différentes, un nombre suffisant de matrices et de niveaux devrait être choisi pour tenir compte des interférences potentielles et de la concentration la plus utilisée.
NOTE 2 : Les matériaux d'essai répliqués en "aveugle" ou en "non aveugle" en nombre égal ou supérieur à 2 constituent d'un point de vue statistique un seul matériau (ils ne sont pas indépendants).
NOTE 3 : Un niveau divisé une fois (paire de Youden) analysé en statistique comme une paire constitue un seul matériau; si l'analyse statistique est effectuée et reportée en considérant que les échantillons sont indépendants, ils constituent 2 matériaux. De plus, la paire peut être utilisée pour calculer l'écart-type intralaboratoire sr :
où di est la différence entre 2 valeurs individuelles à partir du niveau divisé pour chaque laboratoire et n le nombre de laboratoires. Dans ce cas particulier l'écart-type entre laboratoires sR est seulement la moyenne des deux valeurs de sR calculées à partir des composantes individuelles du niveau divisé et est utilisé seulement pour vérifier les calculs.
NOTE 4 : Le blanc ou contrôle négatif peut être un matériau ou non selon la finalité de l'analyse. Par exemple, dans l'analyse de traces où il y a des niveaux très faibles (proches de la limite et quantification), les blancs sont considérés comme des matériaux et sont nécessaires pour déterminer les "limites de mesure". Cependant si le blanc est seulement un contrôle de procédure en macro analyse (par ex., la matière grasse dans le fromage) il ne serait pas considéré comme un matériau.
2.2. Nombre de laboratoires
Au moins 8 laboratoires doivent reporter les résultats pour chaque matériau; dans le cas où il n'est pas possible d'obtenir ce nombre (par ex., appareillage très cher ou laboratoires spécialisés requis) l'étude peut être conduite avec un nombre moins important de laboratoires, mais avec un minimum de 5 laboratoires. Si l'étude est réalisée pour une utilisation internationale de la méthode, les laboratoires de différents pays doivent y participer. Dans le cas de méthodes exigeant l'utilisation d'appareils spécialisés, l'étude pourrait inclure l'ensemble des laboratoires disponibles. Dans de tels cas, "n" est utilisé au dénominateur pour calculer l'écart-type au lieu de "n-1". Les laboratoires qui participent par la suite à l'étude doivent démontrer qu'ils peuvent réaliser les analyses aussi bien que les laboratoires participants d'origine.
2.3. Nombre de répliques
Les paramètres de répétabilité doivent être estimés en utilisant l'une des combinaisons suivantes (listées dans l'ordre approximatif de préférence) :
2.3.1. Niveau divisé
Pour chaque niveau qui est divisé et constitue seulement un matériau unique d'un point de vue plan et analyse statistique, utiliser 2 matériaux d'essai presque identiques différant seulement légèrement dans leur concentration en analyte (par exemple de moins de 1 à 5 %). Chaque laboratoire doit analyser chaque matériau d'essai une fois et seulement une fois.
NOTE : Le critère statistique qui doit être satisfait pour qu'une paire d'échantillons à analyser constitue un niveau divisé est que l'écart-type de reproductibilité des 2 parties du niveau divisé une fois doit être égal.
2.3.2. Combinaison de répliques en aveugle et de niveau divisé
Utiliser des niveaux divisés pour quelques matériaux et des répliques en aveugle pour d'autres matériaux dans la même étude (valeurs uniques pour chaque matériau d'essai soumis).
2.3.3. Répliques en aveugle
Pour chaque matériau, utiliser des répliques en aveugle identiques; quand les données ne peuvent être censurées (par ex., entrée, calcul et impression automatique), il est possible d'utiliser des répliques identiques non réalisées en aveugle.
2.3.4. Répliques connues
Pour chaque matériau, utiliser des répliques connues (au moins 2 analyses de prises d'essai issues d'un même matériau d'essai), mais seulement lorsque l'utilisation de l'un des plans précédents n'est pas pratique.
2.3.5. Analyses indépendantes
Utiliser seulement une prise d'essai unique de chaque matériau (c'est-à-dire, ne pas réaliser des analyses multiples) dans l'étude, mais compenser l'impossibilité de calculer les paramètres de répétabilité par l'étude des paramètres de contrôle de qualité ou les autres données intralaboratoires obtenues indépendamment de l'étude de performance de la méthode.
3.0. Analyse statistique (voir diagramme, A.4.1.)
Pour l'analyse statistique des données, les procédures statistiques requises listées ci-dessous doivent être réalisées et les résultats reportés. Les procédures supplémentaires, additionnelles, ne sont pas écartées.
3.1. Données valides
Seuls les résultats valides devraient être reportés et soumis au traitement statistique. Les données valides sont les données résultant de performance normale des analyses de laboratoire; elles ne sont pas entachées par des déviations de méthode, de mauvais fonctionnement des instruments, d'événements inattendus pendant la réalisation de la méthode ou par des erreurs d'écriture, de typographie et d'arithmétique.
3.2. Analyse de variance à un facteur
L'analyse de variance à un facteur et le traitement des valeurs aberrantes doivent être appliqués séparément à chaque matériau (matériau d'essai) pour estimer les composantes de la variance et les paramètres de répétabilité et reproductibilité.
3.3. Estimation initiale
Calculer la moyenne x (= la moyenne des moyennes des laboratoires), le coefficient de variation de répétabilité, RSDr, et le coefficient de variation de reproductibilité, RSDR sans enlever les valeurs aberrantes, mais en utilisant seulement les données valides.
3.4. Traitement des valeurs aberrantes
Les paramètres estimés de fidélité qui doivent être aussi reportés sont basés sur les données initiales débarrassées de toutes les valeurs aberrantes signalées par la procédure harmonisée de 1994 d'élimination des valeurs aberrantes. Cette procédure consiste essentiellement à appliquer les tests de Cochran et de Grubbs (au seuil de probabilité P de 2,5 %, unilatéral pour le Cochran et bilatéral pour le Grubbs) jusqu'à ce qu'il n'y ait plus de valeurs aberrantes indiquées, ou jusqu'à ce que le nombre initial des laboratoires fournissant des résultats valides chute de 22,2 % (= 2/9).
NOTE : Une consultation rapide du laboratoire qui reporte des valeurs suspectes peut permettre de corriger des fautes ou de découvrir les conditions qui ont conduit aux données invalides, 3.1. Il est préférable de reconnaître des fautes et des résultats invalides per se que de se baser sur des tests statistiques pour enlever des valeurs qui s'écartent.
3.4.1. Test de Cochran
D'abord appliquer le test de Cochran des résultats aberrants (test unilatéral à P = 2,5 %) et enlever tout laboratoire dont la valeur critique excède la valeur tabulée pour le nombre de laboratoires et de répliques considérées, Appendice A.3.1,3.4.2.
3.4.2. Tests de Grubbs
Appliquer le test de Grubbs bilatéral aux valeurs uniques et enlever tout laboratoire aberrant. Si aucun laboratoire n'est signalé aberrant, appliquer alors les tests de Grubbs pour les valeurs par paire (bilatéral), P = 2,5 % au total. Enlever tout(s) laboratoire(s) signalé(s) par ces tests dont la valeur critique excède la valeur tabulaire donnée dans la colonne appropriée de la table, Appendice A.3.3. Arrêter quand l'application suivante du test signale plus de 22,2 % (2 sur 9) des laboratoires comme aberrants.
NOTE : Les tests de Grubbs doivent être appliqués sur un matériau à la fois, aux séries des moyennes répliquées de tous les laboratoires, et non aux valeurs individuelles obtenues à partir de plans répliqués, parce que la distribution de toutes les valeurs prises ensemble est multimodale, non Gaussienne, c'est-à-dire que leurs différences à partir de la moyenne générale pour ce matériau ne sont pas indépendantes.
3.4.3. Estimation finale
Recalculer les paramètres comme dans le § 3.3. après avoir enlevé les laboratoires signalés par le calcul précédent. Si aucune des données aberrantes n'a été enlevée par la séquence Cochran-Grubbs terminer le test. Sinon, appliquer à nouveau la séquence Cochran-Grubbs aux données débarrassées des résultats aberrants signalés, jusqu'à ce qu'il n'y en ait plus de signalés ou jusqu'à ce que plus de 22,2 % (2 laboratoires sur 9) soient enlevés dans le cycle suivant. Voir le diagramme A.3.4.
4.0. Rapport final
Le rapport final doit être publié et inclure tous les résultats valides. Les autres informations et les paramètres doivent être reportés dans un format similaire (pour chaque sujet reporté) à celui indiqué ici, quand cela est possible.
Tests de performance de méthode [x] réalisés au niveau international en [année(s)] par [organisation] dans laquelle [y et z] laboratoires ont participé, chacun réalisant [k] répliques, ont donné les résultats statistiques suivants :
TABLEAU DES PARAMETRES DE PERFORMANCE DES METHODES
Analyte; Résultats exprimés en [unités]
Matériau [Description et liste en colonnes dans un tableau par ordre croissant de grandeur des moyennes]
Nombre de laboratoires retenus après élimination des résultats aberrants.
Nombre de laboratoires aberrants
Code (ou désignation) des laboratoires aberrants
Nombre de résultats acceptés
Moyenne
Valeur vraie ou acceptée comme vraie, si connue
Ecart-type de répétabilité (sr)
Coefficient de variation de répétabilité (RSDr)
Limite de répétabilité, r (2,8 x sr)
Ecart-type de reproductibilité (sR)
Ecart-type de reproductibilité (RSDR)
Ecart-type de reproductibilité, R (2,8 x sR)
4.1. Symboles
Une série de symboles à utiliser dans les rapports et publications est jointe dans l'Appendice 1 (A.1.).
4.2. Définitions
Une série de définitions à utiliser dans les rapports d'étude et les publications est donnée dans l'Appendice 2 (A.2.).
4.3. Divers
4.3.1. Recouvrement
Le recouvrement d'un analyte ajouté pour contrôler la méthode ou le biais d'un laboratoire doit être calculé comme indiqué ici :
Recouvrement [Marginal], % =
(Analyte total trouvé - analyte présent originellement) x 100/(analyte ajouté)
Bien que l'analyte puisse être exprimé en concentration ou en quantité, les unités doivent être partout identiques. Quand la quantité d'analyte est déterminée par analyse, elle doit être déterminée partout de la même manière.
Les résultats analytiques pour le recouvrement doivent être reportés sans correction. Reporter les recouvrements séparément.
4.3.2. Quand sL est négatif
Par définition sR est plus grand ou égal à sr dans les études de performance de la méthode; il peut arriver parfois que l'estimation de sr soit supérieure à l'estimation de sR (la variance des répliques est supérieure à la variance entre laboratoires et la valeur calculée sL2 est alors négative). Quand cela arrive, mettre sL = 0 et sR = sr.
5. REFERENCES
- Horwitz, W. (1988) Protocol for the design, conduct, and interpretation of method-performance studies. Pure & Appl. Chem. 60, 855-864.
- Pocklington, W.D. (1990) Harmonized protocol for the adoption of standardized analytical methods and for the presentation of their performance characteritics. Pure and Appl. Chem. 62, 149-162.
- International Organization for Standardization. International Standard 5725-1986. Under revision in 6 parts; individual parts may be available from National Standards member bodies.
A. APPENDICES
A.1 APPENDICE 1. SYMBOLES
Utiliser les séries de symboles et termes suivants pour désigner les paramètres développés par une étude de performance de méthode.
|
Moyenne (des moyennes de laboratoires) |
x |
|
Ecarts types |
s (estimation) |
|
Répétabilité |
|
|
“Pur” interlaboratoire |
|
|
Reproductibilité |
|
|
Variances |
|
|
Coefficient de variation |
RSD (avec les indices, r, L, and r) |
|
Différences maximales (comme définies par ISO 5725-1986); Voir A.2.4 and A.2.5) |
|
|
Limité de répétabilité |
|
|
Limite de reproductibilité |
|
|
Nombre de répliques par laboratoire |
k (général) |
|
Nombre moyen de répliques par laboratoire i |
k pour une plan équilibré) |
|
Nombre de laboratoires |
L |
|
Nombre de matériaux (matériaux d’essai) |
m |
|
Nombre total de résultats d’essai |
n (= kL pour un plan équilibré) |
|
Nombre total de valeurs pour une étude donnée |
N (= kLm pour un plan totalement équilibrée) |
Si d'autres symboles sont utilisés, il faut expliquer totalement leur relation avec les symboles recommandés.
APPENDICE 2. DEFINITIONS
A.2.
Utiliser les définitions suivantes. Les trois premières définitions utilisent le document de l'IUPAC "Nomenclature of Interlaboratory Studies" (approuvé pour publication en 1994). Les deux définitions suivantes sont issues des données de l'ISO 3534-1 : 1993. Tous les résultats des essais sont supposés être indépendants c'est-à-dire, "obtenus sans avoir subi l'influence d'un résultat quelconque précédent sur le même matériau ou sur un matériau d'essai similaire. Les mesures quantitatives de fidélité dépendent de façon critique des conditions stipulées. Les conditions de répétabilité et de reproductibilité constituent des ensembles particuliers de conditions extrêmes stipulées".
A.2.1. Etude de performance de méthode
Une étude interlaboratoire dans laquelle tous les laboratoires suivent le même protocole écrit et utilisent le même méthode à tester pour mesurer une quantité dans les séries d'articles identiques à tester [échantillons, matériaux d'essai. Les résultats reportés sont utilisés pour estimer les caractéristiques de performance de la méthode. Habituellement ces caractéristiques sont la fidélité intralaboratoire et interlaboratoire, et si nécessaire et possible, d'autres caractéristiques pertinentes comme l'erreur systématique, le recouvrement, les paramètres du contrôle interne de qualité, la sensibilité, la limite de quantification, et le domaine d'application.
A.2.2. Etude de performance du laboratoire
Une étude interlaboratoire qui consiste en un nombre d'analyses ou de mesures supérieur à un, réalisé en utilisant la méthode choisie ou utilisée par chaque laboratoire. Les résultats reportés sont comparés à ceux d'autres laboratoires ou à une valeur connue ou assignée comme référence, avec en général l'objectif d'évaluer ou d'améliorer la performance d'un laboratoire.
A.2.3. Etude de la certification d'un matériau
Une étude interlaboratoire qui assigne une valeur de référence ("valeur vraie") à une quantité (concentration ou propriété) dans un article à tester, en indiquant habituellement une incertitude déclarée.
A.2.4. Limite de répétabilité (r)
Quand la moyenne des valeurs obtenues à partir de deux déterminations indépendantes avec la même méthode sur des articles identiques dans le même laboratoire par le même opérateur utilisant le même appareil dans un court intervalle de temps se situe dans l'intervalle des valeurs moyennes citées dans le Rapport Final, 4.0., la différence absolue entre deux résultats d'essais devrait être inférieure ou égale à la limite de répétabilité (r) = [2, 8 x sr] qui peut être généralement déduite par interpolation linéaire de sr à partir du Rapport.
NOTE : Cette définition, et la définition correspondante de limite de reproductibilité, ont été obtenues à partir de cinq termes découlant les uns de autres; ces définitions ont été étendues pour permettre de les appliquer par interpolation à un article à tester dont la moyenne n'est pas la même que celle utilisée pour établir les paramètres d'origine, ce qui est le cas habituel quand on applique ces définitions. Le terme "limite de répétabilité [et reproductibilité]" est appliqué spécifiquement à une probabilité de 95 % et est pris comme 2,8 x sr [ ou sR]. Le terme général pour ce concept statistique appliqué à toute mesure de tendance (par exemple, la médiane) et avec d'autres probabilités (par exemple, 99%) est "différence critique de répétabilité [et reproductibilité]".
A.2.5. Limite de reproductibilité (R)
Quand la moyenne des valeurs obtenues à partir de deux dosages uniques avec la même méthode sur des articles à tester identiques dans différents laboratoires avec différents opérateurs utilisant un équipement différent, se situe dans l'intervalle des valeurs moyennes citées dans le Rapport Final, 4.0., la différence absolue entre deux résultats d'essai doit être inférieure ou égale à la limite de reproductibilité (R) [=2,8 x sR] qui peut être généralement déduite par l'interpolation linéaire sR à partir du Rapport.
NOTE 1 : Quand les résultats du test interlaboratoire le permettent, les valeurs r et R peuvent être indiquées comme des valeurs relatives (par exemple, pourcentage de la valeur moyenne déterminée) au lieu de valeurs absolues.
NOTE 2 : Quand le résultat final reporté dans l'étude est une moyenne obtenue à partir de plus d'une valeur, c'est-à-dire k plus grand que 1, la valeur de R doit être ajustée selon la formule suivante avant d'utiliser R pour comparer les résultats d'analyse de routine réalisées en simple exemplaire entre deux laboratoires :
- R' = R2 + r2 (1 - [1/k])1/2
Il faut réaliser des ajustements similaires dans le cas de résultats répétés constituants les valeurs finales pour sR et RSDR s'ils doivent être des paramètres reportés pour le contrôle de qualité.
NOTE 3 : La limite de répétabilité, r, peut être interprétée comme le degré d'accord à l'intérieur duquel deux résultats d'essai individuels d'un laboratoire doivent se trouver dans 95 % des cas. La limite de reproductibilité, R, peut être interprétée comme le degré d'accord à l'intérieur duquel deux résultats d'essai individuels réalisés dans différents laboratoires doivent se trouver dans 95 % des cas.
NOTE 4 : Les estimations de sR peuvent être obtenues seulement à partir d'une étude de performance de méthode planifiée et organisée; les estimations de sr peuvent être obtenues à partir du travail de routine dans un laboratoire en utilisant des cartes de contrôle. Pour des analyses occasionnelles, en l'absence de carte de contrôle, la fidélité intralaboratoire peut être évaluée approximativement comme la moitié de sR (Pure and Appl. Chem., 62, 149-162 (1990), Sec. I.3. Note.).
A.2.6. Analyse de variance à un facteur
L'analyse de variance à un facteur est le procédé statistique pour obtenir des estimations de la variabilité intralaboratoire et interlaboratoire, matériau par matériau. Des exemples de calculs pour les plans à niveau unique et à niveau unique divisé une fois peuvent être trouvés dans la norme ISO 5725-1986.
APPENDICE 3. VALEURS CRITIQUES
A.3.1. Valeurs critiques pour le rapport maximum des variances de Cochran au niveau de rejet 2,5 % (test unilatéral), exprimé en pourcentage de la variance la plus haute par rapport à la variance totale ; r = nombre de répétitions.
|
Nb. of Labs |
r=2 |
r = 3 |
r=4 |
r = 5 |
r = 6 |
|
4 |
94.3 |
81.0 |
72.5 |
65.4 |
62.5 |
|
5 |
88.6 |
72.6 |
64.6 |
58.1 |
53.9 |
|
6 |
83.2 |
65.8 |
58.3 |
52.2 |
47.3 |
|
7 |
78.2 |
60.2 |
52.2 |
47.3 |
42.3 |
|
8 |
73.6 |
55.6 |
47.4 |
43.0 |
38.5 |
|
9 |
69.3 |
51.8 |
43.3 |
39.3 |
35.3 |
|
10 |
65.5 |
48.6 |
39.9 |
36.2 |
32.6 |
|
11 |
62.2 |
45.8 |
37.2 |
33.6 |
30.3 |
|
12 |
59.2 |
43.1 |
35.0 |
31.3 |
28.3 |
|
13 |
56.4 |
40.5 |
33.2 |
29.2 |
26.5 |
|
14 |
53.8 |
38.3 |
31.5 |
27.3 |
25.0 |
|
15 |
51.5 |
36.4 |
29.9 |
25.7 |
23.7 |
|
16 |
49.5 |
34.7 |
28.4 |
24.4 |
22.0 |
|
17 |
47.8 |
33.2 |
27.1 |
23.3 |
21.2 |
|
18 |
46.0 |
31.8 |
25.9 |
22.4 |
20.4 |
|
19 |
44.3 |
30.5 |
24.8 |
21.5 |
19.5 |
|
20 |
42.8 |
29.3 |
23.8 |
20.7 |
18.7 |
|
21 |
41.5 |
28.2 |
22.9 |
19.9 |
18.0 |
|
22 |
40.3 |
27.2 |
22.0 |
19.2 |
17.3 |
|
23 |
39.1 |
26.3 |
21.2 |
18.5 |
16.6 |
|
24 |
37.9 |
25.5 |
20.5 |
17.8 |
16.0 |
|
25 |
36.7 |
24.8 |
19.9 |
17.2 |
15.5 |
|
26 |
35.5 |
24.1 |
19.3 |
16.6 |
15.0 |
|
27 |
34.5 |
23.4 |
18.7 |
16.1 |
14.5 |
|
28 |
33.7 |
22.7 |
18.1 |
15.7 |
14.1 |
|
29 |
33.1 |
22.1 |
17.5 |
15.3 |
13.7 |
|
30 |
32.5 |
21.6 |
16.9 |
14.9 |
13.3 |
|
35 |
29.3 |
19.5 |
15.3 |
12.9 |
11.6 |
|
40 |
26.0 |
171 |
13.5 |
11.6 |
10.2 |
|
50 |
21.6 |
14.3 |
11.4 |
9.7 |
8.6 |
Les tableaux A.3.1. et A.3.3. ont été calculés par R. Albert (Octobre 1993) par simulation à l'ordinateur avec plusieurs passages d'environ 7000 cycles chacun pour chaque valeur, et ont été ensuite lissés. Bien que le tableau A.3.1. ne soit strictement applicable qu'à un plan équilibré (même nombre de répétitions pour tous les laboratoires) il peut être appliqué à un plan non équilibré sans trop d'erreurs, s'il y a seulement quelques déviations.
A.3.2. Calcul du rapport de variance maximum de Cochran pour rejeter les résultats aberrants
Entrer dans l'ordinateur la variance intralaboratoire pour chaque laboratoire et diviser la plus grande de ces variances par la somme de toutes les variances et multipliez par 100. Le quotient résultant est la statistique de Cochran qui indique la présence d'un résultat aberrant à retirer si ce quotient excède la valeur critique indiquée dans la table de Cochran donnée ci-dessus pour le nombre de répétitions et laboratoires spécifiés.
A.3.3. Valeurs critiques pour les tests des résultats aberrants de Grubbs au niveau de rejet 2,5 % (test bilatéral), 1,25 % (test unilatéral), exprimé par le pourcentage de diminution des écart-type résultant de l'enlèvement de la (des) valeurs(s) suspectes.
|
No. of labs |
Une valeur la plus haute ou la plus basse |
Deux valeurs les plus hautes ou les plus basses |
Une valeur la plus haute et une la plus basse |
|
4 |
86.1 |
98.9 |
99.1 |
|
5 |
73.5 |
90.9 |
92.7 |
|
6 |
64.0 |
81.3 |
84.0 |
|
7 |
57.0 |
73.1 |
76.2 |
|
8 |
51.4 |
66.5 |
69.6 |
|
9 |
46.8 |
61.0 |
64.1 |
|
10 |
42.8 |
56.4 |
59.5 |
|
11 |
39.3 |
52.5 |
55.5 |
|
12 |
36.3 |
49.1 |
52.1 |
|
13 |
33.8 |
46.1 |
49.1 |
|
14 |
31.7 |
43.5 |
46.5 |
|
is |
29.9 |
41.2 |
44.1 |
|
16 |
28.3 |
39.2 |
42.0 |
|
17 |
26.9 |
37.4 |
40.1 |
|
18 |
25.7 |
35.9 |
38.4 |
|
19 |
24.6 |
34.5 |
36.9 |
|
20 |
23.6 |
33.2 |
35.4 |
|
21 |
22.7 |
31.9 |
34.0 |
|
22 |
21.9 |
30.7 |
32.8 |
|
23 |
21.2 |
29.7 |
31.8 |
|
24 |
20.5 |
28.8 |
30.8 |
|
25 |
19.8 |
28.0 |
29.8 |
|
26 |
19.1 |
27.1 |
28.9 |
|
27 |
18.4 |
26.2 |
28.1 |
|
28 |
17.8 |
25.4 |
27.3 |
|
29 |
17.4 |
24.7 |
26.6 |
|
30 |
17.1 |
24.1 |
26.0 |
|
40 |
13.3 |
19.1 |
20.5 |
|
50 |
11.1 |
16.2 |
17.3 |
A.3.4. Calcul des valeurs du test de Grubbs
Pour calculer la statistique du test de Grubbs pour les valeurs uniques, entrer dans l'ordinateur la moyenne de chaque laboratoire et calculer l'écart-type (SD) de ces L moyennes (désigné par s à l'origine). Calculer l'écart-type de l'ensemble des moyennes en enlevant la moyenne la plus haute (sH) ; calculer l'écart-type de l'ensemble des moyennes en enlevant la moyenne la plus basse (SL). Le calcul de la diminution de l'écart-type en pourcentage, pour les deux est :
- 100 x [1 - (sL/s] et 100 x [1 - sH/s]
La diminution la plus forte obtenue pour ces deux calculs est la statistique de Grubbs pour les valeurs uniques, qui signale la présence d'un résultat aberrant qu'il faut enlever pour un niveau P = 2,5 %, en test bilatéral, si sa valeur excède la valeur critique tabulée dans la colonne 2 de la table A.3.3., pour le nombre de moyennes de laboratoire utilisé pour calculer la valeur d'origine s.
Pour calculer la statistique dans le test de Grubbs pour les paires, calculer le pourcentage de diminution de l'écart-type en enlevant les deux moyennes les plus hautes, et aussi les plus basses, comme ci-dessus. Comparer le pourcentage de changement de l'écart-type le plus élevé avec les valeurs tabulées de la colonne 3 et procédez selon (1) ou (2):
(1) Si la valeur tabulée est dépassée, enlevez la paire responsable. Recommencer le cycle en partant au début avec le test de Cochran de variance extrême, le test de Grubbs de la valeur extrême, et le test de Grubbs de la valeur extrême pour les paires.
(2) Quand les valeurs suivantes ne sont plus enlevées, calculer le pourcentage de changement de l'écart-type obtenu en rejetant à la fois et ensemble la valeur extrême la plus haute et la valeur extrême la plus basse et comparer avec les valeurs tabulées de la dernière colonne de A.3.3. Si la valeur tabulée est dépassée, enlevez la paire haute-basse des moyennes, et recommencer le cycle avec le test de Cochran jusqu'à ce que des valeurs suivantes ne soient plus enlevées. Dans tous les cas, arrêter le test des résultats aberrants lorsque plus de 22,2 % (2/9) des moyennes sont enlevées.
A..4. APPENDICE 4
A.4.1. Diagramme pour enlever les valeurs aberrantes
IUPAC 1994 PROCEDURE STATISTIQUE HARMONISEE