Ian Farrance

1 Școală de Științe Medicale, Universitatea RMIT, Bundoora, Victoria 3083, Australia

calcularea

Robert Frenkel

2 Institutul Național de Măsurare Australia, Bradfield Road, West Lindfield, NSW 2070, Australia

Abstract

Evaluarea datelor de măsurare - Ghid pentru exprimarea incertitudinii în măsurare (denumit de obicei GUM) oferă reguli generale pentru evaluarea și exprimarea incertitudinii în măsurare. Când un măsurand, y, este calculat din alte măsurători printr-o relație funcțională, incertitudinile în variabilele de intrare se vor propaga prin calcul până la o incertitudine în ieșirea y. Modul în care astfel de incertitudini sunt propagate printr-o relație funcțională oferă o mare parte din provocarea matematică de a înțelege pe deplin GUM.

Scopul acestei revizuiri este de a oferi o imagine de ansamblu generală a GUM și de a arăta cum se poate realiza calculul incertitudinii în măsurand printr-o relație funcțională. Adică, începând cu ecuația generală pentru combinarea componentelor de incertitudine, așa cum este subliniat în GUM, arătăm cum această ecuație generală poate fi aplicată diferitelor relații funcționale pentru a obține o incertitudine standard combinată pentru valoarea de ieșire a funcției particulare (măsurand ). Ecuația GUM poate fi aplicată oricărei forme matematice sau relații funcționale (punctul de plecare pentru calculele de laborator) și descrie propagarea incertitudinii de la variabilele de intrare la valoarea de ieșire a funcției (punctul final sau rezultatul laboratorului calcul). Se sugerează o abordare bazată pe reguli, cu o serie de reguli mai comune tabelate pentru calcularea de rutină a incertitudinii de măsurare.

Introducere

Odată cu adoptarea standardului de laborator al Organizației Internaționale pentru Standardizare (ISO) Laboratoare medicale - Cerințe particulare pentru calitate și competență (ISO 15189, standardul australian AS 4633), laboratoarele de patologie din Australia (și din alte părți) au fost obligate să furnizeze estimări ale incertitudinii măsurării pentru toate rezultatele testelor cantitative.

Măsurand

Măsurand este termenul care indică cantitatea măsurată. Acesta înlocuiește termenii anteriori, cum ar fi analitul sau numele substanței măsurate, care a fost adesea furnizat fără alte definiții. VIM definește măsurandul ca „cantitatea intenționată să fie măsurată”, dar oferă o definiție suplimentară prin necesitatea includerii sistemului de măsurare și a condițiilor în care se efectuează măsurarea. Aceste condiții sunt necesare pentru a defini pe deplin măsurandul, deoarece diferite proceduri de măsurare pot determina diferite proprietăți sau atribute ale unei substanțe. De exemplu, măsurarea sodiului seric printr-o procedură directă de electrod selectiv de ioni oferă un măsurand care ar trebui descris ca activitate de sodiu seric, în timp ce sodiul seric măsurat prin fotometrie cu flacără sau o procedură indirectă de electrod selectiv de ioni oferă un măsurand care ar trebui descris ca concentrație de sodiu seric.

Alte exemple și discuții despre termenul de măsurand sunt disponibile în mai multe articole 1, 7, 12, 13 și manuale recente despre biochimie clinică.

Incertitudinea măsurării și eroarea de măsurare

Rezultatul oricărei măsurători cantitative are două componente esențiale:

O valoare numerică (exprimată în unități SI conform cerințelor ISO 15189) care oferă cea mai bună estimare a cantității măsurate (măsurandul). Această estimare poate fi o singură măsurare sau valoarea medie a unei serii de măsurători.

O măsură a incertitudinii asociate cu această valoare estimată. În biochimia clinică, aceasta poate fi variabilitatea sau dispersia unei serii de măsurători similare (de exemplu, o serie de specimene de control al calității) exprimate ca o incertitudine standard (deviație standard) sau o incertitudine standard combinată (vezi mai jos).

Prin definiție, termenul eroare (sau eroare de măsurare) este diferența dintre valoarea reală și valoarea măsurată. Valoarea cea mai probabilă sau „adevărată” poate fi astfel considerată drept valoarea măsurată, inclusiv o declarație de incertitudine care caracterizează dispersia posibilelor valori măsurate. Întrucât valoarea măsurată și componenta sa de incertitudine sunt în cel mai bun caz doar estimări, rezultă că adevărata valoare este nedeterminată (VIM, GUM). Incertitudinea este cauzată de interacțiunea erorilor care creează dispersie în jurul valorii estimate a măsurandului; cu cât dispersia este mai mică, cu atât este mai mică incertitudinea.

Chiar dacă termenii eroare și incertitudine sunt folosiți oarecum interschimbabil în descrierile de zi cu zi, aceștia au de fapt semnificații diferite în conformitate cu definițiile furnizate de VIM și GUM. Acestea nu trebuie utilizate ca sinonime. Simbolul ± (plus sau minus) care urmărește adesea valoarea raportată a unui măsurand și cantitatea numerică care urmează acestui simbol, indică incertitudinea asociată cu măsurandul specific și nu eroarea.

Dacă măsurători repetate se fac din aceeași cantitate, procedurile statistice pot fi utilizate pentru a determina incertitudinile din procesul de măsurare. Acest tip de analiză statistică oferă incertitudini care sunt determinate din datele în sine, fără a necesita estimări suplimentare. Variabilele importante în astfel de analize sunt media, deviația standard și incertitudinea standard a mediei (denumită și deviația standard a mediei sau eroarea standard a mediei).

Erori sistematice și aleatorii (incertitudini)

Erorile experimentale pot fi împărțite în două clase: erori sistematice și erori aleatorii. Trei termeni care sunt adesea folosiți în asociere cu erori de laborator sunt acuratețe (inexactitate), părtinire și precizie (imprecizie). Atât VIM, cât și GUM definesc acuratețea ca un concept calitativ care descrie apropierea acordului dintre o valoare a mărimii măsurate și o valoare adevărată a cantității unui măsurand. Ca atare, acuratețea include efectele erorii sistematice, chiar dacă nu are o valoare numerică. 8, 9 Bias este termenul folosit pentru a descrie amploarea oricărei erori sistematice, VIM definind biasul ca „o estimare a unei erori sistematice de măsurare”. 8 Precizia descrie variabilitatea imprevizibilă (aleatorie) a măsurătorilor replicate ale unui măsurand.

Principalele distincții în ceea ce privește erorile sistematice și aleatorii sunt următoarele:

Eroarea sistematică (părtinire) poate, cel puțin teoretic, să fie eliminată din rezultat printr-o corecție adecvată.

Erorile aleatorii apar din variații imprevizibile care influențează procedura de măsurare, sunt asociate cu măsurarea reală (de exemplu, eșecul de a ține seama în mod corespunzător de fluctuațiile de temperatură sau măsurarea variabilității pipetei) sau posibila imprecizie în definiția măsurandului în sine. VIM și GUM se referă la astfel de factori străini și de mediu, cum ar fi cantitățile de influență.

Erorile aleatorii pot fi analizate statistic, în timp ce erorile sistematice sunt rezistente la analiza statistică. Erorile sistematice sunt în general evaluate prin proceduri nestatistice.

În laboratoarele clinice, eroarea aleatorie (incertitudine) este de obicei evaluată prin proceduri interne de control al calității.

Procedurile GUM se bazează pe presupunerea că toate erorile sistematice au fost corectate și singura incertitudine legată de eroarea sistematică este incertitudinea corectării în sine. Această incertitudine de corecție și contribuția sa la incertitudinea măsurandului pot fi de tip A sau de tip B, în funcție de procedura de evaluare utilizată (a se vedea incertitudinile de tip A și de tip B de mai jos).

Incertitudinea valorii raportate a măsurandului cuprinde incertitudinea datorată erorilor aleatorii și incertitudinea oricăror corecții pentru erori sistematice.

Eroarea sistematică, adesea denumită părtinire, poate fi identificată ca o valoare fixă ​​pentru o discrepanță și ar trebui corectată cu cea mai scurtă oportunitate practică din procesul de măsurare. De exemplu, dacă se știe că un anumit set de scale clinice are o eroare sistematică sau o prejudecată de -1,0 grame la o greutate de 100 de grame (ceea ce înseamnă că citește o greutate reală de 100 de grame ca 99 de grame), atunci 1,0 gram ar trebui să fie adăugat la orice citire atunci când cântarul măsoară o greutate în apropiere de 100 de grame. Dar, deoarece prejudecata de -1,0 grame în sine are o incertitudine, (ar putea fi între, să zicem -0,9 grame și -1,1 grame, în funcție de calitatea procedurii de calibrare), greutatea corectată va avea ea însăși o incertitudine (în acest exemplu, incertitudinea erorii sistematice este de ± 0,1 grame sau o prejudecată de -1,0 ± 0,1 grame).

Alternativ, o eroare aleatorie indică faptul că eroarea fluctuează pe durata perioadei de măsurare sau de la un set de măsurători la următoarea. Această variație poate fi cauzată de mici fluctuații continue în mediu, în instrumentul de măsurare sau în orice moment al procesului de măsurare. Din acest motiv, este mai potrivit să ne referim la erori aleatorii la plural, ca erori aleatorii. De exemplu, atunci când un instrument furnizează o citire digitală, erorile aleatorii se pot manifesta printr-o fluctuație în cel mai puțin (sau cel puțin două sau chiar mai multe) cifre semnificative din afișajul de ieșire. Gama de fluctuații este o măsură a incertitudinii create de erorile aleatorii.

Astăzi, multe laboratoare clinice au mai multe instrumente (sau module analitice) care pot efectua același grup de teste. Laboratoarele cu sisteme automatizate care încorporează mai multe module analitice care oferă aceeași capacitate de testare pot furniza estimări de incertitudine pentru fiecare dintre măsurandele pe bază de sistem, indiferent de modul care a produs efectiv rezultatul. În acest tip de sistem automatizat de testare, orice diferențe care pot fi observate efectiv între module vor fi considerate probabil ca efecte aleatorii, cu condiția ca toate erorile sistematice să fi fost corect identificate și corectate corespunzător. Pe de altă parte, dacă declarația de incertitudine este destinată să se aplice unui anumit instrument sau modul, imprecizia sa în raport cu grupul va necesita o evaluare separată, cu condiția ca erorile sistematice să fie corectate în mod corespunzător.

În general, deși eroarea se poate referi la o singură discrepanță (ca pentru o eroare sistematică) sau la fluctuații care reprezintă multe erori (ca și pentru erorile aleatorii), efectul tuturor acestor erori este incertitudinea. Chiar și după ce toate erorile sistematice au fost corectate în mod corespunzător, rămâne o incertitudine (așa cum s-a discutat mai sus), deoarece corectarea în sine trebuie să conțină erori aleatorii și, prin urmare, este supusă incertitudinii. Acesta este motivul pentru care GUM descrie incertitudinea ca un parametru care caracterizează dispersia valorilor care pot fi atribuite măsurandului.

Incertitudinea măsurării și terminologia GUM

Definițiile termenilor metrologici generali utilizați de GUM sunt cele furnizate de VIM, cu termeni statistici de bază preluați în principal din Standardul internațional ISO 3534-1. Termenii și conceptele statistice de bază sunt rezumate în anexa C a GUM, cu un glosar al principalelor simboluri prevăzute în anexa J.

Termenii care pot fi specifici GUM dar care fac acum parte din incertitudinea vocabularului măsurătorilor sunt definiți separat în cadrul GUM. Următoarele definiții sunt cele furnizate în secțiunea 2.3 din GUM ca „termeni specifici acestui ghid”:

„Incertitudine standard: incertitudinea rezultatului unei măsurări exprimată ca deviație standard.”

„Evaluare de tip A (a incertitudinii): orice metodă de evaluare a incertitudinii utilizând analiza statistică a unei serii de observații.”

„Evaluarea de tip B (a incertitudinii): o metodă de evaluare a incertitudinii prin alte mijloace decât analiza statistică a unei serii de observații.”

„Incertitudine standard combinată: incertitudine standard a rezultatului unei măsurători atunci când acel rezultat este obținut din valorile unui număr de alte mărimi, egale cu rădăcina pătrată pozitivă a unei sume de termeni, termenii fiind varianțele sau covarianțele aceste alte cantități ponderate în funcție de modul în care rezultatul măsurării variază în funcție de modificările acestor cantități. ”Incertitudinea standard combinată poate conține termeni ale căror componente sunt derivate din evaluările de tip A și/sau de tip B fără discriminare între tipuri (a se vedea mai jos).

„Incertitudine extinsă: cantitate care definește un interval despre rezultatul unei măsurări care ar putea fi de așteptat să cuprindă o fracțiune mare din distribuția valorilor care ar putea fi atribuită în mod rezonabil măsurandului.”

„Factor de acoperire (k): factor numeric utilizat ca multiplicator al incertitudinii standard combinate pentru a obține o incertitudine extinsă.” Factorul de acoperire este în esență același cu scorul Z sau valoarea Z în terminologia statistică.

Chiar dacă termenul de incertitudine standard are aceeași valoare numerică și formă matematică ca o abatere standard, semnificația statistică a abaterii standard nu este aceeași cu incertitudinea standard. În statistici, există multe situații în care abaterea standard nu implică prezența erorilor sau incertitudinea măsurării. În schimb, abaterea standard descrie pur și simplu dispersia sau răspândirea observațiilor. Astfel de exemple ar include intervalul de referință biologică pentru un măsurand sau măsurarea înălțimii indivizilor adulți cu un anumit fond etnic și gen. Astfel, nu ar fi potrivit să se asocieze diferența dintre înălțimea unui individ și înălțimea medie a eșantionului ca fiind o eroare și în mod normal nu s-ar considera dispersia înălțimilor ca fiind un fel de incertitudine.

Ar trebui remarcată din nou distincția dintre eroare și incertitudine. O eroare este discrepanța dintre o valoare măsurată și valoarea reală sau reală. Incertitudinea este efectul multor erori. Acest efect se poate manifesta ca variabilitate în determinările replicate ale măsurandului sau, ca variabilitate „moștenită” într-o singură componentă a măsurandului. Aceste două manifestări de incertitudine corespund categoriilor de tip A și de tip B care vor fi discutate mai jos.

În plus față de termeni descriptivi specifici, precum cei descriși mai sus, anexa J a GUM oferă un glosar al simbolurilor principale utilizate în diferitele expresii matematice și statistice. Este important să înțelegem pe deplin simbolurile utilizate în GUM, în special cele utilizate pentru a descrie componentele deviației standard, varianței și incertitudinii. De exemplu:

s (x1), s (x2), s (xi), s (xn); ca un grup de simboluri, s (x1) ar trebui interpretat ca abaterea standard a variabilei x1, s (x2) ca abaterea standard a variabilei x2, etc, nu ca două variabile matematice care ar trebui multiplicate împreună.

s 2 (x1), s 2 (x2), s 2 (xi), s 2 (xn); ca un grup de simboluri, s 2 (x1) ar trebui interpretat ca deviația standard pătrată a variabilei x1 sau varianța x1, s 2 (x2) ca deviația standard pătrată a variabilei x2 sau varianța x2 etc., nu ca două variabile matematice care ar trebui multiplicate împreună.

u (x1), u (x2), u (xi), u (xn); într-o manieră similară cu grupul de simboluri care sunt utilizate pentru a reprezenta deviația standard și varianța (de mai sus), ca grup, u (x1) ar trebui interpretat ca incertitudine standard în variabila x1, u (x2) ca incertitudine standard în variabila x2, etc, nu ca două variabile matematice care ar trebui multiplicate împreună.

în 2 (x1), în 2 (x2), în 2 (xi), în 2 (xn); ca un grup de simboluri, u 2 (x1) ar trebui interpretat ca incertitudine standard pătrată a variabilei x1 sau varianța lui x1, u 2 (x2) ca incertitudine standard pătrată a variabilei x2 sau varianța x2, etc., nu ca două variabile matematice care ar trebui multiplicate împreună.

Atunci când sunt prezentați în ecuații precum cele furnizate în GUM și în Tabelul 2, termenii de varianță și incertitudine trebuie considerați ca un grup descriptiv, nu ca caractere sau simboluri individuale. Pentru coerență, terminologia utilizată în această revizuire este cea utilizată de GUM, al cărui rezumat este furnizat în Tabelul 1 .