Școala de afiliere de matematică și fizică, Universitatea din Tasmania, Hobart, TAS, Australia

normalizarea

Afiliere Menzies Research Institute Tasmania, Universitatea din Tasmania, Hobart, TAS, Australia

Laborator Central de Științe de Afiliere, Universitatea din Tasmania, Hobart, TAS, Australia

Laborator Central de Științe de Afiliere, Universitatea din Tasmania, Hobart, TAS, Australia

Affiliations Center of Human & Aerospace Physiological Sciences, King’s College London, London, United Kingdom, Fibrosis Discovery Performance Unit, GlaxoSmithKline R&D, Stevenage, United Kingdom

  • Yuliya V. Karpievitch,
  • Sonja B. Nikolic,
  • Richard Wilson,
  • James E. Sharman,
  • Lindsay M. Edwards

Cifre

Abstract

Câmpuri de intensități ale eșantionului în ordine de rulare pe instrument pentru modul ion pozitiv. Fiecare cutie reprezintă un eșantion, fiecare din cele cinci zile este prezentată într-o culoare diferită. Scăderea intensității indică pierderea intensității semnalului în fiecare zi.

Pierderea intensității probelor face mai dificile comparațiile între grupurile experimentale, de asemenea duce la un număr crescut de valori lipsă în probele ulterioare. Astfel, este necesară o proiectare experimentală atentă și randomizarea ordinii de rulare a eșantionului pentru a minimiza introducerea prejudecăților sistematice și orice posibilă confuzie a rezultatelor. Experiența noastră ne conduce să recomandăm utilizarea probelor QC pentru a monitoriza performanța instrumentului LC-MS. De exemplu, am încorporat probe QC pe parcursul experimentelor pentru a ne ajuta să monitorizăm performanța instrumentului. Am utilizat un design de bloc incomplet în care fiecare bloc a constat din patru probe, două diabet și două probe de control într-o ordine aleatorie. Fiecare bloc a fost parantezat de probe QC pentru a permite operatorului să monitorizeze experimentul și să efectueze diagnosticarea sistemului dacă a fost observată o variație a intensității semnalului curselor QC. În acest studiu, probele QC nu au fost utilizate pentru prelucrarea sau normalizarea datelor.

Am normalizat datele cu EigenMS. EigenMS a identificat 12 tendințe sistematice de prejudecată și a eliminat efectele acestora din date. FIG. 2 prezintă graficele cutiei cu intensitățile pentru boală și grupurile de control înainte (normală) și după normalizare (inferioară) pentru aceleași date ca în Fig. 1. Probele din Fig. 2 sunt grupate în funcție de grupul de boală (roșu vs. verde cu probe QC care nu sunt prezentate) și în cadrul fiecărui grup apar în ordinea de rulare pe instrument, astfel încât primul eșantion în roșu a fost rulat chiar lângă primul eșantion în verde și așa el. Chiar și cu curățarea regulată a orificiului de admisie, am întâmpinat unele pierderi de semnal, după cum reiese din tendința descendentă a mijloacelor (barele din mijloc) ale graficelor box. FIG. 2 panoul inferior arată că normalizarea a fost ajustată cu succes pentru pierderea intensității semnalului și a oricărei alte părtiniri sistematice și a plasat mijloacele fiecărui eșantion aproape pe o linie dreaptă.

Complotări ale intensităților înainte de normalizarea (panoul superior) și după (panoul inferior). Fiecare cutie reprezintă un eșantion. Probele sunt grupate în funcție de grupul de boală (roșu vs. verde, probele QC sunt permise) și sunt în ordine cronologică a instrumentului din cadrul fiecărui grup.

Tendințele SVD în datele clinice brute (panoul stâng) și normalizate (panoul drept). Procentul din partea de sus a fiecărei subtrame arată procentul de variație a datelor explicate de fiecare tendință. Pe axa x este un indice de eșantion de la 1 la 79, unde fiecare cerc reprezintă un eșantion. Probele sunt grupate pe grupe de boală, cu 39 de probe martor numerotate 1-39 urmate de 40 de probe de diabet în număr de 40-79. Probele sunt în ordine cronologică de rulare pe instrument în cadrul fiecărui grup. Valorile de pe axa y satisfac ecuația: R = UDV ’unde R este o matrice de reziduuri (panoul din stânga) și matrice de intensități normalizate (panoul din dreapta); coloanele din V reprezintă tendințele observate în date. Trei tendințe care explică cea mai mare cantitate de variație sunt reprezentate grafic pentru date brute și normalizate.

Am văzut o îmbunătățire a corelațiilor intensităților metabolite normalizate cu variabilele fiziologice pe care le-am măsurat pentru fiecare subiect. Am selectat 1100 de vârfuri care s-au dovedit a fi semnificativ diferite între cele două grupuri cu valoarea p ajustată de Benjamini-Hochberg Figura 4. Corelații cu datele de fiziologie.