Editat * de Jeffrey I. Gordon, Facultatea de Medicină a Universității Washington din St. Louis, St. Louis, MO și aprobat la 15 noiembrie 2011 (primit pentru examinare 3 octombrie 2011)

uman

Abstract

Aici, introducem un cadru unic pentru studierea microbiomului uman, integrând datele metagenomice cu o analiză a rețelei la nivel de sistem. Această abordare a biologiei sistemelor metagenomice depășește analiza comparativă tradițională, plasând datele metagenomice ale pistolului în contextul rețelelor metabolice la nivel comunitar. Compararea proprietăților topologice ale enzimelor din aceste rețele cu abundența lor în diferite probe metagenomice și examinarea caracteristicilor topologice la nivel de sistem ale microbiomilor asociați cu diferite stări gazdă ne permit să obținem o perspectivă asupra variației capacității metabolice. Această abordare extinde viziunea metagenomică centrată pe genă luând în considerare nu numai setul de gene prezente într-un microbiom, ci și rețeaua complexă de interacțiuni dintre aceste gene și tratând microbiomul ca un singur sistem biologic „independent” (18).

Metodele de biologie a sistemelor computaționale și analizele complexe de rețea au fost aplicate pe scară largă pentru a studia microorganismele și s-au dezvoltat o varietate de abordări pentru a crea rețele metabolice la scară genomică a diferitelor specii microbiene (19-21). În acest studiu, ne concentrăm pe rețele simple centrate pe conectivitate, care sunt derivate din calcul din baze de date metabolice pe scară largă bazate pe omologie (22), împreună cu o analiză topologică. Aceste rețele formează o simplificare a căilor metabolice reale care stau la baza lor și pot fi relativ inexacte și zgomotoase. Cu toate acestea, analiza bazată pe topologie a unor astfel de rețele a condus puternic pentru studierea caracteristicilor rețelelor metabolice cu o singură specie și impactul acestora asupra diferitelor proprietăți funcționale și evolutive, inclusiv scalarea (23), funcționalitatea și reglarea metabolică (24, 25), modularitatea 26, 27), esențialitate și viabilitate mutantă (28), robustețe genetică și de mediu (29), adaptare (30, 31) și interacțiunea speciilor (32). Până în prezent, însă, analiza topologică nu a fost utilizată pentru a examina rețelele metabolice la nivel de comunitate și pentru a studia metabolismul la scară metagenomică.

Rezultate

Seturi de date.

Au fost analizate datele metagenomice ale pistolului derivate din iluminina de la 124 de indivizi danezi și spanioli fără legătură (3). Dintre cei 124 de indivizi, 82 au fost etichetați ca slabi/supraponderali [indicele de masă corporală (IMC) −12), printre alte procese (anexa SI, tabelul S4).

Conectarea enzimelor asociate statului gazdă la centralitate.

Folosind rețeaua comunitară descrisă mai sus, am examinat dacă enzimele care sunt asociate cu o anumită stare gazdă prezintă caracteristici topologice unice. Mai întâi ne-am concentrat pe o măsură de centralitate derivată topologic numită centralitate între 25 (25). Această măsură calculează proporția celor mai scurte căi dintr-o rețea complexă care trec printr-un nod dat, ca un proxy pentru locația nodului în raport cu toate celelalte noduri (Anexa SI, Fig. S2B). Valorile de centralitate ridicate sunt de obicei asociate cu noduri situate în centrul rețelei, în timp ce valorile de centralitate scăzute indică o locație mai periferică.

(A) Media și SE ale scorurilor de centralitate ale enzimelor asociate obezității vs. toate celelalte enzime din rețea. Enzimele asociate obezității sunt împărțite în continuare în enzime care sunt îmbogățite sau epuizate în microbiomi obezi. (B) Proporția de enzime care sunt asociate cu obezitatea (graficul principal) și IBD (Inset) în cadrul a trei niveluri de rețea bazate pe centralitate la fel de populate. Fiecare diagramă concentrică reprezentă procentul de enzime dintr-un anumit nivel de centralitate care sunt clasificate ca îmbogățite sau epuizate. Enzimele asociate cu obezitatea sau IBD se găsesc în proporții semnificativ mai mari în nivelul periferic (P −6 [obezitate], P −5 [IBD]; Test de îmbogățire hipergeometrică). Acest rezultat continuă să se ia în considerare criterii alternative sau mai stricte pentru asocierea cu statul gazdă (Anexa SI).

Interesant, un model similar este observat în enzimele asociate cu IBD. Scorul de abundență diferențială al unei enzime în IBD este corelat negativ cu centralitatea sa (R = -0,15, P-9, testul de corelație Spearman), iar scorurile de centralitate ale enzimelor asociate IBD sunt semnificativ mai mici decât scorurile de centralitate ale enzimelor care nu sunt asociate cu IBD. (P −6, testul sumei de rang Wilcoxon; P −4, testul sumei de rang Wilcoxon) și gradul inferior (P −6, testul sumei de rang Wilcoxon) comparativ cu non-semințe și că astfel de semințe de rețea sunt supra-reprezentate între enzime asociate obezității și IBD [P −4 (obezitate) și P −3 (IBD); mai multe detalii sunt furnizate în anexa SI].

Media și SE ale coeficientului de grupare (A) și în grad (B) ale enzimelor îmbogățite (roșu; n = 170), epuizate (verde; n = 180) și ale altor enzime (gri; n = 1213) din microbiomii obezi. Coeficientul de grupare este definit ca raportul dintre numărul total de margini care leagă vecinii unui nod și numărul potențial de margini care ar putea exista între ele. În grad denotă numărul de muchii care se termină la un nod. (C) Media și SE ale scorurilor diferențiale de abundență ale semințelor vs. enzime non-semințe.

Conectarea variației topologice la compoziția speciilor comunitare.

Conectarea stării gazdă la proprietățile topologice la nivel de rețea.

Modularitatea rețelelor metabolice specifice statului gazdă. (A) Analiza rarității modularității microbiomilor grupați slab-sănătoși, obezi-sănătoși și IBD-slabi. Graficul descrie media (linii solide) și SD (linii punctate) a cinci runde de analiză de rarefacție, obținute prin calcularea modularității rețelelor derivate din seturi de citiri selectate aleatoriu progresiv mai mici. (B) Diferența dintre modularitatea rețelei specifice obezului și a rețelei sănătoase - specifice este reprezentată grafic (linie albastră întreruptă) față de o distribuție nulă a diferențelor obținute prin gruparea aleatorie a probelor (mai multe detalii sunt furnizate în apendicele SI). Diferența de modularitate observată este semnificativ mai mare decât diferența așteptată conform acestei distribuții nule.

Discuţie

Luate împreună, caracteristicile topologice care s-au dovedit a varia în funcție de obezitate și IBD sugerează un mod caracteristic de deviere de la o organizație normală de microbiomi care poate fi asociată cu o stare de boală. Acest lucru sugerează că, pe lângă, sau potențial ca o consecință a modificărilor abundenței genelor individuale sau a claselor funcționale, boala poate fi asociată cu moduri de deviere de ordin superior în microbiom. În mod clar, astfel de asociații singure nu pot implica direct un mecanism pentru boală; atât obezitatea, cât și IBD sunt boli slab înțelese și întruchipează fenotipuri extrem de complexe. În consecință, observațiile la nivel de sistem raportate în acest studiu pot avea multiple interpretări alternative și provin din mecanisme care sunt încă necunoscute. Cu toate acestea, aceste observații ne permit să formulăm ipoteze interesante pentru studii ulterioare.

Abordarea noastră de sistem bazată pe topologie a sugerat, de asemenea, biomarkeri candidați implicați în obezitate și IBD. În plus față de PTS utilizate pentru importul de carbohidrați dietetici, atât obezitatea, cât și IBD au fost semnificativ asociate cu gene pentru producerea de NO2 și metabolismul colinei și p-crezolului. Suprapunerea neașteptat de mare dintre aceste seturi de gene asociate bolii (Anexa SI, Tabelul S2) poate fi indicativă a unor declanșatoare comune de bază ale bolii sau, alternativ, a unui răspuns conservat al microbiomului intestinal la boală. Studiile de urmărire utilizând modele de șoareci gnotobiotici colonizați de izolate microbiene cu capacitatea de a îndeplini aceste funcții cheie, modele de șoareci „umanizate” colonizate cu probe prelevate de la donatori umani sănătoși și bolnavi, și studiile de intervenție umană vor fi critice pentru a determina ce aspecte ale microbiomul intestinal poate contribui la boli și la mecanismele precise care leagă această rețea metabolică microbiană complexă de fiziologia gazdei.

Rezultatele noastre demonstrează în continuare că variația asociată cu obezitatea și IBD induce o modularitate redusă la nivelul întregii rețele. Studii recente ale topologiilor rețelei metabolice din arborele bacterian al vieții au relevat variații semnificative ale modularității rețelei și au identificat mai mulți factori genetici și de mediu care afectează modularitatea metabolică (27, 45). Mai exact, aceste studii au demonstrat că modularitatea metabolică redusă în rețelele cu o singură specie este asociată cu organismele care locuiesc în medii mai puțin variabile. Cu toate acestea, analiza noastră prezintă o caracterizare unică a modularității la nivel de comunitate și demonstrează diferențe consistente care sunt asociate cu starea gazdă. Este intrigant să extrapolăm rezultatele din analizele cu o singură specie și să presupunem că modularitatea redusă la nivel de comunitate în microbiomii obezi poate fi asociată cu o variabilitate scăzută în mediul intestinal sau cu o lipsă de regularități temporale (46). Mai mult, această modularitate redusă poate fi construită ca o manifestare funcțională a scăderii raportate a diversității speciilor care a fost observată la indivizii obezi (10).

În esență, acest studiu reprezintă un pas important în dezvoltarea unei abordări a „biologiei sistemelor metagenomice”. O astfel de abordare poate avansa potențial cercetarea metagenomică în același mod în care biologia sistemelor a avansat genomica, apreciind nu numai lista părților unui sistem, ci și interacțiunile complexe dintre părți și impactul acestor interacțiuni asupra funcției și dinamicii. Lucrările viitoare vor include, de asemenea, identificarea seturilor specifice de enzime responsabile pentru modelele la nivel de sistem, caracterizarea implicațiilor diferitelor variații topologice și legarea acestei variații de modificările compoziției speciilor. În mod clar, înțelegerea noastră asupra complexității microbiomului intestinal lipsește încă și mai rămâne mult de făcut înainte de identificarea mecanismelor exacte. Aplicațiile clinice viitoare se pot concentra pe funcții specifice mai degrabă decât pe proprietățile la nivel de sistem ale microbiomului. Cu toate acestea, această abordare a biologiei sistemelor oferă un punct de vedere complementar metagenomicii comparative și funcționale în obținerea unei intuiții valoroase cu privire la funcția microbiomului ca sistem și în identificarea potențialilor biomarkeri pentru validare ulterioară.

Materiale și metode

Seturi de date.

Datele metagenomice au fost obținute din două studii asupra microbiomului intestinal uman. Primul studiu (3) a examinat 576,7 baze de date de secvențe derivate din Illumina de la 124 de indivizi europeni etichetați cu date IMC (kg/m 2) și IBD. Al doilea studiu (10) a examinat 454 de secvențe derivate din FLX de la șase triouri cu două mame gemeni din Missouri Adolescent Female Twin Study binned în funcție de IMC. Toate datele secvenței au fost mapate la grupuri ortologice KEGG (KO) folosind BLASTX (detalii suplimentare sunt furnizate în anexa SI).

Îmbogățirea enzimelor.

Testul de corelație Spearman a fost utilizat pentru a examina corelația dintre scorurile diferențiale de abundență și fiecare caracteristică topologică. Un test Wilcoxon de sumă de rang a fost utilizat pentru a compara scorurile topologice ale enzimelor asociate stării gazdă (și în mod specific enzimelor îmbogățite sau epuizate) cu scorurile obținute pentru enzimele neasociate. Un test de îmbogățire hipergeometrică a fost utilizat pentru a examina supra-reprezentarea enzimelor asociate stării gazdei în fiecare nivel de centralitate.

Caracteristici topologice la nivel de rețea ale rețelelor specifice statului gazdă.

Probele au fost împărțite în trei grupuri distincte: slab-sănătos, obez-sănătos și slab-IBD. Cele trei probe obeze-IBD nu au fost utilizate în această analiză. Trei rețele separate de stat gazdă specifice au fost create din setul combinat de enzime identificate în cadrul fiecărui grup. Funcțiile la nivel de rețea, inclusiv numărul de noduri, densitatea (raportul dintre margini și noduri) și modularitatea, au fost calculate pentru fiecare rețea. Aici, definim și calculăm modularitatea în conformitate cu formularea prezentată de Newman (54). Pentru o anumită împărțire a unei rețele în module discrete, modularitatea este definită ca numărul de muchii dintre noduri care aparțin aceluiași modul minus numărul așteptat de astfel de muchii într-o rețea aleatorie echivalentă, normalizată de numărul total de margini. Modularitatea rețelei este calculată pentru diviziunea care maximizează această valoare. Această valoare de modularitate măsoară cât de bine o rețea poate fi partiționată în module conectate dens, cu margini relativ puține care rulează între module. Curbele de rarefacție au fost generate pentru fiecare dintre aceste măsuri, luând în considerare un subset aleatoriu din ce în ce mai mare de citiri din fiecare grup. Semnificația statistică a acestor măsuri a fost evaluată utilizând distribuții nule calculate din rețele randomizate (Anexa SI).

Identificarea setului de semințe.

Setul de semințe metabolice (mai multe detalii sunt furnizate în apendicele SI), reprezentând enzime care funcționează pe compuși dobândiți exogen, a fost calculat conform metodei descrise de Borenstein și colab. (31).

Mulțumiri

Mulțumim lui Junjie Qin pentru asistență în descărcarea și analiza datelor de la 124 de persoane fără legătură. Comparațiile secvenței metagenomice din această lucrare au fost efectuate pe clusterul Odyssey susținut de Grupul de calcul al cercetării diviziei științelor FAS. S.G. este susținut de „Formarea interdisciplinară în științe genomice” Institutul Național de Cercetare a Genomului Uman Grant T32 HG00035. P.J.T. este susținut de National Institutes of Health Grant P50 GM068763. E.B. este cercetător Alfred P. Sloan.

Note de subsol

  • ↵ 1 Cui trebuie să i se adreseze corespondența. E-mail: elbouw.edu .