Găsiți termeni subțiri GO îmbogățiți

Această funcție găsește cei mai buni termeni ai Ontologiei Gene (adnotare funcțională) subțiri din listele de gene.

fișier xlsx

Utilizare
Argumente

un fișier .xlsx care oferă listele de gene furnizate de utilizator, fie gene specificate de utilizator, fie gene asociate găsite de select.associated.genes () sau select. associated.orthologs () .

un verctor de caracter care oferă populației tuturor genelor.

un caracter care oferă calea fișierului de cartografiere GO, care conține informații despre maparea ID-urilor genetice la termenii GO.

un caracter care specifică numele unui fișier .txt pentru a stoca rezultatul acestei funcții: termenii GO slim de top îmbogățiți în listele genelor de intrare.

un număr întreg care specifică numărul de termeni GO de top care vor fi incluși în rezultate. Valori implicite la 20.

un vector de caractere care conține ID-urile GO ale tuturor termenilor GO slim.

o valoare booleană care specifică dacă se afișează heatmap-ul pentru termenii GO slim de top îmbogățiți. Harta de căldură oferă rezultate de îmbogățire pentru toate eșantioanele de termeni subțiri GO care sunt cel puțin îmbogățiți într-o singură probă biologică. Dacă heatmap = TRUE, această funcție afișează un fișier pdf numit „Termeni slim de top îmbogățiți GO din samples.pdf”.

Detalii

Pentru a utiliza această funcție, vă rugăm să descărcați fișierul de mapare GO a speciilor de interes de pe http://geneontology.org/page/download-annotations. Vă rugăm să vă asigurați că acest fișier se află în directorul de lucru al lui R și setați GOmappingfile la numele fișierului.

gene_lists poate fi fie fișierul .xlsx de ieșire al select.associated.orthologs (), fișierul .xlsx de ieșire al select.associated.genes (), fie un fișier .xlsx cu același format care conține listele de gene furnizate de utilizator. Dacă utilizatorii doresc să utilizeze genele de suprapunere sau ortologii de suprapunere, le pot găsi în fișierele .xlsx de ieșire ale ws.trom (), ws.trom.orthologs () sau bs.trom (). Utilizatorii pot selecta coloanele de care sunt interesați și le pot compacta într-un nou fișier .xlsx, apoi pot trece numele noului fișier .xlsx către gene_lists .

Utilizatorii pot verifica fișierul .txt output_file pentru rezultatele celor mai îmbogățiți termeni GO slim.

Valoare

O listă cu lungimea 6 \ (\ times \) (numărul de probe biologice). Elementele listei sunt ordonate în corespondență cu probele biologice, de exemplu, primele 6 elemente din listă corespund primului eșantion etc. Pentru fiecare eșantion, există

un vector de caractere care oferă ID-urile GO superioare.
un vector de caractere care dă termenii corespunzători GO superiori.
un vector care indică numărul de apariții ale ID-urilor GO slim de top din populație.
un vector care indică numărul observat de apariții ale ID-urilor GO slim de top din eșantion.
un vector care indică numărul așteptat de apariții ale ID-urilor GO slim de top din eșantion.
un vector de caractere care dă valorile p dintr-un test hipergeometric.

Referințe

Li WV, Chen Y și Li JJ (2016). TROM: O metodă bazată pe testare pentru găsirea similarității transcriptomice a probelor biologice. Statistici în Biosciences. DOI: 10.1007/s12561-016-9163-y

Li JJ, Huang H, Bickel PJ și Brenner SE (2014). Comparația dintre etapele de dezvoltare, țesuturile și celulele D. melanogaster și C. elegans prin date modENCODE ARN-seq. Genome Research, 24 (7), 1086-1101.