Pavel Pevzner este profesor de informatică și inginerie la Universitatea din California San Diego (UCSD), unde deține catedra Ronald R. Taylor și a predat un curs de algoritmi de bioinformatică în ultimii 12 ani. Cercetările sale se referă la crearea de algoritmi bioinformatici pentru analiza rearanjărilor genomului, secvențierea ADN și proteomica de calcul.

online

Cum putem deduce ce gene orchestrează diferite procese din celulă? Cum au migrat oamenii din Africa și s-au răspândit în întreaga lume? În această clasă, vom vedea că aceste două întrebări aparent diferite pot fi abordate folosind tehnici algoritmice și de învățare automată similare care decurg din problema generală a împărțirii punctelor de date în clustere distincte.

Cursul acoperă tehnici algoritmice de bază și idei pentru probleme de calcul care apar frecvent în aplicații practice: sortare și căutare, împărțire și cucerire, algoritmi lacomi, programare dinamică. Vom învăța o mulțime de teorii: cum să sortăm datele și cum ajută la căutare; cum să spargi o problemă mare în bucăți și să o rezolvi recursiv; când are sens să procedăm cu lăcomie; modul în care programarea dinamică este utilizată în studiile genomice. Veți exersa rezolvarea problemelor de calcul, proiectarea de noi algoritmi și implementarea eficientă a soluțiilor (astfel încât acestea să ruleze în mai puțin de o secundă).

Acest curs începe o serie de clase care ilustrează puterea calculului în biologia modernă. Vă rugăm să vă alăturați-ne pe frontiera bioinformaticii pentru a căuta mesaje ascunse în ADN, fără a fi nevoie să vă îmbrăcați vreodată cu haina de laborator.

Este posibil să fi auzit multe despre secvențierea genomului și despre potențialul său de a introduce o eră a medicinei personalizate, dar ce înseamnă secvențierea unui genom? Biologii încă nu pot citi nucleotidele unui întreg genom, așa cum ați citi o carte de la început până la sfârșit. Cu toate acestea, pot citi bucăți scurte de ADN. În acest curs, vom vedea cum teoria graficelor poate fi utilizată pentru a asambla genomii din aceste piese scurte. Vom învăța în continuare despre algoritmii forței brute și le vom aplica la secvențierea mini-proteinelor numite antibiotice.

După secvențierea genomilor, am dori să le comparăm. Vom vedea că programarea dinamică este un instrument algoritmic puternic atunci când comparăm două gene (adică secvențe scurte de ADN) sau două proteine. Când vom „micșora” pentru a compara genomii întregi, vom folosi algoritmi combinatori.

În cursul anterior din specializare, am învățat cum să comparăm genele, proteinele și genomii. O modalitate prin care putem folosi aceste metode este de a construi un „Arborele Vieții” care să arate cum a evoluat o mare colecție de organisme înrudite de-a lungul timpului.

În această clasă, vom compara ADN-ul de la un individ cu un genom uman de referință pentru a găsi mutații potențial cauzatoare de boli. Vom învăța, de asemenea, cum să identificăm funcția unei proteine ​​chiar dacă a fost bombardată de atât de multe mutații în comparație cu proteinele similare cu funcții cunoscute, încât a devenit abia recunoscută.

Ești interesat să înveți cum să programezi (în Python) într-un cadru științific? Acest curs va acoperi algoritmi pentru rezolvarea diferitelor probleme biologice, împreună cu o mână de provocări de programare care vă ajută să implementați acești algoritmi în Python. Fiecare dintre cele patru săptămâni din curs va consta din două componente necesare. În primul rând, un manual interactiv oferă provocări de programare Python care apar din probleme biologice reale.

În primăvara anului 2011, mii de oameni din Germania au fost spitalizați cu o boală mortală care a început ca otrăvire alimentară cu diaree sângeroasă și deseori a dus la insuficiență renală. A fost începutul celui mai mortal focar din istoria recentă, cauzat de o misterioasă tulpină bacteriană pe care o vom numi E. coli X. În curând, oficialii germani au legat focarul de un restaurant din Lübeck, unde aproape 20% dintre patroni aveau a dezvoltat diaree sângeroasă într-o singură săptămână. În acest moment, biologii știau că se confruntă cu un agent patogen necunoscut anterior și că metodele tradiționale nu ar fi suficiente - biologii de calcul ar trebui să asambleze și să analizeze genomul agentului patogen nou apărut.

Lumea și internetul sunt pline de informații textuale. Căutăm informații folosind interogări textuale, citim site-uri web, cărți, e-mailuri. Toate acestea sunt șiruri din punctul de vedere al informaticii. Pentru a înțelege toate aceste informații și a face căutarea eficientă, motoarele de căutare utilizează mai mulți algoritmi de șiruri. Mai mult, domeniul emergent al medicinei personalizate folosește numeroși algoritmi de căutare pentru a găsi mutații cauzatoare de boli în genomul uman.

Aflați cum să proiectați algoritmi, să rezolvați probleme de calcul și să implementați soluții eficient.

Sintetizați-vă cunoștințele despre algoritmi și biologie pentru a vă construi propriul software pentru rezolvarea unei provocări biologice. Construirea unui algoritm complet pentru asamblarea genomilor din fragmente de ADN pe un set de date real este o provocare enormă, cu o cerere majoră în industria biotehnologică de miliarde de dolari. În acest proiect capstone, vom scoate roțile de antrenament și vă vom permite să vă proiectați propriul program software optimizat pentru secvențierea genomului.