Contact presa:

Descărcare media

contor

* Termeni de utilizare:

Imaginile pentru descărcare de pe site-ul web al biroului de știri MIT sunt puse la dispoziția entităților necomerciale, a presei și a publicului larg sub o licență Creative Commons Attribution Non-Commercial No Derivatives. Nu puteți modifica imaginile furnizate, altele decât să le decupați la dimensiune. La reproducerea imaginilor trebuie utilizată o linie de credit; dacă una nu este furnizată mai jos, creditați imaginile la „MIT”.

Imaginea anterioară Imaginea următoare

Pentru persoanele care se luptă cu obezitatea, înregistrarea numărului de calorii și alte informații nutriționale la fiecare masă este o modalitate dovedită de a pierde în greutate. Cu toate acestea, tehnica necesită consistență și precizie, iar atunci când eșuează, se întâmplă de obicei pentru că oamenii nu au timp să găsească și să înregistreze toate informațiile de care au nevoie.

În urmă cu câțiva ani, o echipă de nutriționiști de la Universitatea Tufts, care experimentase aplicații de telefonie mobilă pentru înregistrarea aportului caloric, s-a apropiat de membrii grupului de sisteme de limbă vorbită de la Laboratorul de informatică și inteligență artificială (CSAIL) al MIT, cu ideea O aplicație de limbă vorbită care ar face și mai ușoară înregistrarea meselor.

Săptămâna aceasta, la Conferința internațională de acustică, vorbire și procesare a semnalului de la Shanghai, cercetătorii MIT prezintă un prototip bazat pe web al sistemului lor de înregistrare a nutriției controlat de vorbire.

Cu aceasta, utilizatorul descrie verbal conținutul unei mese, iar sistemul analizează descrierea și preia automat datele nutriționale pertinente dintr-o bază de date online menținută de S.U.A. Departamentul Agriculturii (USDA).

Datele sunt afișate împreună cu imagini ale alimentelor corespunzătoare și ale meniurilor derulante care permit utilizatorului să își rafineze descrierile - selectând, de exemplu, cantități precise de alimente. Dar aceste rafinamente pot fi făcute și verbal. Un utilizator care începe prin a spune: „La micul dejun, am avut un castron cu fulgi de ovăz, banane și un pahar de suc de portocale” poate face apoi modificarea „Am avut o jumătate de banană”, iar sistemul va actualiza datele pe care le afișează despre banane lăsând restul neschimbat.

„Ceea ce au experimentat [nutriționiștii Tufts] este că aplicațiile care erau acolo pentru a ajuta oamenii să încerce să înregistreze mesele aveau tendința de a fi puțin plictisitoare și, prin urmare, oamenii nu țineau pasul cu ele”, spune James Glass, cercetător senior om de știință la CSAIL, care conduce Grupul de sisteme de limbaj vorbit. „Așadar, ei căutau modalități care să fie precise și ușor de introdus informații”.

Primul autor al noii lucrări este Mandy Korpusik, student absolvent al MIT în inginerie electrică și informatică. I se alătură Glass, care este consilierul ei pentru teză; colegul ei absolvent Michael Price; și de Calvin Huang, cercetător universitar din grupul Glass.

Sensibilitate contextuală

În lucrare, cercetătorii raportează rezultatele experimentelor cu un sistem de recunoaștere a vorbirii pe care l-au dezvoltat special pentru a trata terminologia legată de alimente. Dar acesta nu a fost obiectivul principal al muncii lor; într-adevăr, o demonstrație online a sistemului lor de înregistrare a meselor folosește în schimb aplicația gratuită de recunoaștere a vorbirii Google.

Cercetările lor s-au concentrat pe alte două probleme. Unul este identificarea rolului funcțional al cuvintelor: sistemul trebuie să recunoască faptul că, dacă utilizatorul înregistrează expresia „castron de fulgi de ovăz”, informațiile nutriționale despre fulgi de ovăz sunt pertinente, dar dacă expresia este „cookie de fulgi de ovăz”, nu.

Cealaltă problemă este reconcilierea frazării utilizatorului cu intrările din baza de date USDA. De exemplu, datele USDA despre fulgi de ovăz sunt înregistrate la rubrica „ovăz”; cuvântul „fulgi de ovăz” nu apare nicăieri în intrare.

Pentru a aborda prima problemă, cercetătorii au folosit învățarea automată. Prin intermediul platformei de crowdsourcing Amazon Mechanical Turk, aceștia au recrutat lucrători care pur și simplu au descris ceea ce au mâncat la mesele recente, apoi au etichetat cuvintele pertinente din descriere drept nume de alimente, cantități, nume de marcă sau modificatori ai denumirilor alimentelor. În „castron cu fulgi de ovăz”, „castron” este o cantitate, iar „fulgi de ovăz” este un aliment, dar în „cookie cu fulgi de ovăz”, ovăzul este un modificator.

Odată ce au avut aproximativ 10.000 de descrieri de mese etichetate, cercetătorii au folosit algoritmi de învățare automată pentru a găsi modele în relațiile sintactice dintre cuvinte care să le identifice rolurile funcționale.

Potrivirea semantică

Pentru a traduce între descrierile utilizatorilor și etichetele din baza de date USDA, cercetătorii au folosit o bază de date open-source numită Freebase, care are intrări pe mai mult de 8.000 de produse alimentare obișnuite, dintre care multe includ sinonime. Acolo unde lipseau sinonimele, au recrutat din nou muncitori mecanici turci pentru a le furniza.

Versiunea sistemului prezentată la conferință este destinată în principal să demonstreze viabilitatea abordării sale în procesarea limbajului natural; raportează numărul de calorii, dar nu le totalizează încă automat. Cu toate acestea, o versiune care funcționează este în lucru, iar când este completă, cercetătorii Tufts intenționează să efectueze un studiu al utilizatorilor pentru a determina dacă într-adevăr facilitează înregistrarea nutrițională.

„Cred că exploatarea forestieră este extrem de utilă pentru mulți oameni”, spune Susan Roberts, directorul Laboratorului de Metabolism al Energiei la Centrul de Cercetare Nutriție Umană Jean Mayer pentru vârstă, sponsorizat de USDA de la Tufts. „Îi face pe oameni mai conștienți de sine cu privire la gunoiul pe care îl mănâncă și cât de puțin se bucură de el și de șocul porțiilor uriașe, etc. Dar, în prezent, este foarte obositor să vă înregistrați mâncarea. Există un număr de programe precum MyFitnessPal în care îl puteți introduce manual cu mâna, dar chiar și cu comenzi rapide, este plictisitor și nu este atât de ușor de utilizat, pentru ca milioane de oameni să îl poată folosi cu regularitate. ”

„Un sistem de limbă vorbită pe care îl puteți folosi cu telefonul dvs. ar permite oamenilor să înregistreze alimente oriunde le consumă, cu mai puțină muncă”, adaugă ea. „După cum o văd, trebuie să venim cu ceva care într-adevăr nu înseamnă prea multă muncă, deci nu este o povară suplimentară în viață”.