Subiecte

Abstract

Introducere

La începutul secolului al XXI-lea, sectorul agroalimentar se confruntă cu provocări majore: în primul rând, asigurarea populației lumii cu cantități suficiente pentru a mânca (securitate alimentară) 1 și în al doilea rând, asigurarea faptului că acest aliment este sigur de consumat (siguranță alimentară) 1, menținând în același timp un proces de producție în limitele de mediu. Aceste obiective trebuie realizate în contextul unei schimbări tehnologice uriașe, a unei lipse tot mai mari de resurse naturale și a unei evoluții continue a stilurilor de viață și a obiceiurilor de consum ale consumatorilor, pe tot globul 1,2. Industria alimentară este obligată să opereze sub așteptări aparent contradictorii, adică consumatorii preferă alimentele (i) convenabile și proaspete (minim procesate și ambalate); (ii) toate „naturale” - fără conservanți; (iii) potențial sănătos, fără efecte adverse asupra sănătății (adică, sărace în grăsimi, sare și zahăr); și (iv) produse într-un mod durabil din punct de vedere al mediului.

În ceea ce privește aceste probleme, Centrul Comun de Cercetare (CCR) Science for policy report 3 a investigat 4 scenarii privind identificarea provocărilor viitoare în sistemul alimentar global și a indicat necesitatea creșterii dependenței de tehnologiile informației și comunicațiilor (TIC) pentru a asigura trasabilitatea în lanțul alimentar și posibilitatea eșecului temporar sau a fraudei și a terorismului.

Pentru a pune în aplicare această nevoie, senzorii inteligenți au fost proiectați pentru a acoperi decalajul dintre informațiile alimentare adecvate și nevoile consumatorilor. În mod similar, importanța TIC a fost recunoscută ca un mijloc de a spori eficiența operațională și productivitatea în sectorul agricol/industria alimentară în contextul planului de acțiune de punere în aplicare propus de platformele tehnologice europene (ETP), care sunt forumuri ale părților interesate conduse de industrie., recunoscută de Comisia Europeană ca actori cheie în stimularea inovației, a transferului de cunoștințe și a competitivității europene 4. Utilizarea senzorilor este de o importanță vitală în industria alimentară; potențialul lor de a lua măsurători neinvazive pe, în sau în linie fără a distruge produsul alimentar este o condiție prealabilă pentru industria alimentară din viitor 5 .

rezultate si discutii

învățare

Grafic PCA pentru primele trei componente principale ale datelor normalizate după selectarea caracteristicii prin regresie PLS, setul de date de instruire cu 41 de dimensiuni; (A) Complot PC1-PC2, (B) Complot PC1-PC3, (C) PC2 - complot PC3 și (D) Diagrama 3-D a PCA.

Din toate cele de mai sus se poate concluziona că clasificatorul dezvoltat, în afară de obținerea scorurilor de clasificare ideale (precizie = 1, scor F1 = 1, sensibilitate = 1, specificitate = 1, precizie = 1, MCC = 1, informare = 1, marcare = 1), este, de asemenea, independent de condițiile de depozitare a eșantionului în termeni de timp, temperatură și ambalare (vă rugăm să consultați tabelul SI1 pentru statistici pe clasă).

Probabilitățile medii ale clasei pentru predicțiile pentru fiecare clasă și abaterile standard corespunzătoare.

În concluzie cu rezultatele menționate anterior cu privire la generalizarea și eficiența conductei propuse și a clasificatorului dezvoltat, ar trebui evidențiată semnificația etapei de selectare a caracteristicilor în tandem pentru dezvoltarea senzorilor dedicați. După cum sa menționat în secțiunea Metode, numerele de undă selectate (41) au fost efectuate ca fiind cele mai potrivite pentru clasificarea celor 7 tipuri de alimente utilizate aici. Rezultate precum cele prezentate aici și altele din literatura de specialitate pot determina producătorii de senzori să construiască senzori dedicați pentru aplicații specifice, cu costuri și dimensiuni mai mici, care pot funcționa optim.

Concluzii

Metode

Metodologie

În primul rând și înainte de reducerea dimensionalității supravegheate prin regresia parțială a celor mai mici pătrate (PLS), schema de normalizare a Variații Normale Normale (SNV) 17 și, în mod specific, în versiunea sa robustă, RNV 18 a fost folosit pentru a normaliza spectrele dobândite S, conform:

Unde seu este euspectrul al și seu snv euspectrul normalizat. NEBUN înseamnă Median Absolute Deviation (nebun) 33; o metrică robustă de variabilitate a unui eșantion univariat de date cantitative s1,s2,…, Sn. MAD este calculat ca:

Schema de normalizare de mai sus este utilizată pentru îmbunătățirea calității datelor, reducerea informațiilor corelate de-a lungul lungimilor de undă ale spectrelor și eliminarea zgomotului multiplicativ provenit din procesul de achiziție inerent pentru a îmbunătăți analiza din aval. Aceeași schemă pentru normalizarea datelor a fost utilizată într-o altă lucrare de către laboratorul nostru 34 .

Prezentare generală a reducerii dimensionalității PLS supravegheate:(A) medie eroare pătrat vs. numărul de componente (minimum MSE @ 41 componente) pe o validare încrucișată de zece ori,b) eșantioane de spectre pentru fiecare tip de clasă, (c) greutăți de la PLS pentru fiecare coeficient, adică lungime de undă.

În special, având în vedere un set de date de instruire \ (\ left (, y_ > \ dreapta), i = 1, \ ldots, l \) cu \ (x_ \ in R ^ \) și \ (y \ in \ left [ < - 1, 1>\ right] ^ \), SVM găsește soluția la următoarea problemă de optimizare:

Functia φ mapează vectorii Xeu în spațiul dimensional superior, C este parametrul penalizării termenului de eroare și \ (K \ left (, x_> \ right) \ equiv \ varphi \ left (> \ right) ^ \ varphi \ left (> \ right) \ ) este funcția kernel. Există multe funcții ale nucleului, unde cele mai des utilizate trei sunt:

Modelul de clasificare SVM a fost evaluat pe datele testului, în ceea ce privește acuratețea, scorul F1, sensibilitatea, precizia, specificitatea, coeficientul de corelație al lui Matthews (MCC), Informare, Marcare, în total și pe clasă (date prezentate în Tabelul SI1) . În plus, probabilitățile clasificatorului SVM pentru fiecare eșantion (set de teste) au fost aproximate în funcție de abordarea de scalare a lui Platt, pentru a explica orice clasificare greșită și pentru a încerca să interpreteze rezultatele.

Materiale și probe

Din descrierea menționată mai sus a datelor utilizate aici, este evident că prin diversitatea mare a originii eșantioanelor (loturi diferite și, în unele cazuri, chiar și perioade diferite de timp și persoanelor care efectuează experimentele) și a stării (condiția de eșantionare într-o configurație experimentală de deteriorare - rezultând variații ale proprietăților biochimice ale eșantioanelor și, prin urmare, diversității spectrelor lor FTIR corespunzătoare), a fost posibilă importarea acestor informații în modelele predictive pentru a simula condițiile reale de viață, deoarece seturile de date au fost achiziționate în condiții diferite de temperatură, ambalare, timp de depozitare și gradul de contaminare microbiologică, în afară de diferite loturi. În acest fel, se poate asigura că, indiferent de rezultatul clasificării, modelul va fi suficient de robust și generic pentru intrare, deoarece pentru condiții diferite probele (în același tip de probă) sunt degradate diferit, precum și profilul lor chimic. Deci, este evident că schema de evaluare urmată aici și mai important, datele în care au fost instruiți modelele de clasificare, sunt imparțiale (chiar și în cadrul aceluiași tip de eșantion) cu variabilitate mare, rezultând în dezvoltarea unui clasificator care este robust, generic și astfel de încredere.

Achiziție de date - spectroscopie FTIR

Datele spectrale FTIR au fost colectate utilizând un cristal ZnSe 45 ° HATR (Horizontal Attenuated Total Reflectance) (PIKE Technologies, Madison, Wisconsin, SUA) și un spectrometru FTIR-6200 JASCO (Jasco Corp., Tokyo, Japonia). Procesul de achiziție a spectrelor constă în tăierea unei porțiuni mici din fiecare probă și plasată pe placa de cristal, acoperită cu o bucată mică de folie de aluminiu. Cristalul specific funcționează la un indice de refracție de 2,4 și la o adâncime de penetrare de 2,0 μm @ 1.000 cm -1. Apoi, spectrele achiziționate au fost procesate și colectate de versiunea software-ului Codul Regulamentelor Federale (CFR) Spectra Manager ™ (Jasco Corp.). Gama corespunzătoare a numărului de undă este de 4.000-400 cm -1, în timp ce au fost acumulate 100 de scanări cu o rezoluție de 4 cm-1 și un timp total de integrare de 2 minute. Spectrele FTIR care au fost utilizate în analize suplimentare au fost în intervalul aproximativ al numărului de undă de 2.700-1.000 cm -1, adică 1.700 de lungimi de undă (caracteristici ale eșantionului), rezultate prin îndepărtarea vârfului de apă începând de la

2.700 cm −1 și ignorând intervalul [400-1.000 cm −1] deoarece reprezintă în principal zgomot.

Implementare și performanță

Întreaga conductă a fost implementată în Python 2.7 folosind biblioteca scikit-learn 39. Codul este independent de sistemul de operare și necesită bibliotecile indicate în codul sursă și la instanțele de import.