Am încercat să citesc articolul de pe Wikipedia aici, dar am probleme cu înțelegerea multă (dacă există) a acestuia.

eli5

Distribuiți linkul

Voi presupune că vorbești despre lanțurile Markov pentru generarea de text. Ideea de bază este de a utiliza text deja scris pentru a genera text care „sună ca” semnul original.

Primul pas este construirea unui „corpus”. Acesta poate fi un corp de text suficient de mare. Din motive de exemplu și comoditate, voi folosi istoricul comentariilor dvs. reddit ca corpus. Apoi, pentru fiecare cuvânt din istoricul comentariilor dvs., scriu cuvântul care vine după el. De exemplu, cuvântul „eu” este urmat de „nu”, „nu” „vreau” și „vezi”.

Pentru a genera text, începem cu un cuvânt de pornire aleatoriu. Din acest cuvânt, alegem aleatoriu la ce cuvânt să mergem în continuare din corpus. Acesta este motivul pentru care este important să înregistrați de câte ori apare fiecare cuvânt următor. Apoi repetați alegerea cuvintelor până când obțineți textul oricât de lung doriți.

Deci, pentru un exemplu de propoziție, vom continua să alegem cuvinte până când vom găsi unul care se termină într-o perioadă (apropo, punctuația este importantă și atunci când înregistrăm cuvintele):

Unul dintre cuvintele care urmează „eu” este „pot”. Un cuvânt care urmează „poate” este „vezi”. „Vezi” este urmat de „Eu” și așa mai departe.

Pentru un text mai realist, ați face corpusul dvs. cu două cuvinte la un moment dat sau mai multe. Cu două cuvinte, sintagma „Sunt de acord” este urmată de „aceasta”, „cu” și „cu”; iar „ceea ce tu” este urmat de „gândește” și „a făcut”.

Aceeași idee se aplică lanțurilor Markov pentru alte utilizări, luați evenimente din trecut și le folosiți pentru a prezice ce se va întâmpla în continuare.