Reddit - пояснитиlikeimefive - ELI5 Markov Chain

Я намагався прочитати тут статтю Вікіпедії, але у мене виникають проблеми з її розумінням.

chain

Поділіться посиланням

Я припускаю, що ви говорите про ланцюжки Маркова для генерації тексту. Основна ідея полягає у використанні вже написаного тексту для створення тексту, який "звучить як" оригінал.

Перший крок - це побудова «корпусу». Це може бути будь-який досить великий текст. Для прикладу та зручності я буду використовувати вашу історію коментарів Reddit як корпус. Потім для кожного слова у вашій історії коментарів я записую слово, яке йде після нього. Наприклад, після слова "Я" після "не", "не" "хочу" і "побачити".

Щоб насправді генерувати текст, ми починаємо з випадкового вихідного слова. З цього слова ми випадковим чином обираємо, до якого слова йти далі з корпусу. Ось чому важливо реєструвати, скільки разів з’являється кожне наступне слово. Потім ви повторюєте підбір слів, поки не отримаєте скільки завгодно потрібного тексту.