Інженери попередньо навчають комп’ютери з штучним інтелектом, щоб зробити їх ще потужнішими - ScienceDaily

У 2016 році суперкомп’ютер переміг чемпіона світу в Go - складна настільна гра. Як? Використовуючи навчання підкріплення, тип штучного інтелекту, за допомогою якого комп’ютери тренуються після програмування за допомогою простих інструкцій. Комп’ютери вчаться на своїх помилках і, крок за кроком, стають надзвичайно потужними.

Основним недоліком навчання підкріплення є те, що його не можна використовувати в деяких реальних програмах. Це тому, що в процесі навчання самі комп’ютери спочатку пробують майже все і все, перш ніж врешті-решт спотикаються на правильному шляху. Цей початковий етап спроб і помилок може бути проблематичним для певних застосувань, таких як системи контролю клімату, де різкі коливання температури не допускаються.

Вивчення посібника водія перед запуском двигуна

Інженери CSEM розробили підхід, який долає цю проблему. Вони показали, що спочатку комп'ютери можна навчити надзвичайно спрощеним теоретичним моделям, перш ніж налаштовувати їх на навчання в реальних системах. Це означає, що коли комп’ютери запускають процес машинного навчання на реальних системах, вони можуть спиратися на те, що дізналися раніше на моделях. Тому комп’ютери можуть швидко вийти на правильний шлях, не проходячи періоду екстремальних коливань. Дослідження інженерів щойно були опубліковані в IEEE Transactions on Neural Networks and Learning Systems.