Видобуток даних - чому одне гаряче кодування покращує продуктивність машинного навчання Stack Overflow
Я помітив, що коли кодування One Hot використовується для певного набору даних (матриці) та використовується як навчальні дані для вивчення алгоритмів, це дає значно кращі результати щодо точності прогнозування порівняно з використанням самої оригінальної матриці як навчальних даних. Як відбувається це підвищення продуктивності?

3 відповіді 3
Багато алгоритмів навчання або вивчають одну вагу на функцію, або використовують відстань між зразками. Перше стосується лінійних моделей, таких як логістична регресія, які легко пояснити.
Припустимо, у вас є набір даних, що має лише одну категоричну ознаку "національність" зі значеннями "Великобританія", "французька" та "США". Припустимо, без обмеження загальності, що вони кодуються як 0, 1 і 2. Тоді ви отримаєте вагу w для цієї функції в лінійному класифікаторі, який прийме якесь рішення на основі обмеження w × x + b> 0, або еквівалентно w × x