Грессор; scikit-learn

Лінійна модель, встановлена шляхом мінімізації регуляризованих емпіричних втрат за допомогою SGD

SGD розшифровується як стохастичний градієнтний спуск: градієнт втрат оцінюється кожним зразком за раз, і модель оновлюється по ходу з графіком зменшення сили (він же швидкість навчання).

Регулятор - це покарання, додане до функції втрат, яке зменшує параметри моделі до нульового вектора, використовуючи або квадрат евклідової норми L2, або абсолютну норму L1, або їх комбінацію (Elastic Net). Якщо оновлення параметра перетинає значення 0.0 через регулятор, оновлення скорочується до 0.0, щоб забезпечити вивчення розріджених моделей та досягти онлайн-вибору функцій.

Ця реалізація працює з даними, представленими у вигляді щільних масивів numpy із значеннями з плаваючою комою для функцій.

Детальніше читайте в Посібнику користувача .

Параметри втрата str, за замовчуванням = 'squared_loss'

Функція втрат, яку слід використовувати. Можливі значення: "квадратна_втрата", "хубер", "епсилон_нечутливий" або "квадрат

"Квадрат_збитку" відноситься до звичайних найменших квадратів, що підходять. "Huber" модифікує "squared_loss", щоб менше зосереджуватись на корекції викидів, переходячи з квадрата на лінійні втрати за відстань епсилону. "Epsilon_insensitive" ігнорує помилки менше, ніж epsilon, і є лінійним минулим; це функція втрат, яка використовується у SVR. "Квадрат_епсилон_нечутливий" - це те саме, але стає квадратом втрат після допуску епсилону.

Детальніше про формули збитків можна знайти в Посібнику користувача .

Штраф (він же термін регулювання), який повинен бути використаний. Значення за замовчуванням - «l2», що є стандартним регулятором для лінійних моделей SVM. «L1» та «elasticnet» можуть привнести в модель розрідженість (вибір функцій), недосяжну за допомогою «l2».

альфа float, за замовчуванням = 0,0001

Константа, яка множить термін регуляризації. Чим вище значення, тим сильніше регуляризація. Також використовується для обчислення швидкості навчання, якщо встановлено значення '.

l1_ratio float, за замовчуванням = 0,15

Параметр змішування Elastic Net з показником 0 - "elanetnet".

fit_intercept bool, за замовчуванням = True

Чи слід оцінювати перехоплення чи ні. Якщо значення False, дані вважаються вже відцентрованими.

max_iter int, за замовчуванням = 1000

Максимальна кількість проходів за даними тренувань (вони ж епохи). Це впливає лише на поведінку методу підгонки, а не на метод часткового_подобання.

Нове у версії 0.19.

Критерій зупинки. Якщо це не значення None, навчання припиняється, коли (loss> best_loss - tol) протягом n_iter_no_change послідовних епох.

Нове у версії 0.19.

Чи слід перемішувати дані навчання після кожної епохи.

багатослівний int, за замовчуванням = 0

Рівень багатослів'я.