Статистика - засіб для відмови від футболу; Статистика з котами Блог
Одне, що робить спорт таким цікавим, - це безліч статистичних даних, пов’язаних з кожним гравцем, кожною грою, кожною командою та кожним сезоном. Окрім державних установ, ви не знайдете кращих джерел даних, на яких би потренувались. Зайти на веб-сайт професійного спорту просто і знайти кілька необроблених даних, які потребують аналізу.

У футболі (американський тип) часто кажуть, що хороший напад забезпечує хвилювання, але хороший захист виграє ігри. Фанати "Колтс" 2006 року в Індіанаполісі, мабуть, не погоджуються. Зайнявши 3-е місце в нападі, але 21-е з 32 команд у захисті, Колтс мав регулярний рекорд сезону 12 перемог та 4 поразки та виграв Суперкубок. Можливо, вони були аномалією. Тож питання в наступному: чи є команди, які роблять післясезонні плей-офф кращими в обороні, ніж решта ліги, як стверджує загальноприйнята мудрість?
Дані для цього аналізу складалися з 26 змінних (тобто статистики результативності команд, таких як кількість ігор, пенальті, помилки, 3-я та 4-я конверсії вниз і час володіння) для 32 команд НФЛ (дякую nfl.com) . Наявність такої кількості змінних продуктивності із порівняно невеликою кількістю команд є позначкою того, що факторний аналіз може бути корисним способом продовження (https://statswithcats.wordpress.com/2010/08/27/the-right-tool-for-the-job /). Факторний аналіз (ФА) базується на концепції, що варіація набору змінних може бути переставлена і віднесена до нових змінних, званих факторами. Використання факторів замість вихідних змінних іноді є кращим, оскільки фактори ефективніші (тобто для оцінки майже тієї ж частки мінливості, що і вихідні змінні, потрібно менше факторів).
FA вимагає певної інтуїції для інтерпретації. ФА формує рівняння, які визначають кожен фактор з точки зору вихідних змінних:
F1 через Fm є м фактори, що замінюють оригінал змінні
x1 через xn є вихідними змінними
a1через an є вагами факторного аналізу.
м завжди менше або дорівнює , але набагато менше, якщо вам пощастить.
Вам потрібно поглянути на співвідношення між вихідними змінними та факторами та вгадати, що може означати кожен фактор. Це все одно, що отримати велику коробку деталей - шестерні, транзистори, шини, тканину, двигуни, труби, дроти та пиломатеріали - і спробувати зрозуміти, що вони повинні виготовити. Деякі частини будуть цілісними, а інші залишиться.