Квадрат на Chi (χ2) Статистическо определение
Какво е статистически квадрат на Chi?Чи квадрат ( χ 2 ) statistic е тест, който измерва как очакванията се сравняват с реално наблюдаваните данни (или резултатите от модела). Данните, използвани при изчисляването на статистиката на квадратна чи, трябва да са произволни, сурови, взаимно изключващи се, да се черпят от независими променливи и да се черпят от достатъчно голяма извадка. Например резултатите от хвърлянето на монета 100 пъти отговарят на тези критерии.
Chi квадратните тестове често се използват при тестване на хипотези.
Формулата за Ква Ква е
χc2 = ∑ (Oi − Ei) 2Навсякъде: c = степени на свободаO = наблюдавана (и) стойност (и) E = очаквана (и) стойност (и) \ начало {подравнено} & \ chi ^ 2_c = \ сума \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {където:} \\ & c = \ текст {степени на свобода} \\ & O = \ текст {наблюдавана стойност (и)} \\ & E = \ текст {очакваната стойност (s) )} \\ \ край {подравнен} χc2 = ∑Ei (Oi −Ei) 2, където: c = степени на свободаO = наблюдавана стойност (и) E = очаквана стойност (и)
Какво ви казва статистиката на квадрат Chi?
Има два основни вида чи квадратни тестове: тестът за независимост, който задава въпрос на взаимоотношения, като например: „Има ли връзка между половете и оценките на SAT?“; и тестът за доброто прилягане, който пита нещо от рода на „Ако монета е хвърлена 100 пъти, дали ще изплува глави 50 пъти и опашки 50 пъти?“
За тези тестове се използват степени на свобода, за да се определи дали определена нулева хипотеза може да бъде отхвърлена въз основа на общия брой променливи и проби в рамките на експеримента.
Например, когато разглеждаме студентите и избора на курса, размерът на извадката от 30 или 40 студенти вероятно не е достатъчно голям, за да генерира значителни данни. Получаването на същите или сходни резултати от изследване, използващо размер на извадка от 400 или 500 ученици, е по-валидно.
В друг пример, помислете да хвърлите монета 100 пъти. Очакваният резултат от хвърлянето на честна монета 100 пъти е главите да се издигнат 50 пъти, а опашките да се появят 50 пъти. Действителният резултат може да е, че главите се появяват 45 пъти, а опашките - 55 пъти. Статистическата статистика на чи показва всички несъответствия между очакваните резултати и реалните резултати.
Ключови заведения
- Чи квадрат (χ 2 ) statistic е тест, който измерва как очакванията се сравняват с реално наблюдаваните данни.
- Съществуват два основни вида квадратни тестове: тестът за независимост на данните и тестовете за годност на даден модел.
- Тези тестове могат да бъдат използвани, за да се определи дали определена нулева хипотеза може да бъде отхвърлена при тестване на хипотези.
Пример за тест на квадрат на Chi
Представете си, че е проведена случайна анкета между 2000 различни избиратели, мъже и жени. Хората, които отговориха, бяха класифицирани по пол и независимо дали са републикански, демократични или независими. Представете си решетка с колоните, обозначени с републикански, демократи и независими, и два реда, обозначени с мъже и жени. Да приемем, че данните от 2000 анкетирани са, както следва:
републикански | демократ | независим | Обща сума | |
Мъжки пол | 400 | 300 | 100 | 800 |
Женски пол | 500 | 600 | 100 | 1200 |
Обща сума | 900 | 900 | 200 | 2000 |
Първата стъпка за изчисляване на статистическата статистика на чи е да се намерят очакваните честоти. Те се изчисляват за всяка "клетка" в мрежата. Тъй като има две категории пол и три категории политически възгледи, има шест общи очаквани честоти. Формулата за очакваната честота е:
E (r, c) = n (r) × c (r) никъде: r = ред във въпросc = колона във въпросn = съответстваща сума \ начало {подравнено} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {където:} \\ & r = \ текст {въпросният ред} \\ & c = \ текст {въпросната колона} \\ & n = \ текст {съответстващ общ } \\ \ край {подравнен} E (r, c) = nn (r) × c (r), където: r = ред във въпросc = колона във въпросn = съответстваща сума
В този пример очакваните честоти са:
- E (1, 1) = (900 х 800) / 2 000 = 360
- E (1, 2) = (900 х 800) / 2 000 = 360
- E (1, 3) = (200 х 800) / 2 000 = 80
- E (2, 1) = (900 х 1200) / 2 000 = 540
- E (2, 2) = (900 х 1200) / 2 000 = 540
- E (2, 3) = (200 х 1200) / 2 000 = 120
На следващо място, те се използват стойности за изчисляване на chi квадратна статистика по следната формула:
Chi-квадрат = ∑ [O (r, c) −E (r, c)] 2E (r, c) където: O (r, c) = наблюдавани данни за дадения ред и колона \ започва {подравнено} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {където:} \\ & O (r, c) = \ текст {наблюдавани данни за дадения ред и колона} \\ \ край {подравнен} Chi-квадрат = ∑E (r, c) [O (r, c) −E (r, в)] 2, където: O (r, c) = наблюдавани данни за дадения ред и колона
В този пример изразът за всяка наблюдавана стойност е:
- 0 (1, 1) = (400 - 360) 2/360 = 4, 44
- O (1, 2) = (300 - 360) 2/360 = 10
- 0 (1, 3) = (100 - 80) 2/80 = 5
- 0 (2, 1) = (500 - 540) 2/540 = 2, 96
- 0 (2, 2) = (600 - 540) 2/540 = 6, 67
- 0 (2, 3) = (100 - 120) 2/120 = 3, 33
Статистическата статистика на чи е след това равна на сумата от тези стойности или 32.41. След това можем да разгледаме таблицата с статистически данни на чи, за да видим, предвид степента на свобода в нашата настройка, дали резултатът е статистически значим или не.
Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.