Основен » бизнес лидери » Квадрат на Chi (χ2) Статистическо определение

Квадрат на Chi (χ2) Статистическо определение

бизнес лидери : Квадрат на Chi (χ2) Статистическо определение
Какво е статистически квадрат на Chi?

Чи квадрат ( χ 2 ) statistic е тест, който измерва как очакванията се сравняват с реално наблюдаваните данни (или резултатите от модела). Данните, използвани при изчисляването на статистиката на квадратна чи, трябва да са произволни, сурови, взаимно изключващи се, да се черпят от независими променливи и да се черпят от достатъчно голяма извадка. Например резултатите от хвърлянето на монета 100 пъти отговарят на тези критерии.

Chi квадратните тестове често се използват при тестване на хипотези.

Формулата за Ква Ква е

χc2 = ∑ (Oi − Ei) 2Навсякъде: c = степени на свободаO = наблюдавана (и) стойност (и) E = очаквана (и) стойност (и) \ начало {подравнено} & \ chi ^ 2_c = \ сума \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {където:} \\ & c = \ текст {степени на свобода} \\ & O = \ текст {наблюдавана стойност (и)} \\ & E ​​= \ текст {очакваната стойност (s) )} \\ \ край {подравнен} χc2 = ∑Ei (Oi −Ei) 2, където: c = степени на свободаO = наблюдавана стойност (и) E = очаквана стойност (и)

Какво ви казва статистиката на квадрат Chi?

Има два основни вида чи квадратни тестове: тестът за независимост, който задава въпрос на взаимоотношения, като например: „Има ли връзка между половете и оценките на SAT?“; и тестът за доброто прилягане, който пита нещо от рода на „Ако монета е хвърлена 100 пъти, дали ще изплува глави 50 пъти и опашки 50 пъти?“

За тези тестове се използват степени на свобода, за да се определи дали определена нулева хипотеза може да бъде отхвърлена въз основа на общия брой променливи и проби в рамките на експеримента.

Например, когато разглеждаме студентите и избора на курса, размерът на извадката от 30 или 40 студенти вероятно не е достатъчно голям, за да генерира значителни данни. Получаването на същите или сходни резултати от изследване, използващо размер на извадка от 400 или 500 ученици, е по-валидно.

В друг пример, помислете да хвърлите монета 100 пъти. Очакваният резултат от хвърлянето на честна монета 100 пъти е главите да се издигнат 50 пъти, а опашките да се появят 50 пъти. Действителният резултат може да е, че главите се появяват 45 пъти, а опашките - 55 пъти. Статистическата статистика на чи показва всички несъответствия между очакваните резултати и реалните резултати.

Ключови заведения

  • Чи квадрат (χ 2 ) statistic е тест, който измерва как очакванията се сравняват с реално наблюдаваните данни.
  • Съществуват два основни вида квадратни тестове: тестът за независимост на данните и тестовете за годност на даден модел.
  • Тези тестове могат да бъдат използвани, за да се определи дали определена нулева хипотеза може да бъде отхвърлена при тестване на хипотези.

Пример за тест на квадрат на Chi

Представете си, че е проведена случайна анкета между 2000 различни избиратели, мъже и жени. Хората, които отговориха, бяха класифицирани по пол и независимо дали са републикански, демократични или независими. Представете си решетка с колоните, обозначени с републикански, демократи и независими, и два реда, обозначени с мъже и жени. Да приемем, че данните от 2000 анкетирани са, както следва:

републиканскидемократнезависимОбща сума
Мъжки пол400300100800
Женски пол5006001001200
Обща сума9009002002000

Първата стъпка за изчисляване на статистическата статистика на чи е да се намерят очакваните честоти. Те се изчисляват за всяка "клетка" в мрежата. Тъй като има две категории пол и три категории политически възгледи, има шест общи очаквани честоти. Формулата за очакваната честота е:

E (r, c) = n (r) × c (r) никъде: r = ред във въпросc = колона във въпросn = съответстваща сума \ начало {подравнено} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {където:} \\ & r = \ текст {въпросният ред} \\ & c = \ текст {въпросната колона} \\ & n = \ текст {съответстващ общ } \\ \ край {подравнен} E (r, c) = nn (r) × c (r), където: r = ред във въпросc = колона във въпросn = съответстваща сума

В този пример очакваните честоти са:

  • E (1, 1) = (900 х 800) / 2 000 = 360
  • E (1, 2) = (900 х 800) / 2 000 = 360
  • E (1, 3) = (200 х 800) / 2 000 = 80
  • E (2, 1) = (900 х 1200) / 2 000 = 540
  • E (2, 2) = (900 х 1200) / 2 000 = 540
  • E (2, 3) = (200 х 1200) / 2 000 = 120

На следващо място, те се използват стойности за изчисляване на chi квадратна статистика по следната формула:

Chi-квадрат = ∑ [O (r, c) −E (r, c)] 2E (r, c) където: O (r, c) = наблюдавани данни за дадения ред и колона \ започва {подравнено} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {където:} \\ & O (r, c) = \ текст {наблюдавани данни за дадения ред и колона} \\ \ край {подравнен} Chi-квадрат = ∑E (r, c) [O (r, c) −E (r, в)] 2, където: O (r, c) = наблюдавани данни за дадения ред и колона

В този пример изразът за всяка наблюдавана стойност е:

  • 0 (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • 0 (1, 3) = (100 - 80) 2/80 = 5
  • 0 (2, 1) = (500 - 540) 2/540 = 2, 96
  • 0 (2, 2) = (600 - 540) 2/540 = 6, 67
  • 0 (2, 3) = (100 - 120) 2/120 = 3, 33

Статистическата статистика на чи е след това равна на сумата от тези стойности или 32.41. След това можем да разгледаме таблицата с статистически данни на чи, за да видим, предвид степента на свобода в нашата настройка, дали резултатът е статистически значим или не.

Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.

Свързани условия

Определение на степените на свободата Степен на свобода се отнася до максималния брой логически независими стойности, които са стойности, които имат свобода да варират в извадката от данни. още Определение на Т-теста Т-тестът е вид инфекциозна статистика, използвана за определяне дали има значителна разлика между средствата на две групи, които могат да бъдат свързани по определени характеристики. повече Какво ни казва обратната корелация Обратната корелация, известна още като отрицателна корелация, е противоположна връзка между две променливи, така че те да се движат в противоположни посоки. повече Как работи остатъчното стандартно отклонение Остатъчното стандартно отклонение е статистически термин, използван за описване на разликата в стандартните отклонения на наблюдаваните стойности спрямо прогнозираните стойности, както е показано в точки от регресионен анализ. повече Как работи анализът на вариацията (ANOVA) Анализът на дисперсията (ANOVA) е инструмент за статистически анализ, който разделя общата променливост, открита в набора от данни, на два компонента: случайни и систематични фактори. повече Корелация Корелацията е статистическа мярка за това как две ценни книжа се движат една спрямо друга. повече партньорски връзки
Препоръчано
Оставете Коментар