Квартил
Какво е квартил?Квартилът е статистически термин, описващ разделянето на наблюденията на четири дефинирани интервала въз основа на стойностите на данните и как те се сравняват с целия набор от наблюдения.
Разбиране на квартилите
За да разберем квантила, важно е да разберем медианата като мярка за централна тенденция. Медианата в статистиката е средната стойност на набор от числа. Точката, в която точно половината от данните се намира под и над централната стойност.
И така, като се има предвид набор от 13 числа, медианата ще бъде седмото число. Шестте числа, предхождащи тази стойност, са най-ниските числа в данните, а шестте числа след медианата са най-високите числа в дадения набор от данни. Тъй като медианата не се влияе от екстремни стойности или отживелици в разпределението, понякога се предпочита пред средната стойност.
Медианата е стабилен оценител на местоположението, но не казва нищо за това как данните от двете страни на нейната стойност се разпространяват или разпространяват. Това е мястото, където стъпките на квартила. Квартилът измерва разпространението на стойности над и под средната стойност, като разпределя разпределението на четири групи.
Ключови заведения
- Квартилът измерва разпространението на стойностите над и под средната стойност, като разпределя разпределението на четири групи.
- Квартил разделя данните на три точки - долен кватил, средна и горна четирия - за да образува четири групи от набора от данни.
- Квартилите се използват за изчисляване на интерквартилния диапазон, който е мярка за променливост около медианата.
Как работят квартилите
Точно както медианата разделя данните на половина, така че 50% от измерването лежи под медианата и 50% лежи над нея, така и четирителят разгражда данните на четвъртинки, така че 25% от измерването са по-малко от долната четвъртина, 50 % са по-малко от средната стойност, а 75% са по-малко от горната четворка.
Квартил разделя данните на три точки - долен кватил, средна и горна четирия - за да образува четири групи от набора от данни. Долният квантил или първият квантил се обозначава като Q1 и е средното число, което попада между най-малката стойност на набора от данни и медианата. Вторият квантил, Q2, също е средният. Горната или третата четвъртина, обозначена като Q3, е централната точка, която се намира между средната и най-големия брой на разпределението.
Сега можем да начертаем четирите групи, формирани от четирите. Първата група стойности съдържа най-малкото число до Q1; втората група включва Q1 към медианата; третият набор е средната за Q3; четвъртата категория включва Q3 до най-високата точка на данни от целия набор.
Всеки трикол съдържа 25% от общите наблюдения. По принцип данните са подредени от най-малките до най-големите:
- Първа четвърт: най-ниските 25% от числата
- Втори кватил: между 25, 1% и 50% (до средната)
- Трети четвърт: 51% до 75% (над средната)
- Четвърти квартал: най-високите 25% от числата
Квартилен пример
Нека да работим с пример. Да предположим, разпределението на оценките по математика в клас от 19 ученици във възходящ ред е:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Първо маркирайте средната стойност Q2, която в този случай е десетата стойност: 75.
Q1 е централната точка между най-малкия резултат и средната стойност. В този случай Q1 попада между първата и петата оценка: 68. [Обърнете внимание, че средната може да бъде включена и при изчисляване на Q1 или Q3 за нечетен набор от стойности. Ако включим средната стойност от двете страни на средната точка, тогава Q1 ще бъде средната стойност между първата и десетата оценка, която е средната стойност на петия и шестия резултат - (пети + шести) / 2 = (68 + 69) / 2 = 68, 5].
Q3 е средната стойност между Q2 и най-високата оценка: 84. [Или ако включите медианата, Q3 = (82 + 84) / 2 = 83].
Сега, когато имаме своите квартили, нека интерпретираме техния брой. Резултат от 68 (Q1) представлява първия кватил и е 25 -ти перцентил. 68 е средната стойност на долната половина на резултата, посочена в наличните данни, т.е. средната стойност на оценките от 59 до 75.
Q1 ни казва, че 25% от оценките са по-малко от 68 и 75% от класните оценки са по-големи. Q2 (средната) е 50 -ти перцентил и показва, че 50% от оценките са по-малко от 75, а 50% от оценките са над 75. И накрая, Q3, 75 -ти перцентил, разкрива, че 25% от оценките са по-големи и 75% са по-малко от 84.
Специални съображения
Ако точката на данни за Q1 е по-далеч от средната, отколкото Q3 е от средната, тогава можем да кажем, че има по-голяма дисперсия между по-малките стойности на набора от данни, отколкото сред по-големите стойности. Същата логика се прилага, ако Q3 е по-далеч от Q2, отколкото Q1 е от средната.
Освен това, ако има четен брой данни точки, средната стойност ще бъде средната стойност на средните две числа. В нашия пример по-горе, ако имахме 20 ученици вместо 19, средната стойност на техните резултати ще бъде средната аритметика на десетото и единадесетото число.
Квартилите се използват за изчисляване на интерквартилния диапазон, който е мярка за променливост около медианата. Интерквартилният диапазон се изчислява просто като разликата между първото и третото тримесечие: Q3 - Q1. В действителност, диапазонът на средната половина на данните показва колко са разпространени данните.
За големи масиви от данни Microsoft Excel има функция QUARTILE за изчисляване на квартили.
Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.