Основен » алгоритмична търговия » Стратифицирана случайна извадка

Стратифицирана случайна извадка

алгоритмична търговия : Стратифицирана случайна извадка
Какво е стратифицирана случайна извадка?

Стратифицираната случайна извадка е метод за вземане на проби, който включва разделянето на популация на по-малки подгрупи, известни като слоеве. При стратифицирана случайна извадка или стратификация, слоевете се формират въз основа на споделените качества или характеристики на членовете като доходи или образователни постижения.

Стратифицираната случайна извадка се нарича също пропорционална случайна извадка или квотна случайна извадка.

[Важно: Стратифицираната извадка се използва за подчертаване на разликите между групите в популацията, за разлика от обикновената случайна извадка, която третира всички членове на популацията като равни, с еднаква вероятност да бъдат взети проба.]

01:40

Стратифицирана случайна извадка

Как работи стратифицираната случайна извадка

При завършване на анализ или изследване на група от образувания със сходни характеристики, изследовател може да установи, че размерът на популацията е твърде голям, за да завърши изследването. За да спести време и пари, анализаторът може да предприеме по-осъществим подход, като избере малка група от населението. Малката група е посочена като размер на извадката, която е подмножество от популацията, която се използва за представяне на цялото население. Проба може да бъде избрана от популация по много начини, един от които е методът на стратифицирана случайна извадка.

Стратифицирана случайна извадка включва разделяне на цялата популация на хомогенни групи, наречени слоеве (множествено число за прослойка). След това се подбират случайни проби от всеки слой. Например, помислете за академичен изследовател, който би искал да знае броя на студентите в MBA през 2007 г., които са получили предложение за работа в рамките на три месеца след завършването.

Скоро ще открие, че за годината е имало почти 200 000 завършили MBA. Той може да реши просто да вземе обикновена случайна извадка от 50 000 завършили и да проведе проучване. Още по-добре, той би могъл да раздели населението на слоеве и да вземе произволна извадка от слоевете. За целта той би създал групи от населението въз основа на пол, възрастова група, раса, страна на националност и произход на кариерата. Случайна проба от всеки слой се взема в число, пропорционално на размера на слоя, в сравнение с популацията. След това тези подмножества на слоевете се обединяват, за да образуват произволна извадка.

Ключови заведения

  • Стратифицираната случайна извадка позволява на изследователите да получат извадка от популацията, която най-добре представя цялата изследвана популация.
  • Стратифицираната случайна извадка включва разделяне на цялата популация на хомогенни групи, наречени слоеве.
  • Стратифицираната случайна извадка се различава от обикновената случайна извадка, която включва случаен подбор на данни от цяла популация, така че всяка възможна извадка е еднакво вероятно да се появи.

Пример за стратифицирана случайна извадка

Да предположим, че изследователски екип иска да определи общата оценка на студентите в САЩ в САЩ. Изследователският екип среща трудности при събирането на данни от всички 21 милиона студенти; той решава да вземе произволна извадка от населението, като използва 4000 студенти.

Сега приемете, че екипът разглежда различните атрибути на участниците в извадката и се чуди дали има някакви различия в GPAs и специалностите на студентите. Да предположим, че установява, че 560 ученици са английски специалности, 1135 са специалности по наука, 800 са специалности по компютърни науки, 1090 са инженерни специалности, а 415 са специалности по математика. Екипът иска да използва пропорционална стратифицирана случайна извадка, където прослоят от извадката е пропорционален на случайната извадка в популацията.

Да предположим, че екипът изследва демографията на студентите в САЩ и открива процента на това, което студентите учат в 12% специалност английски език, 28% специалност в науката, 24% специалност компютърни науки, 21% специалност инженерство и 15% специалност по математика. По този начин от стратифицирания произволен метод на вземане на проби се създават пет слоя.

След това екипът трябва да потвърди, че прослойката на населението е пропорционална на прослойката в извадката; те обаче намират, че пропорциите не са равни. След това екипът трябва да направи повторна извадка от 4000 студенти от населението и на случаен принцип да избере 480 английски, 1120 науки, 960 компютърни науки, 840 инженерни и 600 студенти по математика.

При тях тя има пропорционална стратифицирана случайна извадка от студенти в колежа, която осигурява по-добро представяне на студентските специалности в САЩ След това изследователите могат да подчертаят специфична прослойка, да наблюдават различните проучвания на студенти в САЩ и да наблюдават различните средни точки за оценка,

Прости случайни срещу стратифицирани случайни проби

Простите случайни проби и стратифицираните случайни проби са и статистически инструменти за измерване. Проста случайна извадка се използва за представяне на цялата съвкупност от данни. Стратифицирана произволна извадка разделя популацията на по-малки групи или слоеве въз основа на споделените характеристики.

Простата случайна извадка често се използва, когато има много малко информация за популацията от данни, когато популацията от данни има твърде много различия, за да се раздели на различни подмножества, или когато има само една отличителна характеристика сред популацията от данни.

Например, компания за бонбони може да иска да проучи навиците за купуване на своите клиенти, за да определи бъдещето на своята продуктова линия. Ако има 10 000 клиенти, той може да използва избрани 100 от тези клиенти като случайна извадка. След това той може да приложи това, което намери от тези 100 клиенти към останалата част от неговата база. За разлика от стратификацията, тя ще извади 100 членове чисто произволно, без да се съобразява с техните индивидуални характеристики.

Пропорционална и непропорционална стратификация

Стратифицираната случайна извадка гарантира, че всяка подгрупа от дадена популация е адекватно представена в цялата извадкова съвкупност от едно изследване. Стратификацията може да бъде пропорционална или непропорционална. При пропорционален стратифициран метод размерът на извадката на всеки слой е пропорционален на размера на популацията на прослоя.

Например, ако изследователят иска извадка от 50 000 завършили, използвайки възрастовия диапазон, пропорционалната стратифицирана произволна извадка ще бъде получена по тази формула: (размер на извадката / размер на населението) х размер на прослойката. Таблицата по-долу предполага брой на населението от 180 000 MBA завършили годишно.

Възрастова група


24-28


29-33


34-37


Обща сума


Брой хора в страт


90000


60000


30000


180000


Размер на пробата на слоеве


25000


16667


8333


50, 000


Размерът на пробата на слоевете за завършилите MBA във възрастовия диапазон от 24 до 28 години се изчислява като (50 000/180 000) x 90 000 = 25 000. Същият метод се използва за останалите възрастови групи. Сега, когато е известен размерът на пробата на слоевете, изследователят може да извърши просто произволно вземане на проби във всеки слой, за да избере участниците си в проучването. С други думи, 25 000 завършили от възрастовата група от 24 до 28 години ще бъдат избрани на случаен принцип от цялото население, 16 667 завършили от възрастовия диапазон 29-33 години ще бъдат избрани от населението на случаен принцип и т.н.

В непропорционално стратифицирана проба, размерът на всеки слой не е пропорционален на размера му в популацията. Изследователят може да реши да вземе проба 1/2 от завършилите във възрастовата група 34-37 и 1/3 от завършилите във възрастовата група 29-33 години.

Важно е да се отбележи, че един човек не може да се впише в множество слоеве. Всяко образувание трябва да се побере само в един слой. Наличието на подгрупи се припокрива означава, че някои индивиди ще имат по-големи шансове да бъдат избрани за изследването, което напълно отрича концепцията за стратифицирано вземане на проби като вид вероятностна извадка.

[Важно: Мениджърите на портфейли могат да използват стратифицирана произволна извадка за създаване на портфейли чрез репликиране на индекс, като например облигационен индекс.]

Предимства на стратифицираната случайна извадка

Основното предимство на стратифицираната случайна извадка е, че тя отчита ключови характеристики на популацията в извадката. Подобно на претеглената средна стойност, този метод на вземане на проби дава характеристики в извадката, които са пропорционални на общата популация. Стратифицираната случайна извадка работи добре за популации с различни атрибути, но в противен случай е неефективна, ако не могат да се формират подгрупи.

Стратификацията дава по-малка грешка в оценката и по-голяма точност от простия метод на случайно вземане на проби. Колкото по-големи са разликите между слоевете, толкова по-голяма е печалбата в точността.

Недостатъци на стратифицирана случайна извадка

За съжаление, този метод на изследване не може да се използва във всяко изследване. Недостатъкът на метода е, че трябва да бъдат изпълнени няколко условия, за да се използва правилно. Изследователите трябва да идентифицират всеки член на популация, която се изследва, и да класифицират всеки от тях в една и само една подпопулация. В резултат на това стратифицираната случайна извадка е неизгодна, когато изследователите не могат да класифицират уверено всеки член от популацията в подгрупа. Освен това намирането на изчерпателен и окончателен списък на цялото население може да бъде предизвикателство.

Припокриването може да бъде проблем, ако има теми, които попадат в множество подгрупи. Когато се извършва проста случайна извадка, по-вероятно е да бъдат избрани тези, които са в множество подгрупи. Резултатът може да бъде погрешно представяне или неточно отражение на населението.

Горните примери улесняват: студентите, завършилите, мъжете и жените са ясно определени групи. В други ситуации обаче може да е много по-трудно. Представете си, че включва характеристики като раса, етническа принадлежност или религия. Процесът на сортиране става по-труден, което прави стратифицираното произволно вземане на проби неефективен и по-малко от идеалния метод.

Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.

Свързани условия

Sample A sample е по-малка, управляема версия на по-голяма група. Пробите се използват при статистически тестове, когато размерите на популацията са твърде големи. повече Как работят простите случайни проби Простата случайна извадка е подмножество от статистическа съвкупност, в която всеки член от подмножеството има еднаква вероятност да бъде избран. Под обикновена случайна извадка се разбира непредубедено представяне на група. повече Представителна извадка често се използва за екстраполиране на по-широки настроения Представителната извадка е подгрупа от популация, която отразява характеристиките на цялата популация. повече Вход и изход на систематичното вземане на проби Систематичното вземане на проби е метод на вероятностно вземане на проби, при който се избира произволна извадка от по-голяма популация. още Определение на извадката Вземането на проби е процес, използван в статистическия анализ, при който група наблюдения се извличат от по-голяма популация. още Определение на Т-теста Т-тестът е вид инфекциозна статистика, използвана за определяне дали има значителна разлика между средствата на две групи, които могат да бъдат свързани по определени характеристики. повече партньорски връзки
Препоръчано
Оставете Коментар