Основен » алгоритмична търговия » Тестване на хипотези във финансите: концепция и примери

Тестване на хипотези във финансите: концепция и примери

алгоритмична търговия : Тестване на хипотези във финансите: концепция и примери

Вашият инвестиционен съветник ви предлага месечен инвестиционен план за доходи, който обещава променлива възвръщаемост всеки месец. Ще инвестирате в него само ако сте сигурни в среден доход от 180 долара месечно. Вашият съветник ви казва също, че за последните 300 месеца схемата е имала възвръщаемост на инвестициите със средна стойност 190 долара и стандартно отклонение от 75 долара. Трябва ли да инвестирате в тази схема? Тестовете на хипотези идват на помощ за вземането на такива решения.

Тази статия предполага запознаването на читателите с концепциите за нормална таблица на разпределение, формула, p-стойност и свързани основи на статистиката.

Какво е тестване на хипотези?

Хипотезата или тестът за значимост е математически модел за тестване на претенция, идея или хипотеза за параметър от интерес за даден набор от популации, като се използват данни, измерени в набор от извадки. Изчисленията се извършват на избрани проби, за да се събере по-решаваща информация за характеристиките на цялото население, което позволява систематичен начин за тестване на твърдения или идеи за целия набор от данни.

Ето един прост пример: Директор на училището съобщава, че учениците в нейното училище оценяват средно 7 от 10 на изпитите. За да тестваме тази „хипотеза“, ние записваме оценки от 30 ученици (извадка) от цялата учебна популация на училището (да речем 300) и изчисляваме средната стойност на тази извадка. След това можем да сравним средната (изчислена) проба с средната (отчетена) популация и да се опитаме да потвърдим хипотезата.

За да вземем друг пример, годишната възвръщаемост на определен взаимен фонд е 8%. Да приемем, че взаимен фонд съществува от 20 години. Взимаме произволна извадка от годишна възвръщаемост на взаимния фонд за, да речем, пет години (извадка) и изчисляваме средната му стойност. След това сравняваме средната (изчислена) проба с средната (заявена) популация, за да проверим хипотезата.

Критериите за вземане на решения трябва да се основават на определени параметри на наборите от данни.

Съществуват различни методологии за тестване на хипотези, но са включени едни и същи четири основни стъпки:

Стъпка 1: Определете хипотезата

Обикновено отчетената стойност (или статистика на претенциите) се посочва като хипотеза и се предполага, че е вярна. За горните примери хипотезата ще бъде:

  • Пример А: Учениците в училището оценяват средно 7 от 10 на изпитите.
  • Пример Б: Годишната доходност на взаимния фонд е 8% годишно.

Това заявено описание представлява „ нищожна хипотеза (H 0 ) “ и се приема за вярно - начинът, по който обвиняемият в съдебния процес на съдебните заседатели се счита за невинен, докато не бъде доказан виновен от представените в съда доказателства. По подобен начин тестването на хипотези започва с посочване и приемане на „нулева хипотеза“ и след това процесът определя дали предположението вероятно е вярно или невярно.

Важният момент, който трябва да се отбележи, е, че тестваме нулевата хипотеза, защото има елемент на съмнение относно нейната валидност. Каквато и да е информация, която е против заявената нулева хипотеза, е включена в алтернативната хипотеза (H 1 ). За горните примери алтернативната хипотеза ще бъде:

  • Студентите оценяват средна стойност, която не е равна на 7.
  • Годишната доходност на взаимния фонд не е равна на 8% годишно.

С други думи, алтернативната хипотеза е пряко противоречие на нулевата хипотеза.

Както и в съдебния процес, съдебните заседатели приемат невинността на подсъдимия (нулева хипотеза). Прокурорът трябва да докаже друго (алтернативна хипотеза). По същия начин изследователят трябва да докаже, че нулевата хипотеза е или вярна, или невярна. Ако прокурорът не успее да докаже алтернативната хипотеза, съдебните заседатели трябва да пуснат подсъдимия (основавайки решението на нищожната хипотеза). По същия начин, ако изследователят не успее да докаже алтернативна хипотеза (или просто не прави нищо), тогава нулевата хипотеза се приема за вярна.

Стъпка 2: Задайте критериите

Критериите за вземане на решения трябва да се основават на определени параметри на набори от данни и това е мястото, където връзката към нормалното разпределение влиза в картината.

Съгласно стандартния постулат за статистическа информация относно разпределението на извадката, „За всеки размер на извадката n, разпределението на извадката на X̅ е нормално, ако популацията X, от която е взета пробата, е нормално разпределена.“ Следователно вероятностите на всички други възможни извадки означават, че човек може да избере, обикновено се разпространяват.

Например, определете дали средната дневна възвръщаемост на всички акции, регистрирани на фондовата борса на XYZ, около новогодишния ден е по-голяма от 2%.

H 0 : нулева хипотеза: средно = 2%

H 1 : Алтернативна хипотеза: средно> 2% (това искаме да докажем)

Вземете пробата (да речем за 50 запаса от общо 500) и изчислете средната стойност на пробата.

За нормално разпределение 95% от стойностите лежат в рамките на две стандартни отклонения от средната популация. Следователно, това нормално предположение за разпределение и централен лимит за извадков набор от данни ни позволява да установим 5% като ниво на значимост. Има смисъл, тъй като при това предположение има по-малко от 5% вероятност (100-95) да получат хора, които надхвърлят две стандартни отклонения от средното население. В зависимост от естеството на наборите от данни, други нива на значимост могат да бъдат взети на 1%, 5% или 10%. За финансови изчисления (включително поведенчески финанси) 5% е общоприетия лимит. Ако намерим някакви изчисления, които надхвърлят обичайните две стандартни отклонения, тогава имаме силен случай на отшелници, които да отхвърлят нулевата хипотеза.

Графично той е представен, както следва:

В горния пример, ако средната стойност на извадката е много по-голяма от 2% (да кажем 3, 5%), тогава отхвърляме нулевата хипотеза. Приема се алтернативната хипотеза (средно> 2%), което потвърждава, че средната дневна възвръщаемост на запасите наистина е над 2%.

Ако обаче вероятността средната стойност на извадката да не е значително по-голяма от 2% (и да остане, да кажем, около 2, 2%), тогава НЕ МОЖЕ да отхвърлим нулевата хипотеза. Предизвикателството идва как да вземем решение за такива случаи от близко разстояние. За да се направи заключение от избрани проби и резултати, трябва да се определи ниво на значимост, което позволява да се направи заключение за нулевата хипотеза. Алтернативната хипотеза позволява да се установи нивото на значимост или концепцията за „критичната стойност“ за вземане на решение за такива случаи от близко разстояние.

Според стандартната дефиниция на учебника „Критичната стойност е гранична стойност, която определя границите, отвъд които може да се получи по-малко от 5% от извадката, ако нулевата хипотеза е вярна. Средствата за извадка, получени извън критичната стойност, ще доведат до решение за отхвърляне на нулевата хипотеза. "В горния пример, ако сме определили критичната стойност като 2, 1%, а изчислената средна стойност достига 2, 2%, тогава отхвърляме нулевата хипотеза Критичната стойност установява ясно разграничение относно приемането или отхвърлянето.

Стъпка 3: Изчислете статистиката

Тази стъпка включва изчисляване на необходимата цифра (цифри), известна като тестова статистика (като средна стойност, z-оценка, p-стойност и т.н.), за избраната извадка. (Ще стигнем до тях в по-късен раздел.)

Стъпка 4: Достигнете заключение

С изчислените стойности (и) вземете решение за нулевата хипотеза. Ако вероятността за получаване на средна проба е по-малка от 5%, тогава изводът е да се отхвърли нулевата хипотеза. В противен случай приемете и запазете нулевата хипотеза.

Видове грешки

Възможно е да има четири възможни резултата при вземането на решения на базата на извадки по отношение на правилното приложение за цялото население:

Решение за запазване


Решение за отхвърляне


Отнася се за цялото население


правилен


неправилен

(Грешка в ТИП 1 - a)


Не се отнася за цялото население


неправилен

(Грешка в ТИП 2 - б)


правилен


„Правилните“ случаи са тези, при които решенията, взети по извадките, са наистина приложими за цялото население. Случаите на грешки възникват, когато човек реши да запази (или отхвърли) нулевата хипотеза въз основа на примерните изчисления, но това решение всъщност не важи за цялото население. Тези случаи представляват грешки от тип 1 (алфа) и тип 2 (бета), както е посочено в таблицата по-горе.

Избирането на правилната критична стойност позволява да се елиминират алфа грешките от тип 1 или да се ограничат до приемлив диапазон.

Алфа обозначава грешката на нивото на значимост и се определя от изследователя. За да се поддържа стандартното 5% значимост или ниво на доверие за изчисленията на вероятността, това се запазва на 5%.

Съгласно приложимите критерии и определения за вземане на решения:

  • „Този ​​(алфа) критерий обикновено е зададен на 0, 05 (a = 0, 05) и сравняваме нивото на алфа с p-стойността. Когато вероятността за грешка от тип I е по-малка от 5% (p <0, 05), решаваме да отхвърлим нулевата хипотеза; в противен случай запазваме нулевата хипотеза. "
  • Техническият термин, използван за тази вероятност, е p-стойност . Тя се определя като „вероятността за получаване на изваден резултат, като се има предвид, че стойността, посочена в нулевата хипотеза, е вярна. Р-стойността за получаване на пробен резултат се сравнява с нивото на значимост. "
  • Грешка от тип II или бета грешка се определя като „вероятността за неправилно задържане на нулевата хипотеза, в действителност тя не е приложима за цялото население“.

Още няколко примера ще демонстрират това и други изчисления.

Пример 1

Има месечна инвестиционна схема за доходи, която обещава променлива месечна доходност. Инвеститор ще инвестира в него само ако е гарантиран средно 180 долара месечен доход. Той има извадка от възвръщаемост от 300 месеца, което е средно 190 долара и стандартно отклонение от 75 долара. Трябва ли да инвестира в тази схема ">

Нека да настроим проблема. Инвеститорът ще инвестира в схемата, ако е сигурен в желаната от него средна доходност от 180 долара.

Н 0 : Нулева хипотеза: средно = 180

Н 1 : Алтернативна хипотеза: средно> 180

Метод 1: Подход за критична стойност

Определете критична стойност X L за средната проба, която е достатъчно голяма, за да отхвърли нулевата хипотеза - т.е. отхвърлете нулевата хипотеза, ако пробата означава> = критична стойност X L

P (идентифицирайте алфа грешка от тип I) = P (отхвърлете H 0, като се има предвид, че H 0 е вярно),

Това би било постигнато, когато средната стойност на извадката надхвърли критичните граници.

= P (при положение, че H 0 е вярно) = алфа

Графично изглежда, както следва:

Приемане на алфа = 0, 05 (т.е. 5% ниво на значимост), Z 0, 05 = 1, 645 (от таблицата Z или нормалната таблица на разпространение)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Тъй като средният размер на извадката (190) е по-голям от критичната стойност (187.12), нулевата хипотеза се отхвърля и заключението е, че средната месечна възвръщаемост наистина е по-голяма от 180 долара, така че инвеститорът може да обмисли да инвестира в тази схема.

Метод 2: Използване на стандартизирани статистически тестове

Човек също може да използва стандартизирана стойност z.

Статистика на теста, Z = (средна проба - средна стойност на населението) / (std-dev / sqrt (брой на пробите).

Тогава регионът за отхвърляне става следният:

Z = (190 - 180) / (75 / sqrt (300)) = 2.309

Нашият регион на отхвърляне при ниво на значимост 5% е Z> Z 0.05 = 1.645.

Тъй като Z = 2.309 е по-голямо от 1.645, нулевата хипотеза може да бъде отхвърлена със сходно заключение, споменато по-горе.

Метод 3: Изчисляване на P-стойност

Ние се стремим да идентифицираме P (средна проба> = 190, когато средната стойност = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

Следващата таблица за заключване на изчисленията на p стойността заключава, че има потвърдени доказателства за средните месечни доходи са по-високи от 180:

р-стойност


извод


по-малко от 1%


Потвърдени доказателства в подкрепа на алтернативната хипотеза


между 1% и 5%


Силни доказателства в подкрепа на алтернативната хипотеза


между 5% и 10%


Слаби доказателства в подкрепа на алтернативната хипотеза


по-голям от 10%


Няма доказателства в подкрепа на алтернативната хипотеза


Пример 2

Нов борсов брокер (XYZ) твърди, че таксите му за посредничество са по-ниски от тези на сегашния ви борсов брокер (ABC). Данните, достъпни от независима изследователска фирма, показват, че средната стойност и std-dev на всички клиенти на ABC брокери са съответно 18 и 6 долара.

Взета е извадка от 100 клиента на ABC и таксите за посредничество се изчисляват с новите тарифи на XYZ брокер. Ако средната стойност на извадката е 18, 75 долара и std-dev е същата (6 долара), може ли да се направи извод за разликата в средната сметка за посредничество между ABC и XYZ брокер ">

Н 0 : Нулева хипотеза: средно = 18

H 1 : Алтернативна хипотеза: средно 18 (Това искаме да докажем.)

Регион на отхвърляне: Z <= - Z 2.5 и Z> = Z 2.5 (като се приеме 5% ниво на значимост, разделете по 2, 5 всяка от двете страни).

Z = (средна проба - средна стойност) / (std-dev / sqrt (брой на пробите))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Тази изчислена Z стойност пада между двете граници, определени от:

- Z 2, 5 = -1, 96 и Z 2, 5 = 1, 96.

Това стига до заключението, че няма достатъчно доказателства, за да се заключи, че има разлика между скоростите на съществуващия ви брокер и новия брокер.

Алтернативно, p-стойност = P (Z1.25)

= 2 * 0.1056 = 0.2112 = 21.12%, което е по-голямо от 0.05 или 5%, което води до същото заключение.

Графично той е представен от следното:

Критични точки за метода на хипотетичното тестване:

  • Статистически метод, основан на предположения
  • Склонни към грешки толкова подробно по отношение на алфа и бета грешките
  • Тълкуването на p-стойността може да бъде двусмислено, което води до объркващи резултати

Долния ред

Тестването на хипотези позволява математически модел за валидиране на твърдение или идея с определено ниво на доверие. Въпреки това, като повечето статистически инструменти и модели, той е обвързан от няколко ограничения. Използването на този модел за вземане на финансови решения трябва да се разглежда критично, като се имат предвид всички зависимости. Алтернативни методи като Байесов извод също си струва да се проучат за подобен анализ.

Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.
Препоръчано
Оставете Коментар