Основен » алгоритмична търговия » Основи за регресия за бизнес анализ

Основи за регресия за бизнес анализ

алгоритмична търговия : Основи за регресия за бизнес анализ

Ако някога сте се чудили как две или повече части се отнасят помежду си (напр. Как БВП се влияе от промените в безработицата и инфлацията) или ако някога сте имали шефа си да ви помоли да създадете прогноза или да анализирате прогнозите въз основа относно взаимоотношенията между променливи, тогава изучаването на регресионен анализ би си струвало да отделите време.

В тази статия ще научите основите на обикновената линейна регресия, понякога наричана „обикновени най-малки квадрати“ или OLS регресия - инструмент, често използван при прогнозиране и финансов анализ. Ще започнем с изучаването на основните принципи на регресията, първо да научим за ковариацията и корелацията и след това да преминем към изграждането и интерпретирането на регресионния резултат. Популярният бизнес софтуер като Microsoft Excel може да направи всички регресионни изчисления и резултати за вас, но все пак е важно да научите основните механики.

Променливи

В основата на регресионния модел е връзката между две различни променливи, наречени зависими и независими променливи. Да предположим, например, че искате да прогнозирате продажбите за вашата компания и сте заключили, че продажбите на вашата компания се увеличават и намаляват в зависимост от промените в БВП.

Продажбите, които прогнозирате, биха били зависимата променлива, тъй като стойността им "зависи" от стойността на БВП, а БВП би бил независимата променлива. След това ще трябва да определите силата на връзката между тези две променливи, за да прогнозирате продажбите. Ако БВП се увеличи / намали с 1%, колко ще се увеличат или намалят продажбите ви?

ковариация

Cov (x, y) = ∑ (xn − xu) (yn-yu) N \ start {подравнен} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ край {подравнен} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Формулата за изчисляване на връзката между две променливи се нарича ковариация. Това изчисление ви показва посоката на връзката. Ако една променлива се увеличава, а другата променлива също се увеличава, ковариацията ще бъде положителна. Ако една променлива върви нагоре, а другата има тенденция към спад, ковариацията ще бъде отрицателна.

Реалният брой, който получавате от изчисляването на това, може да бъде трудно да се интерпретира, защото не е стандартизиран. Ковариацията от пет например може да се интерпретира като положителна връзка, но силата на връзката може да се каже само, че е по-силна, отколкото ако числото е четири или по-слабо, отколкото ако числото е шест.

Коефициент на корелация

Корелация = ρxy = Covxysxsy \ начало {подравнен} & Корелация = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ край {подравнен} Корелация = ρxy = sx sy Covxy

Трябва да стандартизираме ковариацията, за да можем да я интерпретираме по-добре и да я използваме при прогнозиране, а резултатът е изчислението на корелацията. Изчислението на корелацията просто приема ковариацията и я разделя на произведението на стандартното отклонение на двете променливи. Това ще свърже корелацията между стойност -1 и +1.

Корелация на +1 може да се тълкува, за да подскаже, че и двете променливи се движат перфектно положително помежду си, а -1 означава, че са напълно отрицателно свързани. В предишния ни пример, ако корелацията е +1 и БВП се увеличи с 1%, тогава продажбите ще се увеличат с 1%. Ако корелацията е -1, увеличението на БВП с 1% би довело до намаление на продажбите с 1% - точно обратното.

Регресионно уравнение

Сега, когато знаем как се изчислява относителната връзка между двете променливи, можем да разработим уравнение за регресия, за да прогнозираме или прогнозираме променливата, която желаем. По-долу е формулата за обикновена линейна регресия. "Y" е стойността, която се опитваме да прогнозираме, "b" е наклонът на регресионната линия, "x" е стойността на нашата независима стойност, а "a" представлява y-прехващането. Регресионното уравнение просто описва връзката между зависимата променлива (y) и независимата променлива (x).

y = bx + a \ начало {подравнено} & y = bx + a \\ \ край {подравнено} y = bx + a

Прихващането или "a" е стойността на y (зависима променлива), ако стойността на x (независима променлива) е нула и понякога просто се нарича "константа". Така че, ако не е имало промяна в БВП, вашата компания все пак ще направи някои продажби - тази стойност, когато промяната в БВП е нула, е прихващането. Погледнете графиката по-долу, за да видите графично изображение на уравнение на регресия. В тази графика има само пет точки от данни, представени от петте точки на графиката. Линейната регресия се опитва да оцени линия, която най-добре пасва на данните (линия с най-добро прилягане) и уравнението на тази линия води до уравнение на регресията.

Фигура 1: Линия, която е най-подходяща

Източник: Инвестопедия

Регресии в Excel

Сега, когато разбирате някои от предисторията, която преминава в регресионен анализ, нека направим един прост пример, използвайки регресионните инструменти на Excel. Ще надграждаме предишния пример за опит да прогнозираме продажбите през следващата година въз основа на промените в БВП. Следващата таблица изброява някои изкуствени точки от данни, но тези числа могат да бъдат лесно достъпни в реалния живот.

годинатърговскиБВП
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Само с поглед върху масата, можете да видите, че ще има положителна връзка между продажбите и БВП. И двамата са склонни да вървят заедно. Използвайки Excel, всичко, което трябва да направите, е да щракнете върху падащото меню Инструменти, изберете Анализ на данни и оттам изберете Регресия . Изскачащото поле се попълва лесно от там; диапазонът на входните данни Y е вашата колона „Продажби“, а диапазонът на входните данни X е колоната на промяната в БВП; изберете диапазона на изхода, за който искате данните да се показват в електронната ви таблица, и натиснете OK. Трябва да видите нещо подобно на това, което е дадено в таблицата по-долу:

Коефициенти за регресионна статистика

Множество R0.8292243откъсване34.58409

Площад R


0.687613БВП88.15552
Коригирана
Площад R


0.583484

-


-


Стандартна грешка51.021807-

-


Наблюдения5

-


-


Интерпретация

Основните резултати, от които трябва да се притеснявате за обикновената линейна регресия, са R-квадрат, прекъсвач (константа) и бета (b) коефициентът на БВП. Броят на R-квадрат в този пример е 68, 7% - това показва колко добре моделът ни прогнозира или прогнозира бъдещите продажби, което предполага, че обяснителните променливи в модела са предвидили 68, 7% от вариацията в зависимата променлива. На следващо място, имаме прихващане от 34, 58, което ни казва, че ако прогнозата за промяна в БВП е нулева, продажбите ни биха били около 35 единици. И накрая, бета или коефициентът на корелация на БВП от 88.15 ни казва, че ако БВП се увеличи с 1%, продажбите вероятно ще се увеличат с около 88 единици.

Долния ред

И така, как бихте използвали този прост модел във вашия бизнес ">

Разбира се, това е просто обикновена регресия и има модели, които можете да изградите, които използват няколко независими променливи, наречени множество линейни регресии. Но множеството линейни регресии са по-сложни и имат няколко въпроса, които биха се нуждали от друга статия за обсъждане.

Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.
Препоръчано
Оставете Коментар