Основен » алгоритмична търговия » Множествена линейна регресия - Определение на MLR

Множествена линейна регресия - Определение на MLR

Какво е множествена линейна регресия - MLR?

Множествената линейна регресия (MLR), известна също като множествена регресия, е статистическа техника, която използва няколко обяснителни променливи, за да прогнозира резултата от променливата на отговора. Целта на множествената линейна регресия (MLR) е да се моделира линейната връзка между обяснителните (независими) променливи и променливата (зависима) на отговор.

По същество множествената регресия е удължаването на обикновената регресия с най-малки квадрати (OLS), която включва повече от една обяснителна променлива.

Формулата за множествена линейна регресия е

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ, където i = n наблюдения: yi = зависима променливаxi = разширителни променливиβ0 = y-прихващане (постоянен срок) βp = коефициенти на наклона за всяка обяснителна променливаϵ = грешката на модела (известен също като остатъците) \ започнем {подравнен} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {където, за} i = n \ textbf {наблюдения:} \\ & y_i = \ текст {зависима променлива} \\ & x_i = \ текст {разширителни променливи} \\ & \ beta_0 = \ текст {y-intercept (константа термин)} \\ & \ beta_p = \ текст {коефициенти на наклон за всяка обяснителна променлива} \\ & \ epsilon = \ текст {терминът за грешка на модела (известен също като остатъците)} \\ \ край {подравнен} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ, където i = n наблюдения: yi = зависима променливаxi = разширителни променливиβ0 = y-прихващане (постоянен термин) βp = Коефициенти на наклона за всяка обяснителна променливаϵ = терминът за грешка на модела (известен също като остатъците)

Обясняване на множествена линейна регресия

Простата линейна регресия е функция, която позволява на анализатор или статистик да прави прогнози за една променлива въз основа на информацията, която е известна за друга променлива. Линейна регресия може да се използва само когато човек има две непрекъснати променливи - независима променлива и зависима променлива. Независимата променлива е параметърът, който се използва за изчисляване на зависимата променлива или резултата. Моделът на множествена регресия се простира до няколко обяснителни променливи.

Моделът на множествена регресия се основава на следните предположения:

Съществува линейна връзка между зависимите променливи и независимите променливи.
Независимите променливи не са твърде силно свързани помежду си.
y наблюденията се подбират независимо и на случаен принцип от популацията.
Остатъчните трябва да бъдат обикновено разпределени със средна стойност 0 и дисперсия σ.

Коефициентът на определяне (R-квадрат) е статистически показател, който се използва за измерване на размера на разликата в резултата, който може да се обясни с разликата в независимите променливи. R2 винаги се увеличава, тъй като към модела на MLR се добавят повече предиктори, въпреки че прогнозите може да не са свързани с променливата на резултата.

R2 сам по себе си не може да се използва за идентифициране на кои предиктори трябва да бъдат включени в даден модел и кои трябва да бъдат изключени. R2 може да бъде само между 0 и 1, където 0 означава, че резултатът не може да бъде предсказан от никоя от независимите променливи, а 1 показва, че резултатът може да бъде предвиден без грешка от независимите променливи.

Когато интерпретирате резултатите от множествена регресия, бета коефициентите са валидни, като всички останали променливи се поддържат постоянни ("всички останали равни"). Резултатът от множествена регресия може да бъде показан хоризонтално като уравнение или вертикално под формата на таблица.

Пример с използване на множествена линейна регресия

Например, анализатор може да иска да знае как движението на пазара влияе върху цената на Exxon Mobil (XOM). В този случай неговото линейно уравнение ще има стойността на индекса S&P 500 като независима променлива или предсказател и цената на XOM като зависима променлива.

В действителност има множество фактори, които предсказват резултата от дадено събитие. Движението на цените на Exxon Mobil, например, зависи от повече от просто представянето на цялостния пазар. Други прогнози като цената на петрола, лихвите и движението на цените на фючърсите на петрола могат да повлияят на цената на XOM и цените на акциите на други петролни компании. За да се разбере връзка, в която присъстват повече от две променливи, се използва множествена линейна регресия.

Множествена линейна регресия (MLR) се използва за определяне на математическа връзка между редица случайни променливи. С други думи, MLR изследва как множество независими променливи са свързани с една зависима променлива. След като всеки от независимите фактори е определен за прогнозиране на зависимата променлива, информацията за множеството променливи може да се използва за създаване на точна прогноза за нивото на ефекта, който те имат върху променливата на резултата. Моделът създава връзка под формата на права линия (линейна), която най-добре приближава всички отделни точки от данни.

Позовавайки се на уравнението MLR по-горе, в нашия пример:

y _i = зависима променлива: цена на XOM
x _i1 = лихвени проценти
x _i2 = цена на маслото
x _i3 = стойност на индекса S&P 500
x _i4 = цена на фючърсите на петрола
B ₀ = y-прихващане във време нула
B ₁ = коефициент на регресия, който измерва промяна на единица в зависимата променлива, когато x _{i1 се} променя - промяната в цената на XOM, когато лихвените нива се променят
B ₂ = стойност на коефициента, измерваща единичната промяна в зависимата променлива, когато x _{i2 се} променя - промяната в цената на XOM, когато цените на маслото се променят

Оценките с най-малко квадратчета, B ₀, B ₁, B ₂ … B _p, обикновено се изчисляват от статистически софтуер. В регресионния модел могат да бъдат включени много променливи, при които всяка независима променлива е диференцирана с число - 1, 2, 3, 4 ... p. Моделът на множествена регресия позволява на анализатора да прогнозира резултат въз основа на информация, предоставена на множество обяснителни променливи.

Все пак моделът не винаги е напълно точен, тъй като всяка точка от данни може да се различава леко от резултата, предвиден от модела. Остатъчната стойност, Е, която е разликата между действителния резултат и прогнозирания резултат, е включена в модела, за да се отчитат такива малки изменения.

Ако приемем, че управляваме нашия XOM модел за регресия на цените чрез софтуер за изчисляване на статистически данни, който връща тази продукция:

Анализатор би изтълкувал този резултат да означава, че ако другите променливи се поддържат постоянни, цената на XOM ще се увеличи със 7, 8%, ако цената на петрола на пазарите се увеличи с 1%. Моделът показва също, че цената на XOM ще намалее с 1, 5% след ръст на лихвите с 1%. R ² показва, че 86, 5% от колебанията в цената на акциите на Exxon Mobil могат да бъдат обяснени с промени в лихвения процент, цената на петрола, фючърсите на петрола и индекса S&P 500.

Ключови заведения

Множествената линейна регресия (MLR), известна също като множествена регресия, е статистическа техника, която използва няколко обяснителни променливи, за да прогнозира резултата от променливата на отговора.
Множествената регресия е разширение на линейна (OLS) регресия, която използва само една обяснителна променлива.
MLR се използва широко при иконометрия и финансови изводи.

Разликата между линейна и множествена регресия

Линейна (OLS) регресия сравнява отговора на зависима променлива при промяна на някаква обяснителна променлива. Рядко обаче зависима променлива се обяснява само с една променлива. В този случай анализаторът използва множествена регресия, която се опитва да обясни зависима променлива, използвайки повече от една независима променлива. Множеството регресии могат да бъдат линейни и нелинейни.

Множеството регресии се основават на предположението, че съществува линейна връзка между зависимите и независимите променливи. Той също така не предполага голяма корелация между независимите променливи.

Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.

Свързани условия

Какво измерва регресията Регресията е статистическо измерване, което се опитва да определи силата на връзката между една зависима променлива (обикновено се обозначава с Y) и поредица от други променливи променливи (известни като независими променливи). повече Какво е термин за грешка "> Терминът за грешка се дефинира като променлива в статистически модел, която се създава, когато моделът не представя напълно реалната връзка между независимите и зависимите променливи. методът на квадратите е статистическа техника за определяне на линията, която е най-подходяща за даден модел, определена чрез уравнение с определени параметри към наблюдаваните данни. повече Иконометрия: Какво означава и как се използва Иконометрия е прилагането на статистически и математически модели към икономически данни за целите на тестване на теории, хипотези и бъдещи тенденции. повече R-квадрат R-квадрат е статистическа мярка, която представлява пропорцията на дисперсията за зависима променлива, обяснена от независима променлива. повече Как работи коефициентът на определяне Коефициентът на определяне е мярка, използвана в статистическия анализ, за да се оцени доколко един модел обяснява и прогнозира бъдещи резултати rtner Връзки

← Репутационен риск

Най-добрите фондове за запазване на капитала →

Препоръчано

Оставете Коментар