Основен » алгоритмична търговия » прекомерно нагаждане

прекомерно нагаждане

алгоритмична търговия : прекомерно нагаждане
Какво е Overfitting?

Overfitting е моделна грешка, която възниква, когато дадена функция е твърде плътно приляга към ограничен набор от данни. Преизпълняването на модела обикновено е под формата на създаване на твърде сложен модел за обяснение на идиосинкразии в изследваните данни.

В действителност често изследваните данни имат известна степен на грешка или случаен шум в нея. По този начин опитът да се направи моделът да се съобразява твърде тясно с леко неточни данни може да зарази модела със значителни грешки и да намали неговата прогнозна сила.

[Важно: Финансовите специалисти винаги трябва да са наясно с опасностите от преоборудване на модел, базиран на ограничени данни.]

Разбиране на Overfitting

Например, често срещан проблем е използването на компютърни алгоритми за търсене на обширни бази данни с исторически пазарни данни, за да се намерят модели. Като се има предвид достатъчно проучване, често е възможно да се разработят сложни теореми, които изглежда предсказват неща като възвръщаемост на фондовия пазар с голяма точност.

Въпреки това, когато се прилагат за данни извън извадката, такива теореми вероятно могат да се окажат просто превишаване на модел на това, което в действителност са били само случайни събития. Във всички случаи е важно да се тества модел на данни, които са извън извадката, използвана за неговото разработване.

Ключови заведения

  • Overfitting е моделна грешка, която възниква, когато дадена функция е твърде плътно приляга към ограничен набор от данни.
  • Финансовите специалисти винаги трябва да са наясно с опасностите от преоборудване на модел въз основа на ограничени данни.
Сравнете инвестиционни сметки Име на доставчика Описание Разкриване на рекламодатели × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация.

Свързани условия

Защо има значение за статистическата значимост Статистическата значимост се отнася до резултат, който няма вероятност да възникне на случаен принцип, а по-скоро може да се дължи на конкретна причина. повече Как работи Smoothing Data Изглаждането на данни се извършва с помощта на алгоритъм за премахване на шум от набор от данни. Това позволява да се откроят важни модели. Изглаждането на данни може да се използва за прогнозиране на тенденциите, като тези, които се намират в цените на ценните книжа. още проба Пробата е по-малка, управляема версия на по-голяма група. Пробите се използват при статистически тестове, когато размерите на популацията са твърде големи. повече Хетерокедастичност В статистиката хетерокедастичността се случва, когато стандартните отклонения на променлива, наблюдавани за определен период от време, са непостоянни. повече Четене на стратифицирана случайна извадка Стратифицираната случайна извадка е метод за вземане на проби, който включва разделянето на популация на по-малки групи, известни като слоеве. повече Как работят простите случайни проби Простата случайна извадка е подмножество от статистическа съвкупност, в която всеки член от подмножеството има еднаква вероятност да бъде избран. Под обикновена случайна извадка се разбира непредубедено представяне на група. повече партньорски връзки
Препоръчано
Оставете Коментар