Generating Alpha With Machines: Applying Artificial Intelligence to Stock-selection and Portfolio Optimization

Peter Nistrup Lind Larsen, Christoffer Fløe Jensen & Jeppe Andersen

Student thesis: Master thesis

Abstract

I statistik og machine learning kombinerer Ensemble metoder flere læringsalgoritmer, for at opn˚a bedre prædiktiv performance end hvad man kunne opnå ved individuelle medlemmer. Dette speciale undersøger den relative rentabilitet af en long-only investeringsstrategi, baseret på at kombinere en Ensemble af modeller, for at kunne prædiktere med høj konfidens og identificere aktier med høje forventede afkast. Strategien udnytter prædiktioner fra tre forskellige modeller: Extreme Gradient Boost, Long Short-Term Memory og en faktor-baseret momentum model. Modellerne er trænet på 94 forskellige fundamental data og pris-relaterede variable for omkring 4000 amerikanske aktier, som går tilbage til december 1997. Modellerne rangerer og inddeler aktier baseret på deres tilsvarende prædiktionskriterier, og porteføljer er konstrueret ved at kombinere fællesmængder og delmængder på disse grupperinger. Aktiverne i porteføljerne vægtes med udgangsunkt i Hierarchichal Risk Par-ity diversifikationsmetoden, med fokus på at optimere variansstrukturen. Modellerne er efterfølgende evalueret i CAPM rammer, med henblik på at kunne sammenligne og afgøre hvorvidt de producerer overskud relativt til populære faktor-porteføljer. Ud af de tre strategier lykkedes det XGBoost og momentum at overgå S&P 500-indekset markant med hensyn til merafkast, volatilitet og Sharpe. Derudover finder vi, at alle tre strategier klarer sig væsentligt bedre, når de er en del af en Ensemble strategi. Vores Ensemble formåede at overgå alle individuelle strategier med hensyn til Sharpe-ratio, inklusiv en replikerende portefølje bestående af de tre individuelle strategier, hvilket indikerer, at helheden er større end summen af dets dele. Vi fandt, at Ensemble strategien ikke kunne replikeres med populære faktorporteføljer. Endelig er et af de mest interessante resultater i denne afhandling, at LSTM ikke lykkedes at overgå markedet i sig selv, men alligevel indikerede vores analyse, at det bidrog væsentligt til udførelsen af 2/3-ensemblet. Vi mener, at dette fungerer som et godt eksempel på, hvordan ensemble-læring bruger unikke kompetencer i andre strategier til at forbedre ydeevnen.

EducationsMSc in Business Administration and Management Science, (Graduate Programme) Final Thesis
LanguageEnglish
Publication date2020
Number of pages143