Applying Machine Learning in Equity Trading: The Challenge of Beating a Self-constructed Quantitative Benchmark Strategy Using Artificial Intelligence

Christian S. Grønager & Karl J. V. Vestergaard

Student thesis: Master thesis

Abstract

I denne kandidatafhandling har vi konstrueret en simpel kvantitativ benchmark strategi, der er baseret på ni fundamentale nøgletal, som bekskriver en virksomheds værdi. Formålet med benchmark strategien er at købe underværdiansatte aktier og short-sælge overværdiansatte aktier. For at udvælge aktierne til porteføljen udregner vi en gennemsnitlig værdi-score på baggrund af de fundamentale nøgletal. For hver industrigruppe og for hver måned fra februar 1991 til januar 2019 udvælger vi på baggrund af den beregnede værdi-score ti procent af aktierne med den højeste værdi-score og de ti procent af aktierne med den laveste værdi-score i S&P 500 Indekset. De aktier med den højeste værdi-score bliver købt, mens de aktier med den laveste værdi-score bliver shortet. Alle investeringsstrategierne i denne afhandling er konstrueret til at være markeds- og dollarneutrale. Udfordringen ved denne afhandling er, om kunstig intelligens kan udnyttes til at konstruere en portefølje, som kan slå den førnævnte benchmark strategi. For at løse denne udfordring har vi udvalgt tre forskellige supervised machine learning-algoritmer. Disse er naïve Bayes klassifikation, support vector machines og random forest. Problemet bliver opstillet som et klassifikationsproblem, hvor vi klassificerer de 20% højeste merafkast som 1, de 20% laveste som -1 og resten som 0. Det ekstreme merafkast bruges til at træne machine learning-algoritmerne på baggrund af 50 fundamentale nøgletal. Dataet for machine learning-algoritmerne inddeles i tre dele: et trænings-, validerings- og et testdatasæt. I testperioden opnår naïve Bayes det højeste afkast, dog har support vector machines en lavere volatilitet og opnår dermed den højeste Sharpe ratio på 0.735. Random forest og benchmark strategien har et afkast på omkring nul. En stabilitetstest viser, at benchmark strategien og random forest opnår de højeste afkast tilbage i tid. I stabilitetstesten formår random forest at slå benchmark strategien i 12 ud af 21 perioder, hvorimod naïve Bayes og support vector machines kun formår at slå benchmark strategien i henholdsvis 5 og 6 perioder. Konklusionen på afhandlingen er, at benchmark strategien har vist konsekvent at skabe positivt afkast, dog opnår strategien højere afkast i fortiden sammenlignet med det seneste årti. Machine learning strategierne viser hver i sær forskellige resultater, der er dog ingen af dem, der konsekvent har formået at slå benchmark strategien over tid.

EducationsMSc in Mathematical Business Economics, (Graduate Programme) Final Thesis
LanguageEnglish
Publication date2019
Number of pages88