Indexed by:
Abstract:
随着经济体制的改革,国内经济取得了令人瞩目的发展。近20年来,证券市场从建立到不断完善,如今已成为国内资本市场的重要组成部分。截至2019年2月底,中国A股上市公司共计3591家,股票总市值约人民币57.23万亿元,规模位居全球前列。同时随着居民收入水平的提高,投资需求也随之多样化,证券市场成为投资者进行资产配置的主阵地之一,而在这样一个庞大的市场进行投资研究,使用传统的分析方法并不是一件容易的事情。
近几年信息技术发展迅猛,并在各个领域得到了广泛的应用。在金融领域,结合信息技术、数理统计学和经济金融学等多学科专业知识的量化投资成为国内投资研究的热点。量化投资的目标是利用数量化工具挖掘证券市场内部可能存在的运行规律,从而指导投资者的投资策略,量化投资具有客观、快速、准确、高效等优势。
本文采用机器学习中的随机森林回归算法进行多因子选股模型的训练。股票池为沪深300成份股,样本区间为2012年1月至2018年11月。因子的选择参考了Barra结构化风险模型,共10类67个,另外加入10个可选宏观因子。数据从Wind金融数据终端获取,使用R语言进行数据处理及模型训练。根据训练好的模型对股票下月收益率进行预测,选择预测收益率排名前10、20、30、40、50的股票构建投资组合与基准沪深300指数表现进行比较。
通过回测,加入宏观因子的模型比未加入该类因子的模型的拟合效果略胜一筹,但无宏观因子模型在投资组合收益上取得了更好的表现。选择预测排名前30的股票构建投资组合,2012年7月至2018年11月末,累积收益率达64.9%,忽略2018年市场行情整体下滑,截至2017年末,投资组合累积收益率达112.6%,远超基准的6%和53%。
通过该实证研究我们发现,随机森林回归算法构建的模型在中国A股市场具有一定的可行性,选取的投资组合从2012-2018年的累积收益超越了基准沪深300指数。
Keyword:
Reprint Author's Address:
Basic Info :
Degree: 经济学硕士
Mentor: 林金龙
Year: 2019
Language: Other
Affiliated Colleges: