用多因子选股的方法来预测世界杯比赛的输赢只是一种有趣的探讨。但无论如何,从现有情况来看,多因子模型对小组赛胜负原因的阐释符合逻辑,可操作性强。 本届世界杯可谓冷门迭爆:西班牙、英格兰、意大利、葡 ...
用多因子选股的方法来预测世界杯比赛的输赢只是一种有趣的探讨。但无论如何,从现有情况来看,多因子模型对小组赛胜负原因的阐释符合逻辑,可操作性强。
本届世界杯可谓冷门迭爆:西班牙、英格兰、意大利、葡萄牙等豪门相继出局,亚洲球队在本届世界杯上无一胜场,美洲球队则集体暴走,哥伦比亚、哥斯达黎加和老大哥巴西、阿根廷一起,以小组头名身份昂首挺进世界杯16强。
到底是什么因子在决定着这届世界杯?带着这个疑问,我们饶有兴趣地改进了多因子选股的方法,借此分析本届世界杯的主要风格特征,并对剩余场次赛果进行预测。
多因子选股模型,是将整个投资组合投影到各个因子,分别计算出“成长因子”暴露值、“价值因子”暴露值。我们按照因子来配置股票,该因子表现越好,则整个投资组合的收益越高。
对足球队来说,它的因子暴露就是球员身体素质属性的加权值。我们从FIFA足球游戏中导出了每个参赛球员的重要属性值,经过有效性检验,保留了年龄、耐力、力量、速度和技术五个维度的数据,再进行标准化处理后,就可以得到各球队的总体“属性因子”风格特征。
结果显示,在年龄因子上,加纳、尼日利亚、澳大利亚和德国拥有本届世界杯最年轻的阵容,希腊平均年龄28.2岁,可谓“最老国度”;在耐力因子上,英格兰、巴西得分最高,亚洲国家则普遍具有较低的耐力打分;在力量因子上,英格兰、比利时、意大利最被看好,日本则被认为是“最软球队”;在速度因子上,拥有斯图里奇、斯特林、张伯伦等快马的英格兰首当其冲,阿尔及利亚、厄瓜多尔打分最低;在技术因子上,西班牙遥遥领先世界各国,巴西、阿根廷及其他欧洲列强同样技艺过人。
除了球员属性因子,每个球队还有自己的“行业权重”。我们将所有国际俱乐部划分为意甲、英超、西甲、德甲、法甲和其他联赛六大类,球队的“行业占比”由其分属各个“行业”的球员数量累计得出。很明显,英格兰的“英超行业”比重最高,德国的“德甲行业”比重最高。其他欧洲列强,除荷兰、葡萄牙等少数同样拥有高水平联赛的国家以外,均有超过九成的球员效力于欧洲五大联赛。其中,西班牙、意大利、德国更是无一球员在五大联赛之外的其他联赛效力。巴西、阿根廷这两支南美霸主中,亦有将近七成的球员效力于欧洲五大联赛,足见欧洲五大联赛在世界足坛具有的绝对统治力。
然后,我们结合48场小组赛的比赛结果建立多因子回归模型。具体建模时,考虑到每场比赛的进球差相当于股票的月度收益,对阵双方的联赛属性差就像股票的行业因子,球员属性差好比股票的风格因子,我们最终确定根据多因子模型建立进球差与联赛属性差、球员属性差之间的回归方程。
分析结果显示,影响本届世界杯的最重要因素,是耐力。球队的体力越充沛,耐力越强,获胜的可能性也越大。当然,速度与技术对进球差也具有显著的正向影响。本届世界杯节奏快、进球多,是这几个因子的重要体现。年龄因子和力量因子则均不显著。
经过反复建模与测试,我们得以确定最终的多因子模型,该模型具有一定的解释效力和稳定性,可以被用来预测世界杯16强的比赛结果,最终的预测结果显示,1/8决赛中胜面较大的球队分别是巴西、哥伦比亚、荷兰、希腊、法国、德国、瑞士和美国。之所以预测阿根廷输瑞士、比利时负美国,更多还是因为后者耐力好的原因。
用多因子选股的方法来预测世界杯比赛的输赢只是一种有趣的探讨。毕竟,影响足球比赛结果的因素可能更多的是球队配合、球员临场发挥等无法量化的情景。从回归方程角度来看,样本数少,大数概率得不到体现,也会影响到比赛的预测结果。但无论如何,从现有情况来看,多因子模型对小组赛胜负原因的阐释符合逻辑,可操作性强。如果用于训练模型的比赛数量再多一些,可量化参数再广一些,比赛的预测准确率会有更大提高。
当然,用多因子模型选股则不同。股票市场的数据更多更全面,历史数据足够长,包括财务数据、分析师预期数据在内的可量化指标也更多,程序的解释力较强。而由于投资组合的分散化,我们也可以不必苛求每只个股都能预测准确,只要大概率的获胜即可。所以,使用多因子模型选股的效果会更好一些。