基于高频数据的豆类期货套利实证研究

【摘要】豆类期货跨品种套利一直以来是期货市场研究的热点。文章利用大连商品交易所豆类期货合约 5 分钟高频数据,构建 VAR 模型,通过脉冲效应分析、方差分解分析等方法对我国豆类期货高频数据套利进行了实证性研究,发现我国豆类期货合约高频数据存在长期均衡关系,可以基于此进行套利,但相互之间的影响关系不同于现货市场一般的生产关系,豆油对豆粕、豆粕对大豆的影响关系最为明显,其他之间的关系影响甚微。
【关键词】套利 豆类期货 VAR 模型
一、引言
随着我国经济持续快速发展,我国大宗商品交易规模不断增长,这不仅推动我国国际贸易的发展,也促进了我国期货市场的繁荣。商品期货套利一直以来是期货市场研究的重点,近几年我国商品期货市场夜盘交易制度也在不断推进,商品期货套利更加频繁。商品期货 T+0 制度使得日内套利成为可能,如何利用高频数据套利成为今后发展的主流趋势,因此,本文拟选用我国大连商品交易所关联度最高、交易量最大的豆类期货,基于高频数据对我国商品期货市场进行套利实证研究,为投资者提供一种更加有效的全新投资方式,推动我国商品期货市场健康发展。
二、文献回顾
根据不同套利方法,商品期货套利可以分为同种交易品种不同交易场所跨市套利,同种交易品种不同日期合约跨期套利、不同商品期货之间跨品种套利。在跨市套利方面,张晓磊(2011)对中国和日本橡胶期货市场进行了对比,说明新时期我国橡胶期货市场对外依存度较高,可以进行跨市套利。关于跨期套利,景楠(2012)陈思竹(2016)等别对我国期货市场上铜、棉花合约进行了跨期套利研究,并提出了相应的跨期套利模型。在商品期货跨品种套利方面,国内理论研究相对较多,缺乏实证性分析。其中,结合大豆、豆油、豆粕三类合约套利研究居多,大豆与豆粕、豆油之间存在着「100% 大豆可以生产 18.5% 豆油以及 80% 豆粕」的天然生产关系,同时也存在着「100% 购进价格加上压榨收益等于 18.5% 豆油销售价格加上 80% 豆粕销售价格」的平衡关系,因此,三者之间存在着必然的大豆套利关系。国外关于大豆期货统计套利理论趋于成熟,并基于市场进行了相应的实证研究。Simon(1999)基于 10 年时间序列数据,通过研究既定套利期货头寸与其五日移动平均价格的偏差对大豆提油套利进行了分析,发现套利交易是有利可图的,大约 2/3 的交易是盈利的。国内关于这三类期货同步套利的实证研究相对较少,特别是关于高频数据的实证研究。丁秀玲等(2007)陈桂军(2015)都采用大连商品交易所日收盘价数据对我国豆类期货的动态关系及套利交易进行了研究,表明我国豆类期货价格主力合约之间存在长期均衡关系。殷晓梅等(2008)基于每分钟高频数据对棕榈油和豆油期货价格动态走势进行了分析,得出棕榈油和豆油期货价格之间存在长期均衡的关系。顾全等(2013)提出日收盘价不能准确详细反映价格波动的完整过程,基于每日结算价分析得出的套利机会必然造成套利交易开仓和平仓至少 1 天以上,因而必然面临长期单方持仓的敞口风险,引入日内高频数据进行分析研究,既能更加准确地侦察套利机会,又能有效减少长期持仓风险。郑基超(2014)根据大样本建立的价差套利模型,通过模型实证说明大豆提油套利因为有较强的均值回归机制有获利可能;而反向提油套利过程则因为均值回归过程太漫长而难以获利,通常会带来亏损。
综合学者的研究成果,我们可以看出以往的研究过于集中于日数据,忽视了日内高频数据价格变动包含的丰富信息。其次,过去的研究集中于白盘数据,忽视了夜盘数据套利的可能,但根据最近期货市场波动分析,可以看出,夜盘市场是期货波动增加的重灾区,存在一定的套利可能,因此在研究过程中加入了夜盘高频数据。另外,国内关于大豆、豆油、豆粕三者之间套利的研究相对较少,所以本文在研究前人的基础上,基于高频数据建立向量自回归模型(VAR)对中国豆类期货跨品种套利进行实证性分析。
三、数据及研究方法
(一)数据收集
这里采用大连商品交易所豆类期货高频数据。1 分钟、5 分钟、15 分钟、30 分钟等都是相对于日数据的高频数据,不同频率数据对套利结果会产生很大影响。本文结合以往文献数据选取,采用大连商品交易所豆类期货 5 分钟高频数据。大连商品交易所拥有大豆、豆油、豆粕全系列豆产品期货,1、5、9 月合约交易活跃,通常也是豆类产品的主力合约,因此本文选择 2017 年 4 月 5 号到 4 月 28 号 2017 年 9 月交割合约 5 分钟高频数据作为研究对象,共计 3543 个数据,其中包含晚上 21:00-23:30 的夜盘数据。
(二)研究方法
通过构建向量自回归模型(VAR)研究大豆、豆粕、豆油期货跨商品套利是否可行。VAR 模型是用所有当期变量对变量的若干滞后变量进行回归,估计联合内生变量的动态关系的一种计量经济模型。文章首先检验三种豆类期货合约的 5 分钟价格序列的平稳性,进而判断其连续价格序列的协整关系,如果存在协整关系则三者的价格存在长期均衡的关系,大豆、豆粕和豆油的价格之间不会出现大的偏差,这是套利成为可能的基础,反之,价格之间就可能出现无限制的偏离,在进行协整性检验时使用 Johansen(1988)提出的基于矩阵的秩和特征根的协整检验方法。最后,构建 VAR 模型,对模型进行脉冲效应分析和方差分解分析。文章中,用 DD、DP、DY 表示大豆、豆粕、豆油期货合约,实证分析计量软件采用 Eviews8.0。
四、模型构建及实证分析
(一)模型检验
1.ADF 检验。由于非平稳序列可能出现伪回归现象,建模前必须对时间序列进行平稳性检验,采用 Dickey-Fuller(1979,1981) 提出的 ADF 方法对 DD、DP、DY 进行单位根检验,根据各变量时序图确定有无漂移项和趋势项,滞后阶数基于 AIC 准则确定。根据 ADF 检验值和临界值相比较以及 P 值结果,可以看出,DD、DP、DY 时间序列的 ADF 值均大于显着水平 10% 的临界值,说明接受原假设,为非平稳序列。d(DD)、d(DP)、d(DY)序列为大豆、豆粕、豆油的一阶差分序列,其 ADF 值小于显着水平 1% 的临界值,均拒绝原假设,则为平稳序列。ADF 检验说明大豆、豆粕、豆油三个变量均具有一个单位根,为一阶单整序列,符合协整检验条件。
2.Johansen 协整检验。协整是对非平稳经济变量长期均衡关系的统计描述。在经济学意义上,若变量之间存在协整关系,则可以通过一个或几个经济变量的变化影响到另一些经济变量的变化,并且这些经济变量之间存在稳定的长期均衡关系。选用 Johansen-Juselius 协整检验法对变量之间的协整关系进行检验,最优滞后阶数为 VAR 模型确定的滞后阶数 3。可以看出,迹检验和最大特征根检验两种方法都得出在 95% 的置信水平下存在一个协整关系,P 值说明检验结果显着,则大豆、豆油、豆粕在样本期间存在长期的均衡关系,可以建立 VAR 模型,可以利用价格异常波动进行套利。
3.Granger 因果检验。Granger 因果关系检验是计量经济学中一种时间序列因果关系分析方法,反映了变量在时间上的一种「先于」关系。通过计算得出 Granger 因果关系检验的结果,可以看出在 95% 的置信水平下,豆粕和大豆、豆油和豆粕存在显着的单向 Granger 原因。大豆和豆油只有在 10% 的置信水平下,才存在单向的 Granger 原因。
(二)构建 VAR 模型
根据协整检验结果说明存在协整关系,则可以构建 VAR 模型。
1.VAR 模型构建。
一个 n 维 p 阶 VAR 模型的标准形式表示为
式(1)中,Xt 是所关注的变量矩阵,本文 VAR 模型包含 3 个变量:DD,DP,DY;Ai 为常数项矩阵,本文中,A0 是 3×1 常数矩阵,Ai 为 3×3 常数矩阵;p 为滞后阶数,ei 为残差项。
2.最优滞后阶数的确定。建立 VAR 模型,首先需要确定模型的滞后阶数,一般采用 AIC、SC、LR 等准则来判断,从中确定最优滞后阶数。表 4 反映了各准则滞后阶数检验结果,综合参考 LR、FPE、AIC、SC、HQ 等 5 个准则,确定该模型的最优滞后阶数为 3 时,得到的 VAR 模型效果最好。
3.VAR 模型平稳性检验。VAR 平稳性检验是对模型的稳定性进行检验,只有稳定的模型才能确保脉冲响应函数和方差分解结果的有效性。AR 根检验是利用向量的特征值来确定所估计 VAR 模型的稳定性,滞后期为 T 的有 k 个内生变量的 VAR 模型,特征根多项式有 Tk 个特征根。
(三)VAR 模型估计
根据最优滞后阶数为 3,对 DD、DP、DD 估计建立式(2)VAR 模型,从 VAR 模型估计结果来看,滞后 1 阶的影响最大,对于豆油、豆粕,主要集中在前两阶滞后项影响,大豆三阶滞后项都有一定的正向影响.
(四)脉冲响应函数分析
脉冲响应函数分析(IRF)是基于 VAR 模型的一种因果性分析方法,VAR 模型本身并不能直接观测到内生变量之间的关系,通过脉冲效应函数可以清晰地看到内生变量之间的结构关系。可以知道,豆粕、豆油对豆油初期有正冲击,且自身冲击力度最大,大豆对豆油是负影响,随后逐渐增大,变为正冲击,豆粕在滞后 2 期达到最大。豆油对豆粕的冲击效应大于豆粕对豆油的影响,豆油对豆粕也在滞后 2 期达到峰值,大豆依然对豆粕先产生负影响,然后逐渐增大,变为正影响,达到峰值后,趋于平缓。豆粕、豆油、大豆对大豆都是正的冲击,豆粕的力度要大于豆油的力度,但豆粕在滞后 2 期达到最大后开始下降,然后变为负影响,趋于平缓,而豆油在滞后 3 期达到峰,说明豆油对大豆的影响力度相比豆粕要有一定的滞后。综上可以看出,在豆类期货发生价格波动的 10~15 分钟套利机会最大。
(五)方差分解分析
方差分解分析是通过分析每一个结构冲击对内生变量变化的贡献度,进一步评级不同结构冲击的重要性,基于建立的向量自回归 VAR 模型,对豆油、豆粕、大豆进行了方差分解,可以看出,豆油的波动初期 99% 以上来自自身本身,豆粕、大豆对豆油期货的短期影响甚微,但长期看豆粕占到豆油波动的 40%,大豆影响很小。豆粕的波动主要有自身和豆油影响,大豆对豆粕波动贡献很少,豆油短期占 10% 左右,长期占 30% 左右。大豆的波动短期内 70% 由自身产生,长期豆粕和豆油对大豆的影响达到 50%,豆粕对大豆的影响大于对豆油的影响,这和脉冲响应分析结果一样。
五、结论与展望
本文采用豆类期货合约 5 分钟高频数据,构建 VAR 模型,通过脉冲响应函数和方差分解,对期货市场豆类期货跨商品套利进行了实证分析,可以看出我国基于高频数据的大连商品交易所豆类期货合约确实存在一定的均衡关系,但 VAR 模型表明短期内豆类期货价格的波动并不严格按照现货市场的生产关系进行。方差分解分析和脉冲响应分析都表明豆类期货之间的影响力度是不一样的。豆油对豆粕、大豆有影响,但对豆粕的影响力度大于大豆,所以当豆油价格波动时,买卖豆粕合约进行套利最优。豆粕对大豆的影响力度最大,占到大豆波动的 40% 左右,而豆粕对豆油短期内几乎无影响,因此当豆粕发生价格波动时,买卖大豆进行套利。大豆对豆油、豆粕的影响很小,所以期货市场盲目由于大豆期货合约价格上涨而买入豆油、豆粕合约是不可取的。因此,投资者可以基于高频的豆类期货套利建立豆油到豆粕、豆粕到大豆的传导套利关系。
鉴于前文的实证检验和分析的结论,针对商品期货高频数据套利,向期货投资者和市场建设者提出如下建议:
一是豆类期货高频数据套利仅仅存在豆油到豆粕、豆粕到大豆的显着套利关系,说明同类产品之间的套利具有局限性,例如大豆对豆油、豆粕价格影响非常小,这可能是由于豆油、豆粕在现货市场有一定的替代产品,像橄榄油、玉米等。因此,商品期货高频数据套利可以建立多品种的套利模型,覆盖替代品和整个生产关系,以完善商品期货套利策略。
二是从 VAR 分析结果可以看出,基于高频数据豆类期货套利的均衡关系是脱离现货市场生产关系的,这很大一部分原因由于我国期货市场建设不完善,短期内投机者过多,期货市场的套期保值功能没有完全发挥。因此,在期货市场的建设过程中,要提高期现之间的相关性,防止基差过大带来损失。
三是无风险套利是基于市场完全的内生性而存在的,但在日常的投资交易中,不乏外部因素对市场的冲击,因此,投资者除了考虑上述豆类期货之间的相关性外,还要注意其他因素对市场的冲击,根据自己的风险偏好建立合适的套利头寸,避免发生不利影响。
参考文献
[1]张晓磊.基于跨市套利基础的期货市场价格相关性分析——中国与日本橡胶期货价格比较研究[J].价格理论与实践,2011(2):67-68.
[2]景楠,王彤.商品期货市场跨期套利研究[J].统计与决策, 2012(11):171-174.
[3]陈思竹.我国棉花期货市场跨期套利研究[J].时代金融, 2016(23):206-207.
[4]陈桂军.我国农产品期货套利效率实证研究[J].价格理论与实践,2015(2):91-93.
[5]殷晓梅,孙涛,徐正栋.基于高频数据的棕榈油与豆油期货跨商品套利可行性研究[J].农村经济与科技,2008,19(8):84-86.
[6]顾全,雷星晖.商品期货跨品种套利研究文献综述[J].江西行政学院学报,2013,15(3):59-63.
[7]郑基超,刘晴,孙韦.跨商品期货价差套利——以大连商品交易所豆类产品为例[J].安徽商贸职业技术学院学报,2014,13(4):14-18.
[8]Yuan Z,Zhang Y.Analysis of the Revelation of Taiwan-Funded and the Development Ability of Innovation-Driven of Fujian[J].Business & Globalization, 2013,01:58-65.
作者简介:张威波(1994-),男,山西长治人,东北林业大学经济管理学院硕士研究生;胡艳英(1975-)女,黑龙江哈尔滨人,副教授,硕士生导师。
作者 张威波 胡艳英