量化投资实战(三)之配对交易策略--协整模型法

点赞、关注,养成良好习惯
Life is short, U need Python
量化投资实战系列,不断更新中


1. 初识配对交易策略

配对交易(Pairing Trading)是指八十年代中期华尔街著名投行Morgan Stanley的数量交易员Nunzio Tartaglia成立的一个数量分析团队提出的一种市场中性投资策略,其成员主要是物理学家、数学家、以及计算机学家。

Ganapathy Vidyamurthy[1]在《Pairs Trading: Quantitative Methods and Analysis》一书中定义配对交易为两种类型:一是基于统计套利的配对交易,二是基于风险套利(并购套利)的配对交易。

基于风险套利的配对交易策略是一种相当复杂的交易策略,它包括两种基本类型:债务重组和收购兼并。在换股并购中,风险套利者通常做多被收购公司的股票,同时做空收购公司的股票;在现金并购中,风险套利者寻求收购价格与目标公司价格之间的差异。

基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差偏离历史均值时,则做空股价较高的股票同时买进股价较低的股票,等待他们回归到长期均衡关系,由此赚取两股票价格收敛的报酬。

2. 配对交易的思想

配对交易 的思想最早起源于20世纪20年代,华尔街交易员 Jesse Lauriston Livermore 在投资实战中采用的姐妹对(Sister Stocks)交易策略。他发现两只同行业内业务相似的股票,其价格波动趋势有某种规律,即两者的价差会构成一种均衡关系。若在两只股票价格偏离较大时建仓,价差回复时平仓,便会赚取价差由发散至收敛带来的收益。

随着数理金融学和计算机技术的不断发展,到了20世纪80年代,配对交易策略在华尔街得到巨大关注。1985年,华尔街投资银行摩根士丹利(Morgan Stanley)的天体物理学家 努齐奥·塔塔里亚(Nunzio Tartaglia)组建了一个由著名物理学家、计算机学家和数学家构成的数量化分析团队,该团队以数学模型计算股票买卖组合,并开发计算机自动交易程序,在当时华尔街投资实战中大获成功。该程序运用的买卖组合策略即是配对交易策略,与传统的主观技术分析不同,摩根士丹利的交易程序对于股票对的选择、交易参数的设定与交易规则的制定,都采取量化分析的手段并由计算机程序自动完成,自此以后,这种量化投资策略逐渐广为人知并流传开来。时至今日,配对交易己经衍生出众多模型和交易规则,并为各种避险基金和股票投资者使用。

有关配对交易的学术研究也不胜枚举。Gatev,Goetzmann 和Rouwenhorst[2](1999)采用最小距离法寻找历史价格最近的20组股票对,计算其标准化股票价格差序列,进场交易策略是标准价差超过2倍标准差,运用买低卖高的策略,年化收益率可达11%以上;Vidyamurthy[1](2004)把协整理论运用到配对交易的股票对选择中,并将平稳性作为配对好坏的判别准侧,从股票基本面或历史资料挑选出潜在具有协整关系之配对股票;崔方达和吴亮[3](2011)以上证50指数成分股为样本,运用最小距离法进行配对交易,最终得出配对交易与市场风险无关并可获利。

3. 配对交易的步骤

配对交易策略 的时期分为 形成期(Formation Period)和 交易期(Trading Period)。在形成期挑选历史走势存在规律的股票对,并制定交易策略;在交易期模拟开仓平仓交易,而后计算收益。在整个配对交易策略过程中,具体需要考虑如下问题:

(1)如何挑选进行配对的股票?

(2)挑选好股票对以后,如何制定交易策略?开仓点如何设置?

(3)开仓时,两只股票如何进行多空仓配比?

3.1 协整模型法

协整方法(Cointegration method)是由 Granger(1987)提出的,已成为了分析非平稳经济变量之间数量关系的最主要工具之一。
金融资产的 对数价格 一般可以视为 一阶单整序列

P t X P_t^X PtX 表示 X X X 股票在第 t t t 日的价格,如果 X X X 股票的对数价格 { l o g ( P t X ) } ( t = 1 , 2 , ⋯ , T ) \{log(P_t^X)\}(t=1,2,\cdots,T) {log(PtX)}(t=1,2,,T) 是非平稳时间序列,且
{ l o g ( P t X ) − l o g ( P t − 1 X ) } ( t = 1 , 2 , ⋯ , T ) \{log(P_t^X) - log(P_{t-1}^X)\}(t=1,2,\cdots,T) {log(PtX)log(Pt1X)}(t=1,2,,T)
是平稳的,则称 X X X 股票的对数价格 { l o g ( P t X ) } ( t = 1 , 2 , ⋯ , T ) \{log(P_t^X)\}(t=1,2,\cdots,T) {log(PtX)}(t=1,2,,T)一阶单整序列

股票 X X X 的对数价格的差分序列可表达如下:
log ⁡ ( P t X ) − log ⁡ ( P t − 1 X ) = log ⁡ ( P t X P t − 1 X ) = log ⁡ ( 1 + r t X ) ≈ r t X \log \left(\boldsymbol{P}_{t}^{X}\right)-\log \left(\boldsymbol{P}_{t-1}^{X}\right)=\log \left(\frac{\boldsymbol{P}_{t}^{X}}{\boldsymbol{P}_{t-1}^{X}}\right)=\log \left(1+\boldsymbol{r}_{t}^{X}\right) \approx \boldsymbol{r}_{t}^{X} log(PtX)log(Pt1X)=log(Pt1XPtX)=log(1+rtX)rtX
X X X 股票的简单单期收益率序列 { r t X } \{r_t^X\} {rtX} 是平稳的。

3.2 配对交易策略的制定(协整模型法)

判断两只股票的历史价格是否具有协整关系?即检验两只股票的对数价格序列是否是一阶单整序列,或者检验两只股票的收益率序列是否是平稳时间序列。
首先,以 中国银行浦发银行 的对数价格序列为例进行 一阶单整检验。其中,arch 包的 ADF() 函数可以通过单位根方法对序列的平稳性进行检验。

ADF 单位根检验的原假设是“序列存在单位根”

  • 如果接受原假设(即 P_value 值大于显著水平系数),则被检验的序列存在单位根,即序列是 非平稳的
  • 如果拒绝原假设(即 P_value 值小于显著水平系数),则被检验的序列不存在单位根,即序列是 平稳的

接着,以中国银行和浦发银行的对数价格序列为例进行 协整检验

假设 { l o g ( P t X ) } , t = 1 , 2 , … , T \{log(P_t^X)\},t=1,2,\dots,T {log(PtX)},t=1,2,,T { l o g ( P t Y ) } , t = 1 , 2 , … , T \{log(P_t^Y)\},t=1,2,\dots,T {log(PtY)},t=1,2,,T 分别表示 X X X 股票和 Y Y Y 股票的对数价格序列,则 Engle 和 Granger 两步法可以对时间序列和协整关系进行检验。

{ l o g ( P t X ) } \{log(P_t^X)\} {log(PtX)} { l o g ( P t Y ) } \{log(P_t^Y)\} {log(PtY)}都是一阶单整的前提下,用最小二乘法构造回归方程:
l o g ( P t Y ) = α + β l o g ( P t X ) + ϵ t log(P_t^Y) = \alpha + \beta log(P_t^X) + \epsilon_t log(PtY)=α+βlog(PtX)+ϵt
得到回归系数 α ^ \hat{\alpha} α^ β ^ \hat{\beta} β^,构造残差估计值:
ϵ ^ t = l o g ( P t Y ) − ( α ^ + β ^ l o g ( P t X ) ) \hat{\epsilon}_t = log(P_t^Y) - (\hat{\alpha} +\hat{\beta} log(P_t^X)) ϵ^t=log(PtY)(α^+β^log(PtX))
并检验 { ϵ t ^ } \{\hat{\epsilon_t}\} {ϵt^} 序列的平稳性。如果 { ϵ t ^ } \{\hat{\epsilon_t}\} {ϵt^} 序列是平稳的,则说明 { l o g ( P t X ) } \{log(P_t^X)\} {log(PtX)} { l o g ( P t Y ) } \{log(P_t^Y)\} {log(PtY)} 具有协整关系。

最后,运用 协整理论协整模型 挑选出满足 价格序列 具有 协整关系股票对 进行配对交易。

4. 协整模型法之Python实战

4.1 读取数据

# 安装arch包(当然也可以在prompt下安装)
!pip install arch
# 导入包
import pandas as pd
import numpy as npimport matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']        # 字体设置
plt.rcParams['axes.unicode_minus']=False           # 负号显示问题from arch.unitroot import ADF                     # 协整关系检验
import statsmodels.api as sm
# 读取数据
sh = pd.read_csv('sh50.csv',index_col='Trddt')
sh.index = pd.to_datetime(sh.index)
sh.head()

在这里插入图片描述

4.2 协整检验

  • 形成期
# 提取数据
P_zhonghang = sh['601988']   # 中国银行
P_pufa = sh['600000']       # 浦发银行# 设置形成期
formStart = '2014-01-01'
formEnd = '2015-01-01'P_zhonghang_f = P_zhonghang[formStart:formEnd]
P_pufa_f = P_pufa[formStart:formEnd]
# 形成期:协整关系检验
# 中国银行(A)一阶单整检验
log_P_zhonghang_f = np.log(P_zhonghang_f)
adf_zhonghang = ADF(log_P_zhonghang_f)
print(adf_zhonghang.summary().as_text())

在这里插入图片描述

结论:原序列没有通过协整检验!(下一步,差分)

# 形成期:差分后的协整检验
adf_zhonghang_diff = ADF(log_P_zhonghang_f.diff()[1:])
print(adf_zhonghang_diff.summary().as_text())

在这里插入图片描述

结论:差分序列通过协整检验!

# 形成期:对数序列可视化
log_P_zhonghang_f.plot()
plt.title('图1 中国银行对数收益率序列趋势(形成期)')
plt.show()

在这里插入图片描述

# 形成期:差分对数序列可视化
log_P_zhonghang_f.diff()[1:].plot()
plt.title('图2 中国银行差分对数收益率序列趋势(形成期)')
plt.show()

在这里插入图片描述

# 同理对浦发银行进行协整检验,详细代码见资源包!

4.3 模型搭建

  • 形成期:股票对的回归方程(协整模型)
代码详见资源包!
  • 形成期:残差单位根检验(残差序列为价格差序列)
代码详见资源包!
  • 构造Pair Trading类(封装协整检验)
代码详见资源包!
# 绘制价差序列图(形成期)
plt.figure(figsize=(10,6))
CoSpreadForm.plot()
plt.title('图5 价差序列(协整配对)(形成期)',loc='center', fontsize=16)
plt.axhline(y=mu,color='black')
plt.axhline(y=mu+0.2*sd,color='blue',ls='-',lw=2)
plt.axhline(y=mu-0.2*sd,color='blue',ls='-',lw=2)
plt.axhline(y=mu+1.5*sd,color='green',ls='--',lw=2.5)
plt.axhline(y=mu-1.5*sd,color='green',ls='--',lw=2.5)
plt.axhline(y=mu+2.5*sd,color='red',ls='-.',lw=3) 
plt.axhline(y=mu-2.5*sd,color='red',ls='-.',lw=3) 
plt.show()

在这里插入图片描述

4.4 模型回测

  • 交易期:回测检验
代码详见资源包!

在这里插入图片描述

代码详见资源包!

在这里插入图片描述

4.5 策略封装

代码详见资源包!

5. 结论

  • 观察交易仓位曲线图,可以看出自2015年1月1日到2015年6月底期间,配对交易信号触发不多(计4次)。

  • 观察现金曲线图,由于开仓可能需要现金,现金曲线有升有降,而第三次平仓之后获利很多,现金曲线大幅上涨,到6月底,现金部位达到了5992.514元。

  • 再观察资产曲线图,配对资产整体呈现上升趋势,资产由2000元转变成5992.514元。

  • 整体而言,对中国银行和浦发银行两只股票进行配对交易的策略绩效表现不错。

6. 参考资料

  • 蔡立耑. 量化投资以Python为工具[M]. 北京:电子工业出版社,2017.
  • PyQuant. 量化投资基础[M]. 北京:科学出版社,2024.

7. 资源包下载

  • 链接:https://pan.baidu.com/s/1-tHqJCTOQx7wMLe509YpfQ
  • 提取码:1234

  • 写作不易,切勿白剽
  • 点赞关注,最大鼓励
  • 持续更新,未完待续…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/521891.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot+xjar加密打包部署教程

需求背景 为了跟上时代的步伐,为了更好的生存。开个玩笑,就是心血来潮,使用xjar加密部署jar包,于是就测试一下。 xjar教程 1-maven配置文件修改 首先找到自己ideal配置的maven文件夹,然后找到apache-maven-3.9.3\co…

微信小程序可拖拽视频播放案例

微信小程序可拖拽视频播放案例 如图所示 使用原生小程序组件 movable-area movable-view 注意movable-view必须在area内 官方组件地址 wxml <movable-area class"movableArea"><movable-view class"movableView" out-of-bounds"false&q…

SRS服务器ffmpeg 推流rtmp超时中断

ffmpeg错误显示 failed to update header with correct duration failed to update header with correct filesize. Error writing trailer of rtmp://----- broken pipe SRS日志错误显示 serve error code2056 kickoffforidle : service cycle : rtmp stream service: timeou…

YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

paper: https://arxiv.org/abs/2402.13616 code YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information 一、引言部分二、问题分析2.1 信息瓶颈原理2.2 可逆函数 三、本文方法3.1 可编程梯度信息 四、实验4.1消融实验部分 今天的深度学习方法关注的…

Python之Web开发中级教程----搭建Git环境

Python之Web开发中级教程----搭建Git环境一 Git 是目前世界上最先进的分布式版本控制系统 作用&#xff1a;代码管理。方便多人协同开发&#xff1b;方便版本控制。 安装git 单人本地仓库 建立本地仓库目录 配置个人管理信息 git config –global user.email 32356105163.com…

电子商务平台中商品数据采集|API数据接口采集商品的高效性体现

电子商务平台由一个个产品所构成,通过对产品的分析可以有效发掘用户需求,优化店铺产品结构,提升客户粘性、客单价、销售利润等。 一、产品行业数据采集API接口 采集产品行业数据的核心目的是了解该产品的市场需求变化情况,常用到的数据采集指标包括产品搜索指数和产品交易指数两…

【Vue 3】

v-model 作用&#xff1a;给表单元素使用&#xff0c;双向数据绑定---->可以快速获取或设置表单元素内容 是value属性和input事件的合写 数据变化--->视图自动更新试图变化--->数据自动更新 语法&#xff1a;v-model"变量" 数据变&#xff0c;视图跟着变…

ELK介绍使用

文章目录 一、ELK介绍二、Elasticsearch1. ElasticSearch简介&#xff1a;2. Elasticsearch核心概念3. Elasticsearch安装4. Elasticsearch基本操作1. 字段类型介绍2. 索引3. 映射4. 文档 5. Elasticsearch 复杂查询 三、LogStash1. LogStash简介2. LogStash安装 四、kibana1. …

如何在Windows系统部署Jellyfin Server并实现公网访问内网影音文件

文章目录 1. 前言2. Jellyfin服务网站搭建2.1. Jellyfin下载和安装2.2. Jellyfin网页测试 3.本地网页发布3.1 cpolar的安装和注册3.2 Cpolar云端设置3.3 Cpolar本地设置 4.公网访问测试5. 结语 1. 前言 随着移动智能设备的普及&#xff0c;各种各样的使用需求也被开发出来&…

超算互联网统一存储平台技术研究

大家好&#xff0c;我是来自山东省计算中心&#xff08;国家超级计算济南中心&#xff09;的王春晓&#xff0c;我从2022年开始参与超算互联网的项目&#xff0c;主要负责算网统一存储平台的研发&#xff0c;在存储基座方面也做了很多调研&#xff0c;最后选择了Alluxio平台&am…

测试常用的Linux命令

前言 直接操作硬件 将把操作硬件的代码封装成系统调用&#xff0c;供程序员使用 虚拟机软件 可以模拟的具有完整硬件系统的功能 可以在虚拟机上安装不同的操作系统 Linux内核只有一个&#xff0c;发行版有很多种 内核来运行程序和管理像磁盘和打印机等硬件设备的核心程序 终端…

【物联网】stm32芯片结构组成,固件库、启动过程、时钟系统、GPIO、NVIC、DMA、UART以及看门狗电路的全面详解

一、stm32的介绍 1、概述 stm32: ST&#xff1a;指意法半导体 M&#xff1a;指定微处理器 32&#xff1a;表示计算机处理器位数 与ARM关系:采用ARM推出cortex-A&#xff0c;R,M三系中的M系列&#xff0c;其架构主要基于ARMv7-M实现 ARM分成三个系列&#xff1a; Cortex-A&…