首页 / 芷瀚动态 / 芷瀚观点

芷瀚动态

News

浅谈截面风格策略与资产配置

2023-11-21

一、截面与资产配置的含义 在金融市场中,资产配置通常指投资者通过投资不同类别的资产,以获得最佳投资组合的行为。它旨在提高投资组合的收益,同时降低风险。而截面策略,通常是指在某一时点,通过某一/某些判断标准,将资产进行强弱分类,再进行差异化配置。(例如:通过量价因子、基本面因子等,判断两组品种的相对强弱关系。投资人可选择做多一组强势的品种,同时做空另一组弱势品种,从而获取组合之下的收益之和为正。或者在仓位管理上多配前者,少配后者)。 因此,我们可以说,截面风格策略是进行资产配置的手段之一。它不再是单独地看待某一资产,而是在多个资产品种中进行选择,获取品种对冲后的收益。相比于单品种时序策略主要考虑在单一资产上的买卖交易行为,截面策略对于交易时点的选择并不那么敏感,也降低了在交易上择时的难度;但相应地,截面策略可能也舍弃了更高的交易精确度。 本文便是旨在探讨截面策略的理论基础和部分实现环节。 二、使用截面策略获利的理由与面临的风险 从获利原理上来讲,品种间相对强弱的延续性是截面策略想要获利的主要因素。 品种间强弱延续性所维持的时间周期决定了可能适于持仓的周期长短。在常用的截面策略中,交易者可能会选择固定的时间周期间隔来判断品种间的相对强弱,并进行调仓。例如量价上使用小时均价,全天均价,每周价格变动等,也包括品种基本面数据,如期货品种的基差、库存、利润等的变动,股票上常用的多因子数据等。 品种间强弱的不对称性有多大,则决定了获利的空间大小。在结构性行情持续发酵的市场中,(也即趋势明显分化,强者恒强,弱者恒弱),可能发生两组都获利的情形。而在市场受宏观性冲击影响,或走势趋于一致时,多空盈亏相抵,表现可能弱化。在无序混乱的行情中,来回调整,也可能出现两头皆负的情况。总体而言,截面策略天然会进行多品种的覆盖交易,品种的分散性持仓可以起到分散收益来源的作用,但也无法完全避免风险共现的情况。这是策略中需要额外考虑的因素。 品种间的相关性也是重要的考虑参数之一。相关性是一种数理上统计的结果,其产生的因果来源有很多,可能是基本面上产业的上下游关系,互为竞争性商品或互补商品,宏观性因素的冲击等,也可能是交易者情绪的助推,资金流动选择的结果。在使用截面策略时,可能会倾向于在强弱两组之间分别选取呈现出低相关性或负相关性的品种;而在同组之中,相关性也影响到仓位的配置,例如在期货截面多空策略中,如果同组内商品的相关性很高,品种的同向波动会加大策略收益的波动性,倘若要平滑可能发生的波动,则要减轻组内相关性高的品种的合计持仓。 图源:网络 三、市场风格变化与截面风格策略在股市、期市的差异 此外,市场风格和情绪会进行切换变化,并充满不确定性,这是交易者必然会面临的情形,那么截面风格策略如何合理应对呢?在某一个确定的时间维度上,如一周,一个月,一年,我们习惯将市场行情描述为上涨,下跌,震荡,行业内更常使用市场贝塔β的概念来形容这一整体情形。 在股市中,和截面风格类策略较类似的是市场中性策略。市场中性策略旨在通过对冲掉市场风险来实现稳定的绝对回报。 图源:网络 首先,我们需要考虑在策略设计上基于市场中性与非中性的差异。市场中性策略通常指的是在系统性风险(比如股票或期货普涨普跌、利率风险等)上无暴露或者具有较低暴露。一个简单的"市场中性"投资组合须包含两个部分,一部分为“多头”组合,另一部分为“空头”组合,且“多头”组合和“空头”组合具有一致或者相近的市值敞口或者贝塔敞口。也可细化到进一步的行业、风格因子权重上保持一致或接近。由于交易机制的限制,在国内的股票市场中性策略多采用股指期货作为空头配置。而市场非中性策略,则是对中性策略的偏离,即交易者可能会偏向于某一个方向上的交易,放大某个方向上的敞口。从这个角度上来讲,股票上的非中性策略,更多是代表了对大盘贝塔方向的押注,例如在牛市中的多头配比超过空头配比,以获取更高超额。 事实上,在股票市场中对大盘走势(贝塔)的关注度明显高于在期货市场中对商品指数的关注度。这是因为股票之间以估值为纽带,估值代表了市场的情绪、资金流动性等外部环境,并最终体现为整体价格走势。而大宗商品品种之间的基本面差异度较大,各个商品之间可能缺乏明显的关联度,且交易机制上多空都可交易,商品指数可能较难代表市场的整体行情方向。 因此,在期货市场中,基于基本面考虑的截面多空策略可能更关注板块或品种间的强弱差异,板块或品种间某个方向上的仓位超配更多是基于对板块或品种强弱程度的押注;而期货中基于量价的截面策略则客观上也会表现出这种板块间的超配差异。在实践中,期货市场中的截面策略更多是非中性的,即多空市值允许保持一定量的敞口交易。 总体而言,截面策略同样依赖于某种趋势的连续性,在市场强弱关系明显的时候往往表现更好,无序的市场波动状态和突然的反转也不是使用截面策略的好时期。 四、截面风格策略的延伸/普适程度 截面策略考虑的核心是配比多个资产之间的强弱关系,其广泛的延伸可以推演到全球宏观对冲,宏观上大类资产间的轮动可以提供策略资产多空配置的底层驱动力。 注:本文并未具体复现某一量化策略或指标,而是探讨一些简单的交易逻辑,厘清策略实现中需要考虑的现实因素。量化是一种手段,而底层的交易逻辑合理,则会加强我们对交易策略的信任感。

卷积神经网络与量化交易

2023-10-17

卷积神经网络与量化交易 在处理时间序列数据时,人们通常会使用LSTM模型,卷积神经网络CNN模型使用的较少,因为CNN主要被用于处理图像。但随着CNN在图像处理上被更广泛地使用和研究,或许将时间序列数据通过合理的方式以图像传入CNN来进行分析、预测也会有意想不到的效果。本文将简单介绍CNN的原理以及在量化交易中使用CNN的三个案例。 一.卷积神经网络 CNN 卷积神经网络(Convolutional Neural Network,CNN)是一种用于图像和语音识别、自然语言处理等任务的深度学习模型。与传统的全连接神经网络相比,卷积神经网络在处理图像等二维数据时具有更好的效果。 卷积神经网络的核心思想是利用卷积运算和池化操作对图像进行特征提取。具体来说,卷积神经网络通过多个卷积层和池化层级联组成,其中卷积层用于提取图像中的局部特征,而池化层则用于减小特征空间的大小,从而降低计算复杂度。 卷积层: 卷积运算可以理解为由原图和滤镜的相组合,提取出一个包含图像局部特征的特征图。假设有如下图所示的由0和1组成的5*5矩阵(原图)和3*3矩阵(滤镜): 将两个矩阵相乘,得到下图右侧的特征图。 实际效果: 池化层: 池化操作包括最大池化(Max Pooling)、平均池化(Average Pooling)与和池化(Sum Pooling),最大池化在每个池化区域内选择最大的特征值作为其输出,忽略其他特征值,通常用于提取输入数据中的最显著特征,例如物体的边缘和角点等。 平均池化在每个池化区域内计算特征值的平均值作为其输出,通常用于平滑输入数据,减少特征图中的噪声和冗余信息。和池化在每个池化区域内计算特征值的和作为其输出,与平均池化类似,但更少使用,通常用于对输入数据的特定情况进行建模。 在卷积和池化之后,将得到矩阵摊平成矢量传入全连接层,将特征映射到预测结果上。 由卷积层、池化层、全连接层组成的卷积层神经网络结构如下: 除了以上介绍的层外,卷积神经网络还可以包括其他类型的层,如批量归一化层、Dropout层等。批量归一化层用于加速训练过程和改善模型效果,Dropout层则用于防止过拟合。总体来说,卷积神经网络通过对图像进行卷积操作和池化操作实现对图像特征的提取和压缩,有效地降低了神经网络模型的复杂度,提升了模型的性能和鲁棒性,成为了当今图像识别领域最广泛应用的深度学习模型之一。 二.CNN在量化交易中的运用 案例一 使用CNN预测股票价格 O.B. Sezer与A.M.Ozbayoglu 将15个常用的技术分析指标(RSI, Williams %R, WMA, EMA, SMA, HMA, Triple EMA, CCI, CMO, MACD, PPO, ROC, CMFI, DMI, PSI)在DOW 30中的30支股票和常见的9支ETF从2002至2017的每日收盘价上应用,并将每15天的输出(1,0,-1 分别对应买入、持有、卖出),作为一个15*15的矩阵作为input放入CNN中,进行训练。 input生成的图像如下: CNN使用的两个卷积操作的公式如下(t代表time, I代表image, K代表kernel) 最后将CNN模型预测的买入、持有、卖出操作的值代入实际价格,将回测的年化利率与Buy & Hold(BaH)策略, RSI (14天,70-30)策略,SMA(50天)策略,LSTM,MLP回归策略回测的年化利率进行比较,结果如下: ETFs DOW 30中的股票 可见CNN对该实验中的大部分标的资产的预测能力相比其他常见的策略有显著的优势。 案例二 使用CNN分析LOB,并预测短期价格 在这项研究中,Tsantekidis使用的数据是limit order book上从买10到卖10的二十档的价格和成交量,用于测试的是10天5支股票共450万个LOB数据。再将数据进行z-score标准化后,将前中间价和下一个中间价进行平滑处理。 之后对所有数据按如下方式打标签,其中α是可以保证价格被判断为上涨或下跌的最小变动数。 进行以上数据处理之后,将n个100*40的矩阵作为input输入如下图的CNN模型(100指每个价格的预测用前100组数据,40是20档乘以2(价格、成交量)),以此预测mid price。 最终输出的结果的错误率(cost)、查准率(f1)和精确度(kappa)如下: 将CNN预测的结果与SVM和MLP模型进行比较: 我们发现CNN在绝大多数情况下的预测精准度明显高于SVM和MLP,不过此研究仅测试了5支股票10天的LOB数据,使用CNN的方法有一定参考性,但实际应用还需要更多的测试和比较。 案例三 使用CNN与LSTM构建一个GAN来预测股票价格 生成对抗网络(generativeadversarialnetwork, GAN)由一个生成器(generator)和判别器(discriminator)组成,其中生成器用来生成与真实样本相似的合成数据,判别器用来评估给定数据是否是真实数据还是生成的数据。GAN的训练过程是通过Generator和Discriminator之间的博弈来实现的。Generator试图生成更逼真的合成数据以欺骗Discriminator,而Discriminator则努力区分真实数据和合成数据。这个过程是一个动态的竞争和学习过程,最终目标是找到一个平衡点,使得生成器能够生成高质量的合成数据,并且判别器无法准确区分真实数据和合成数据。Staffini的深度卷积生成对抗网络(Deep Convolutional Generative AdversarialNetwork (DCGAN))使用CNN和LSTM构建了生成器,使用两个CNN构建了判别器,并使用这套模型在意大利的FTSE MIB指数中的10支股票从2005年至2021年的收盘价、开盘价、最高最低价、和成交量和一系列技术指标的结果(和案例一相似)上进行训练,并预测的收盘价。使用DCGAN可以模拟一个交易员的成长历程,从做出不切实际的股价预测(最初的生成器),通过自我矫正以及常年累月学习正确的研究方法(判别器的判别过程),最终成为一个高胜率的交易员(最终的生成器)。 最终将模型预测的结果与差分自回归移动平均模型(ARIMAX)、随机森林、LSTM、常规GAN的预测结果进行比较,结果如下: 可见DCGAN的预测效果更好,错误率明显更低。 从以上三个使用不同方法和数据运用CNN来预测股票价格的案例中我们可以看出,CNN在量化交易的实际运用中有一定的意义和效果,不过仍需要更多的检验。案例一和三中的数据输入均使用了一系列技术指标的结果,最终的预测结果还需要和使用同样指标的多因子模型进行相关性检测;案例二使用了LOB数据作为输入,但由于LOB数据过于庞大,只能使用5支股票10天的数据进行检测,选择的样本可能不具有普适性;案例三虽然选择的时间长度很长,但标的资产都是意大利的股票,该模型对国际主流的标的资产的预测能力还需要进行进一步的测试。 参考文献: Sezer O.B., Ozbayoglu A.M., 2018, Algorithmic financial trading with deep convolutional neuralnetworks: Time series to image conversion approach Tsantekidis, A., Passalis, N., Tefas, A., Kanniainen, J., Gabbouj, M., and Iosifidis, A.,2017, “Forecasting stock prices from the limit order book using convolutionalneural networks,” in 19th IEEE Conference on Business Informatics, Vol. 1 (Thessaloniki), 7–12. Staffini Alessio, 2022, Stock Price Forecasting by a Deep Convolutional Generative Adversarial Network, Front. Artif. Intell. Prabhu, 2018, ‘Understanding of Convolutional Neural Network (CNN) — Deep Learning,’ https://medium.com/@RaghavPrabhu/understanding-of-convolutional-neural-network-cnn-deep-learning-99760835f148

马尔科夫决策过程与做市策略

2023-09-19

低延迟均线LLT模型与交易择时

2023-08-21

投资如果能够准确把握市场的走势,那将是最为简单有效的。但是我们常常会面临:平滑性越好,也就是局部的波动性影响会变小,但是同时会产生很高的延迟。而LLT模型则很好的平衡了这个问题,在能够很好的把握市场整体变化的同时,并且能够凸显出转折点,降低延迟性。 一、传统均线 1. MA均线(传统移动平均线) (1)计算公式 (2)特点:MA均线采用前面n日价格的算数平均值,其中很好的刻画的价格趋势,但是n值越大,延迟性越高。 (3)近一年上证指数的变化以及MA均线示意图 2. EMA均线 (1)EMA均线是在MA均线的基础上面改进而来,通过对靠近计算日的价格赋予更高的权重,利用了趋势的连续性。 (2)计算公式 其中EMA(T)和EMA(T-1)分别代表EMA均线T和T-1日的价格。@表示0-1的参数 二、LLT模型简介 1. 模型理解: (1)EMA均线指标的计算,正是信号处理当中的一阶线性滤波处理器。而LLT模型是二阶低通滤波器。其延迟反应相比于EMA均线的有了很大的改进。 (2)数学原理:LLT模型采用Z变换。本质是离散时间的laplace变换。 其中z表示复频域,f(k)表示时域信号。 定义传输函数 传输函数定义为:输出信号z变换和输入信号z变换的比值。看作输出和输入强度的比值。得到EMA均线的传输函数: 传输函数是是指零初始条件下线性系统响应(即输出)量的拉普拉斯变换(或z变换)与激励(即输入)量的拉普拉斯变换之比。传输函数代表了输入和输出之间的联系,不受输入输出值的影响,可以用它来分析系统的动态特性等相关性质。 2. LLT模型的设计: LLT是一个二阶的滤波器,广发证券此研报作者做了四步转化将EMA一阶滤波器转化为LLT二阶滤波器: (1)为了使构造的高通滤波器,即不存在高频分量输出的1−H(z),首先修改EMA公式为: 将公式转换至频域以便于进行滤波,那么修改后的EMA滤波器变为 (2)构建一阶高通滤波器,其结构为 (3)完成二阶滤波函数的构建 2阶高通滤波器为: (4)得到了二阶高通滤波函数: (5)最后再经过Laplace逆变换得到LLT的公式为 (6)模型解释: 应该在LLT值大于LLT的上一值时大趋势来临,买入股票:当LLT值小于LLT前值时大趋势变为下降,卖出股票。 三、模型回测以及总结 在2005年-2023年对此策略进行回测,年化收益能够做到10%以上。发现部分细节上和大盘波动趋势相近。在控制回撤这方面能够前期做到相对比较好,尤其是在风险来临的时候。但是在2020年之后,模型收益较差。所以综上认为LLT模型可以作为风控模型,来控制回撤,辅助于其他模型。 资料来源: 1.广发证券:罗军、俞文冰、叶涛、安宁宁《低延迟趋势线与交易性择时——短线择时策略研究之三》 2. https://zhuanlan.zhihu.com/p/34097449

冲击成本

2023-07-19

一、冲击成本 冲击成本全称价格冲击成本。国际上通常用它来来衡量股市的流动性。它也可称为流动性成本,是指一定数量的委托(订单)迅速成交时对价格的影响,因此是一个包含即时性和合理价格两方面要素的指标。冲击成本被认为是大型机构无法摆脱的致命伤害。 通常而言,交易成本可以分为两部分,一部分是直接成本,这部分可以很方便的计算,包括国家对交易征收的税,交易的手续费和券商的佣金等。这部分通常难以避免,一般不会对这部分的内容进行优化。另一部分则是交易的间接成本,这部分没有明确的规定,产生于交易的过程当中,包括交易的冲击成本,交易时间延长产生的交易价格变动机会成本以及交易未执行的机会成本等。正常而言,一个好的交易策略应当在交易的冲击成本和交易的机会成本进行平衡。如图一为成交概率按照U型分布时,市场冲击成本和机会成本的关系。 图 1交易成本和冲击成本的关系 可以看出,只有当交易的机会成本和市场冲击成本完成平衡时才能实现总的交易成本的降低。本文主要考虑对市场的冲击成本的研究,不考虑交易的机会成本对总成本的影响。 二、冲击成本的影响因素 冲击成本的大小第一个影响因素是下单的手数。一般而言,下单的手数越大,冲击成本的就越大。所以当有一个大额的订单时,通常机构会选择将大额的订单拆分成不同大小的小订单在不同的时间进行交易,用于降低交易的冲击成本。但是不同的拆单的算法降低冲击成本的程度有所不同,本文将对部分拆单算法进行简单的介绍。 冲击成本的第二个影响因素是流动性的大小。市场的流动性越小,冲击成本越大。股票市场上每天的成交金额有几百亿元,看上去规模不小,流动性也可以。但那是上干只股票共同交易的结果,如果细分到不同的个股,不难发现其中一些股票的流动性还是很差的。相对而言,买卖股指期货的冲击成本就非常小,这是因为相应的股指期货合约只有几个,交易集中导致流动性非常强。这也是为什么通常在进行期货交易时,大多数人会选择主力合约,因为主力合约流动性较好,合约容易交易,同时下单时的冲击成本要更小。 冲击成本的第三个影响因素是市场波动性的大小。市场的波动性越大,所造成的冲击成本越大。可以考虑一个波动率很小的市场,当你将一个较大的订单下入这个市场时,由于市场的波动较小,所以不同的时间下入的订单价格的差异较小,因此冲击成本较小。而当市场的波动率较大时,不同的时间下入的订单价格的差异可能十分的巨大,这样冲击成本就较大了。 三、VWAP算法 VWAP(成交量加权平均价格)是指拆分大额委托单在约定时间段内分批执行,使得最终买入或卖出成交均价尽量接近该段时间内整个市场成交均价的算法交易策略。 图 2 VWAP计算方式 VWAP算法考虑了历史成交量,未来的成交量预测、市场动态总成交量和拆单的时间段(就是总共要将总单 拆分成多少单分别以怎样的时间频率交易)三个因子。Vwap算法是一种被动跟踪市场均价,市场占有率最高且十分隐蔽的算法交易策略。但是VWAP非常容易受到市场价格波动的影响。虽然VWAP处于市场价格波动的中心位置,但是这也意味着VWAP的价格可能会受到市场的波动影响。如果市场出现异常波动,交易者可能会买入或卖出超过他们预期的价格。而在开盘时,市场的波动通常较大,所以Vwap算法在开盘时和市场波动较大时很有可能失效。 针对VWAP算法在开盘和市场波动较大可能失效的问题,其实我们可以设置参数用于提升VWAP算法在开盘和收盘时的敏感程度,同时按照预测或历史日内成交量分布占比进行成交。通过这种方式,我们可以降低交易成本,通过最佳交易执行路径, 有效降低交易冲击成本。 Vwap算法除了可以用于拆单降低冲击成本,同时还可以作为交易者的技术指标、经纪商或交易所提供的订单选项以及基准。 四、TWAP算法 TWAP 全称是 time-weighted average price(时间加权平均价格)。它是一种定价算法,用于计算特定时期内资产的平均价格。TWAP 的计算方法是将一段时期内多个点的价格相加,然后将该相加之和除以价格点总数。 图 3TWAP算法计算公式 例如,假设我们想要使用 15 秒的价格点间隔计算一分钟内资产的 TWAP。如果价格在 0 秒时为 100 美元,在 15 秒时为 102 美元,在 30 秒时为 101 美元,在 45 秒时为 98 美元,在 60 秒时为 103 美元,那么为了计算 TWAP,我们将对所有价格点(100、102、101、99、 103) 然后将它们除以时间点数 (5)。在这个例子中,TWAP 是 101 美元。 TWAP 算法依赖于历史价格数据,使其成为固有的滞后指标。这种滞后可能导致资产 TWAP 的价格在高度波动期间与市场价格会不同步,并可能被攻击者利用。虽然 TWAP 计算可以通过使用更短时间跨度的价格点来减少这种滞后,但这将使资本市场的攻击者参与操纵的成本降低。 五、冰山算法 冰山算法的原理是探测出某机构有大额挂单到来时,吃掉较低价格挂单,迫使机构大额挂单向上移动,再以较高价格卖出持有仓位。这个算法的优势在于,它可以在不影响市场价格的情况下,获取到更好的交易价格。 冰山算法的执行步骤较为简单,而且并没有时间步长的概念。冰山算法主要根据快照和连续委托时间决定是否需要触发下单。每次下单若没有超过目标价格,则以对手盘一价下单,否则以目标价格下单。若一个快照时间内委托没有全部成交,则需要进行撤单,在连续委托时间后重新下单。若当前价格超过了目标价格,则 以目标价格下单,且不再进行撤单和重新下单,直到当前价格不再超过目标价格。 冰山算法虽然简单,但是其受到市场认可,应用也比较频繁,因为它能够减小股价的大范围波动。 六、总结 本文简单的介绍了冲击成本的影响因素和一些降低冲击成本的方法。一个好的降低冲击成本的方式,不仅要平衡冲击成本,还要考虑拆单后不同时间下单可能带来的机会成本。 参考文献 【1】燕汝贞,李平,曾勇.基于VWAP的价格冲击成本估计及其影响因素研究[J].管理工程学报, 2016(3):5.DOI:10.13587/j.cnki.jieem.2016.03.016. 【2】https://zhuanlan.zhihu.com/p/448924138大额交易如何降低冲击成本?

当前是:2/10 共46条信息 首页 上一页 下一页 尾页 跳转到:第
021-5068 6619 hr@cosmostar.cn
© 2017 RUNNING RECORDS LLC. ALL RIGHTS RESERVED. 沪ICP备18015628号-1