芷瀚资产管理（上海）有限责任公司

首页　/　芷瀚动态　/　芷瀚观点

芷瀚动态

News

: 低延迟均线LLT模型与交易择时
2023-08-21
投资如果能够准确把握市场的走势，那将是最为简单有效的。但是我们常常会面临：平滑性越好，也就是局部的波动性影响会变小，但是同时会产生很高的延迟。而LLT模型则很好的平衡了这个问题，在能够很好的把握市场整体变化的同时，并且能够凸显出转折点，降低延迟性。一、传统均线 1. MA均线（传统移动平均线）（1）计算公式（2）特点：MA均线采用前面n日价格的算数平均值，其中很好的刻画的价格趋势，但是n值越大，延迟性越高。（3）近一年上证指数的变化以及MA均线示意图 2. EMA均线（1）EMA均线是在MA均线的基础上面改进而来，通过对靠近计算日的价格赋予更高的权重，利用了趋势的连续性。（2）计算公式其中EMA（T）和EMA（T-1）分别代表EMA均线T和T-1日的价格。@表示0-1的参数二、LLT模型简介 1. 模型理解：（1）EMA均线指标的计算，正是信号处理当中的一阶线性滤波处理器。而LLT模型是二阶低通滤波器。其延迟反应相比于EMA均线的有了很大的改进。（2）数学原理：LLT模型采用Z变换。本质是离散时间的laplace变换。其中z表示复频域，f(k)表示时域信号。定义传输函数传输函数定义为：输出信号z变换和输入信号z变换的比值。看作输出和输入强度的比值。得到EMA均线的传输函数：传输函数是是指零初始条件下线性系统响应（即输出）量的拉普拉斯变换（或z变换）与激励（即输入）量的拉普拉斯变换之比。传输函数代表了输入和输出之间的联系，不受输入输出值的影响，可以用它来分析系统的动态特性等相关性质。 2. LLT模型的设计: LLT是一个二阶的滤波器，广发证券此研报作者做了四步转化将EMA一阶滤波器转化为LLT二阶滤波器：（1）为了使构造的高通滤波器，即不存在高频分量输出的1−H(z)，首先修改EMA公式为：将公式转换至频域以便于进行滤波，那么修改后的EMA滤波器变为（2）构建一阶高通滤波器，其结构为（3）完成二阶滤波函数的构建 2阶高通滤波器为：（4）得到了二阶高通滤波函数：（5）最后再经过Laplace逆变换得到LLT的公式为（6）模型解释：应该在LLT值大于LLT的上一值时大趋势来临，买入股票：当LLT值小于LLT前值时大趋势变为下降，卖出股票。三、模型回测以及总结在2005年-2023年对此策略进行回测，年化收益能够做到10%以上。发现部分细节上和大盘波动趋势相近。在控制回撤这方面能够前期做到相对比较好，尤其是在风险来临的时候。但是在2020年之后，模型收益较差。所以综上认为LLT模型可以作为风控模型，来控制回撤，辅助于其他模型。资料来源： 1.广发证券:罗军、俞文冰、叶涛、安宁宁《低延迟趋势线与交易性择时——短线择时策略研究之三》 2. https://zhuanlan.zhihu.com/p/34097449

: 冲击成本
2023-07-19
一、冲击成本冲击成本全称价格冲击成本。国际上通常用它来来衡量股市的流动性。它也可称为流动性成本，是指一定数量的委托（订单）迅速成交时对价格的影响，因此是一个包含即时性和合理价格两方面要素的指标。冲击成本被认为是大型机构无法摆脱的致命伤害。通常而言，交易成本可以分为两部分，一部分是直接成本，这部分可以很方便的计算，包括国家对交易征收的税，交易的手续费和券商的佣金等。这部分通常难以避免，一般不会对这部分的内容进行优化。另一部分则是交易的间接成本，这部分没有明确的规定，产生于交易的过程当中，包括交易的冲击成本，交易时间延长产生的交易价格变动机会成本以及交易未执行的机会成本等。正常而言，一个好的交易策略应当在交易的冲击成本和交易的机会成本进行平衡。如图一为成交概率按照U型分布时，市场冲击成本和机会成本的关系。图 1交易成本和冲击成本的关系可以看出，只有当交易的机会成本和市场冲击成本完成平衡时才能实现总的交易成本的降低。本文主要考虑对市场的冲击成本的研究，不考虑交易的机会成本对总成本的影响。二、冲击成本的影响因素冲击成本的大小第一个影响因素是下单的手数。一般而言，下单的手数越大，冲击成本的就越大。所以当有一个大额的订单时，通常机构会选择将大额的订单拆分成不同大小的小订单在不同的时间进行交易，用于降低交易的冲击成本。但是不同的拆单的算法降低冲击成本的程度有所不同，本文将对部分拆单算法进行简单的介绍。冲击成本的第二个影响因素是流动性的大小。市场的流动性越小，冲击成本越大。股票市场上每天的成交金额有几百亿元，看上去规模不小，流动性也可以。但那是上干只股票共同交易的结果，如果细分到不同的个股，不难发现其中一些股票的流动性还是很差的。相对而言，买卖股指期货的冲击成本就非常小，这是因为相应的股指期货合约只有几个，交易集中导致流动性非常强。这也是为什么通常在进行期货交易时，大多数人会选择主力合约，因为主力合约流动性较好，合约容易交易，同时下单时的冲击成本要更小。冲击成本的第三个影响因素是市场波动性的大小。市场的波动性越大，所造成的冲击成本越大。可以考虑一个波动率很小的市场，当你将一个较大的订单下入这个市场时，由于市场的波动较小，所以不同的时间下入的订单价格的差异较小，因此冲击成本较小。而当市场的波动率较大时，不同的时间下入的订单价格的差异可能十分的巨大，这样冲击成本就较大了。三、VWAP算法 VWAP（成交量加权平均价格）是指拆分大额委托单在约定时间段内分批执行，使得最终买入或卖出成交均价尽量接近该段时间内整个市场成交均价的算法交易策略。图 2 VWAP计算方式 VWAP算法考虑了历史成交量，未来的成交量预测、市场动态总成交量和拆单的时间段（就是总共要将总单拆分成多少单分别以怎样的时间频率交易）三个因子。Vwap算法是一种被动跟踪市场均价，市场占有率最高且十分隐蔽的算法交易策略。但是VWAP非常容易受到市场价格波动的影响。虽然VWAP处于市场价格波动的中心位置，但是这也意味着VWAP的价格可能会受到市场的波动影响。如果市场出现异常波动，交易者可能会买入或卖出超过他们预期的价格。而在开盘时，市场的波动通常较大，所以Vwap算法在开盘时和市场波动较大时很有可能失效。针对VWAP算法在开盘和市场波动较大可能失效的问题，其实我们可以设置参数用于提升VWAP算法在开盘和收盘时的敏感程度，同时按照预测或历史日内成交量分布占比进行成交。通过这种方式，我们可以降低交易成本，通过最佳交易执行路径，有效降低交易冲击成本。 Vwap算法除了可以用于拆单降低冲击成本，同时还可以作为交易者的技术指标、经纪商或交易所提供的订单选项以及基准。四、TWAP算法 TWAP 全称是 time-weighted average price（时间加权平均价格）。它是一种定价算法，用于计算特定时期内资产的平均价格。TWAP 的计算方法是将一段时期内多个点的价格相加，然后将该相加之和除以价格点总数。图 3TWAP算法计算公式例如，假设我们想要使用 15 秒的价格点间隔计算一分钟内资产的 TWAP。如果价格在 0 秒时为 100 美元，在 15 秒时为 102 美元，在 30 秒时为 101 美元，在 45 秒时为 98 美元，在 60 秒时为 103 美元，那么为了计算 TWAP，我们将对所有价格点（100、102、101、99、 103) 然后将它们除以时间点数 (5)。在这个例子中，TWAP 是 101 美元。 TWAP 算法依赖于历史价格数据，使其成为固有的滞后指标。这种滞后可能导致资产 TWAP 的价格在高度波动期间与市场价格会不同步，并可能被攻击者利用。虽然 TWAP 计算可以通过使用更短时间跨度的价格点来减少这种滞后，但这将使资本市场的攻击者参与操纵的成本降低。五、冰山算法冰山算法的原理是探测出某机构有大额挂单到来时，吃掉较低价格挂单，迫使机构大额挂单向上移动，再以较高价格卖出持有仓位。这个算法的优势在于，它可以在不影响市场价格的情况下，获取到更好的交易价格。冰山算法的执行步骤较为简单，而且并没有时间步长的概念。冰山算法主要根据快照和连续委托时间决定是否需要触发下单。每次下单若没有超过目标价格，则以对手盘一价下单，否则以目标价格下单。若一个快照时间内委托没有全部成交，则需要进行撤单，在连续委托时间后重新下单。若当前价格超过了目标价格，则以目标价格下单，且不再进行撤单和重新下单，直到当前价格不再超过目标价格。冰山算法虽然简单，但是其受到市场认可，应用也比较频繁，因为它能够减小股价的大范围波动。六、总结本文简单的介绍了冲击成本的影响因素和一些降低冲击成本的方法。一个好的降低冲击成本的方式，不仅要平衡冲击成本，还要考虑拆单后不同时间下单可能带来的机会成本。参考文献【1】燕汝贞,李平,曾勇.基于VWAP的价格冲击成本估计及其影响因素研究[J].管理工程学报, 2016(3):5.DOI:10.13587/j.cnki.jieem.2016.03.016. 【2】https://zhuanlan.zhihu.com/p/448924138大额交易如何降低冲击成本？

: GRU
2023-06-26
1.GRU简介 GRU（Gate Recurrent Unit）是循环神经网络（Recurrent Neural Network, RNN）的一种。和LSTM（Long-Short Term Memory）一样，也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。GRU和LSTM在很多情况下实际表现上相差无几，但是GRU相比LSTM更容易计算。 2.GRU 2.1GRU的输入输出结构 GRU的输入输出结构与普通的RNN是一样的。有一个当前的输入x^t，和上一个节点传递下来的隐状态h^(t-1)，这个隐状态包含了之前节点的相关信息。结合和x^t和h^(t-1)，GRU会得到当前隐藏节点的输出y^t和传递给下一个节点的隐状态h^t。 2.2GRU的内部结构首先，我们先通过上一个传输下来的状态h^t-1和当前节点的输入x^t来获取两个门控状态。如下图2-2所示，其中r控制重置的门控（reset gate）， z为控制更新的门控（update gate）。得到门控信号之后，首先使用重置门控来得到“重置”之后的数据，h^(t-1)=h^(t-1)⊙r再将h^(t-1) 与输入x^t进行拼接，再通过一个tanh激活函数来将数据放缩到-1~1的范围内。即得到如下图2-3所示的h'。这里的h'主要是包含了当前输入的数据x^t。有针对性地对h^t添加到当前的隐藏状态，相当于“记忆了当前时刻的状态”。类似于LSTM的选择记忆阶段。最后介绍GRU最关键的一个步骤，我们可以称之为“更新记忆”阶段。在这个阶段，我们同时进行了遗忘了记忆两个步骤。我们使用了先前得到的更新门控。更新表达式：h^t=(1-z)⊙h^(t-1)+z⊙h' 门控信号Z的范围是零到一，信号值越接近一，代表网络记忆下来的数据越多，该数据对训练结果的影响也越大。GRU的门控单元相比LSTM较少，这时因为GRU使用同一个门控单元Z同时进行选择和遗忘记忆。 3.量化案例 GRU模型输入变量为开盘价减日内最高价，开盘价减日内最低价，开盘价减收盘价和成交量，输入维度为4。训练数据为2013年11月20日至2018年12月10日的沪银期货交易数据。通过 GRU 神经网络模型对沪银期货第N+1 天开盘价相对于第 N 天收盘价的涨跌概率情况进行预测，并以此构建交易策略如下：当预测涨跌概率大于 65%且小于 80%时，在第 N 天收盘时多头开仓，并且在第N+1 天开盘时平仓；当预测涨跌概率大于 20%且小于 35%时，在第 N 天收盘时空头开仓，并且在第N+1 天开盘时平仓。选择日期从 2018 年 12 月 11 日到 2021 年 1 月 20 日的上海商品期货交易所白银期货主力连续合约的相关数据进行量化交易回测。首先通过选择优化后的模型预测下一天的涨跌概率，验证集预测天数共 514 天。通过模型预测涨跌概率结果根据量化投资策略来进行量化交易回测。回测结果如表，策略总胜率为63.73%，年化收益率为31.55%，最大回测9.71%，夏普比为1.28。参考文献：[1]崔梦颖. 基于GRU神经网络的沪银期货量化投资策略[D].华中科技大学,2021.DOI:10.27157/d.cnki.ghzku.2021.002598.

: 金融交易中的信息与噪声
2023-05-26
1986年，Fischer Black在美国金融协会年会的主题演讲中发表了题为Noise的报告。演讲中指出: “噪声的存在使得市场不够有效，然而它同样会阻止人们利用这种无效性。” 在行为金融学中，噪声理论常指那些基于虚假的或者失真的信号而进行的交易。在基本的金融模型中，信息与噪声常是相对应的。通常来说，人们会在信息的基础上进行交易，并希望借此获利。另一方面，有时人们会误把噪声当成信息来交易，若是这样，则很可能面临失望。然而，噪声交易对市场流动性的保持至关重要，嘈杂的交易越多，市场的流动性就越强。参与市场的交易者抱有不同的信念，而信念上的差异最终则是源于信息或信息组织方式上的差异。假如我们把金融市场中的交易者分为两类，那么前者可以是信息交易者，后者则是噪声交易者。在多数时候，我们可能认为噪声交易者群体会在交易中赔钱，而信息交易者群体则会赚钱。股票的价格既反映了信息交易者的信息，也反映了噪声交易者交易的噪声。随着噪声交易数量的增加，人们通过信息交易会变得更有利可图。这时候会有更多信息交易者的加入或更大的头寸。但事实上，信息交易者不会持有足够大的头寸来消除噪声。一方面，他们的信息给了他们优势，但不能保证盈利。持有更大的头寸意味着承担更大的风险。另一方面，信息交易者永远无法确定他们是在进行信息交易，而不是在噪声交易。若其掌握的信息已经反映在价格上，那么利用这些信息交易和利用噪声进行交易并无区别。即便是控制了市场回报和其他因素之后，所估计的投资组合回报也只是一个非常嘈杂的估计。因此，很难表明信息交易者在交易中有足够优势。在随机偏离的模型中，噪声交易者对股价产生的噪声将是累积的，就像一个醉汉往往会离他的起点越来越远。当股价偏离其价值越远，信息交易者就会变得更激进，会有更多人进入并持有更大的头寸。然而，所有对价值的估计都是嘈杂的，我们永远无法准确知道价格离价值有多远。从一定程度上来讲，价格和价值看起来都像是带有漂移项的随机游走过程。价值过程的平均值会随环境的变化而变化，价格过程也是如此。但价格的短期波动通常大于价值的短期波动。二者的波动都将随时间而变化。从长期而言，价格应将逐渐趋近于价值。那么，作为讲求实际的交易者，我们要如何解决关于信息与噪声的问题？首先，是信息与噪声的时间尺度。通常认为，金融市场的数据信噪比很低，也即市场中的噪声远比信息多。并且，随着观测频率的增加，信噪比会进一步降低（见塔勒布《反脆弱》）。以下我们使用的是信号的概念，即转化为实际交易行动的信息。具体而言，信号、交易、周期，三者是相互匹配的。短周期的信号产生短周期的交易机会，其交易频率会明显高于长周期，但想要在短周期的数据中甄别有效的信号并执行也会更加困难。如果希望将识别信号的难度降低，则可以考虑适当采用较长的周期，从而忽略短期价格较高的无序波动。其次，较常用的提升信号有效性的方法是使用过滤器或过滤指标。在物理学中，滤波是信号处理中的一项基本而重要的技术。利用滤波技术可以从各种信号中提取出所要的信号，滤除不需要的干扰信号。在金融领域中，较常用的是Kalman滤波。即在一些因素的影响下，股票价格有时也会呈现出一些整体的趋势，我们将股价的价格序列分解为含趋势性的基本成分和含随机性的噪声这两部分（P(t)=p(t)+b(t)）。该方法涉及较复杂的数学运算过程，在此并不展开。另外较常用的过滤方法还包括：设定单一指标的阈值，仅在指标高于或低于某一阈值时才触发信号；选用相关性低的指标多重验证；波动率尾部风险控制，即给以一定的正常波动空间，仅在市场大幅波动打破预期时采取行动或停止行动等。再者，是信息含量的差异。由于信息在时间和空间上的分布是不均衡的，即在某些特殊的时期或标的上，价格的信息含量更高。例如：一种理论认为，当天的收盘价比开盘价更有价值，因为在开盘价的形成过程中虽然包含了前一天盘后的诸多信息，但也有较多的情绪性释放和过激反应，并且专业机构可能更愿意在当天剩下的时间中参与交易，而非在开盘的短暂时间内。类似的，有较高成交量佐证的价格上涨可能比较少成交量下的价格上涨所形成的信号可信度更高。市场运行过程中的一些特殊历史点位也可能会受到市场上更多人的关注，一旦突破或无法突破，则可能会带动交易者的集体行动。著名心理学家、哲学家威廉·詹姆斯曾言：“智慧就是懂得该忽略什么的艺术。”放在信息与噪声充斥的金融市场，个人如何忽略噪声的影响，获取有效的信息，并实现交易决策，对实现成功的交易而言或许仍然是一个值得深思的问题。参考文献 1.Fischer Black在美国金融协会年会的主题演讲Noise. 链接： http://links.jstor.org/sici?sici=0022-1082%28198607%2941%3A3%3C529%3AN%3E2.0.CO%3B2-9 2.《反脆弱》，[美]纳西姆•尼古拉斯•塔勒布。

: LSTM与量化交易
2023-04-20
1.LSTM简介 LSTM(Long Short-Term Memory)是长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM脱根于RNN，但相较于RNN（Recurrent Neural Network），LSTM能够解决解决长序列训练过程中的梯度消失和梯度爆炸问题，在处理时间序列数据上有着巨大的优势。自2015年由Google提出后，LSTM在科技领域已经有了多个方面的应用。基于LSTM的系统广泛应用于翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别和股票预测等方面。 2.LSTM与RNN区别 2.1RNN的网络结构 RNN的提出是为了解决具有时序关联性的问题，例如股票趋势预测，需要上一时刻的股票价格输入作为下一时刻的输出。为解决这个问题，RNN提出了一个独特的网络结构。上图为RNN的一个简单的网络结构示例。其中x为输入层，s为隐藏层，o为输入层，U，V为各层之间的权重参数。右侧图像为左侧图像展开为平面时的图像。从上图我们可以清晰的看出，RNN的输出不仅和上层的输出相关，还与过往所有层的输入有关。通过建立当前输出与过往所有输入的关系，RNN获取了处理时序问题的能力。 2.2LSTM的网络结构从上述的介绍我们知道，RNN每层的输出是依赖于在其之前的每一轮的输入。但是随着时间的推移，很久之前的输入数据所占的权重是越来越小。在处理常规时序问题时，这样处理是科学的。因为时间越久远的数据一般而言对当前的影响越小。但是很多问题是存在长期依赖的问题。长期依赖是指当前系统的状态，可能受很长时间之前系统状态的影响。为解决这个问题，LSTM提出来一个三门结构，即输入门，输出门和遗忘门。当一个信息进入LSTM的网络当中，可以根据规则来判断是否有用。只有符合算法认证的信息才会留下，不符的信息则通过遗忘门被遗忘。图示为一个典型的LSTM结构。其中红色边框中的为遗忘门，橙色边框中的为输入门，绿色边框中的为输出门。当信息输入遗忘门时，遗忘门会对上级的输入数据和当前输入进行判断，输出一个0到1之间的数，0表示完全舍弃，1表示完全保留。数据输入至输入门时有两个过程，一个是有输入门对数据进行处理决定什么值需要更新，另一个是由tanh函数对输入数据进行激活。将信息输出值输出门，由输出门决定输出那些信息，最后有tanh函数进行激活。通过LSTM独特的三门结构，LSTM成功的解决RNN在长期依赖问题的问题，同时也大大的加快的运算效率。 3.量化交易量化交易是指以先进的数学模型替代人为的主观判断，利用计算机技术从庞大的历史数据中海选能带来超额收益的多种"大概率"事件以制定策略。量化交易是一门由金融、数学、计算机等学科交叉融合而来的学科。其中金融学用于量化交易模型建立的理论指导，数学用于模型的建立和推导，计算机用于模型的实现。一个完整的量化交易模型大致可以分为三个部分，数据输入，策略的研究和结果输出。其中输入的数据可以包括当前的一个市场的行情、您的投资经验、公司的财务数据等等，策略部分包括选择哪些股票，在何时进行选股，何时止盈止损等，输出的结果可以包含买入卖出的信号，产生的交易费用和产生的利润等。 4.LSTM运用于量化交易 LSTM运用于量化交易主要用于股票和期权的价格。以下简要的介绍一下LSTM用于预测股票价格的流程。整个流程大致可以分为4步，数据清理，模型搭建，分析调优和对模型的一个总结分析。数据清理过程主要是对数据进行一个预处理，包括选择哪些股票，选择的时段，选择哪些交易数据，对数据的归一化等方式。模型的搭建主要是对神经网络的构建。一个基于LSTM的神经网络模型大致可以分为数据输入、LSTM层，FC层、输出层和数据输出层。 LSTM层即是上文所描述的LSTM结构。FC层是对LSTM输出的数据进行整理，并输出一个结果。输出层为最终结果的判断。通过对神经网络的不断改正和参数优化，以及对模型性能的分析总结，即完成了一次基于LSTM的股票价格预测系统的构建。同时,LSTM还可以用于用户情绪的分析。通过抓取各平台用户的评论，然后采用LSTM进行情感分类，最终得到一个市场用户情绪的总体画像。 5.参考文献【1】Hochreiter, Sepp. Technische Universität München, Fakultät für Informatik, Munich, Germany;Schmidhuber, Jürgen.Long short-term memory.[J].Neural computation,1997,Vol.9(8): 1735-1780。【2】杨丽，吴雨茜，王俊丽，刘义理.循环神经网络研究综述[J].计算机应用,2018,第38卷(202): 1-6，26

021-5068 6619 hr@cosmostar.cn

© 2017 RUNNING RECORDS LLC. ALL RIGHTS RESERVED. 沪ICP备18015628号-1