证券市场信息熵技术指标的建构与运用

证券市场信息熵技术指标的建构与运用

 

信息是个很抽象很宽泛的概念,很难用一个简单的定义将其完全准确把握[1].平日我们所指的信息量的大小,一般很难得到一个确定的量化数值;而在证券市场中,股民大多数是利用自己所掌握的信息来判断何种证券值得持有、持有的时间要多久、何时进场何时出场?然而,股民所掌握的信息到底是个什么样子?信息量越大越好吗?怎么才能判断这种信息的价值呢?然而,一个概率分布可以被定义成一个“熵”的量,它具有许多特性符合度量信息的直观要求,因此,笔者就以上问题做出量化解答,并就此构建信息熵的技术指标.   笔者以上证指数000001的交易时间、开盘、最高、最低、收盘、成交量、成交额、涨数、跌数、持仓量、分笔、开盘量、开盘额数据为信息构建信息熵指标,选取数据为1991年5月13日至2012年3月22日这20年的日线数据;之所以没有选取1991年5月13日之前的数据,是因为在此时间之前的数据有些是不完整且不稳定的,不能体现出信息熵计算的稳定性和可信度.   1信息熵   1948年,Shannon借鉴了热力学的概念,将信息中排除了冗余后的平均信息量称为“信息熵”[2],并给出了计算信息熵的数学表达式.对于1个随机的离散变量,可能有n个取值,每个取值所对应的概率分别为12,,,,,inpppp,则其信息熵可表述为下式:对于变量的概率值而言,其值越大,其不确定性越大,信息熵也越大,意味着想要更好地确定其具体情况,所需要的信息量就越大,计算所得的信息熵也就越大.而当121,0inp=p=p==p=时,这个随机变量就被确定,其信息熵最小为0.然而,证券市场的价格走势是不断变化的,体现的信息熵值也随之不断变化,因此,我们只凭大盘K线的走势是很难判断下一个周期价格是涨还是跌[3].所以,提取出所需要的信息,并计算得到1个适合价格分析的指标就尤为重要,而此时的信息熵指标就能很好地表现出股市价格走势和市场特点.   2指标模型建立过程[4]   (1)选取数据源.将数据源中的每Circel个交易日作为1个时间周期单位(文中Circel为15),共分为m组数据(文中m为326),将每列数据(开盘价、最高价等)作为1个小组数据计算信息熵值,表1为数据的分组列表示意形式,因原数据众多,因此只列示选取的第1个数据格式,其余格式均相同.   (2)选取每个小组数据第2天数值减去前1天数值,得到相应差值,计算公式如下:ChaZhi=data(i+1)data(i),(2)其中,data(i),data(i+1)分别表示前1天和第2天数值数据.   (3)根据计算之后的ChaZhi,统计出大于、小于和等于零的ChaZhi个数n(ChaZhi>,<,=0)各为多少,计算其值所占的比重(即为概率),计算公式如下:(,,0)(,,0)nChaZhipChaZhiCircel><=><==.(3)   (4)在信息熵值计算中,由于log(0)是无意义的,所以,p(ChaZhi>,<,=0)=0时,将其值改为-10p(ChaZhi>,<,=0)=10,可计算-10-10(10)log(10)∝0,所以不会影响熵值计算.p(ChaZhi>,<,=0)可简写为p(C>,<,=0),信息熵计算公式如下:[((0))log((0))mH=pC>pC>+(p(C<0))log(p(C<0))+(p(C=0))log(p(C=0))].   (5)计算每个周期Circel交易日的总信息熵值的公式为:1CircelmimmHH==∑.(6)计算m组数据总信息熵值的公式为:1mmiiHH==∑.(4)   (7)由于计算得到的信息熵值序列是一个噪音相当大的数值序列,因此,笔者采用小波分析降噪的方法将其主要趋势序列进行提取[5-6],其信息熵原始信号与分层阈值降噪信号对比如图1所示.   (8)将上证1991年5月13日开始至2012年3月22日的20年交易日日线数据每隔Circel个收盘价格取1个值,得到m个价格时间序列.   (9)将价格时间序列和信息熵值均作归一化处理[7],为更加清晰地说明图例,将每个归一化的信息熵值增加1,得到调整后的信息熵值序列,而价格归一化处理后的价格序列对应如图2所示.   (10)选取调整后的熵值序列中适当的信息熵阈值[8-9],1.19,1.58abH=H=(图2),然后选取其值对应的时间和收盘价格(表2).   3实证分析   对图2进行分析,可得到如下信息:   (1)熵值总是在振荡中,其变化的相对幅度明显高于价格的相对变化幅度.   (2)超出[1.19,1.58]abH=H=范围之外的收盘价走势可以分为两种情况,(1)1.19aH<H=价格均为上涨;(2)1.58bH>H=价格均为下跌.   (3)熊市的明显的特点是熵值整体比较高[2],因此,利用此点可以判断股市是否处于熊市.熵值在阀值1.58bH=(图2中水平线)上方振荡,则表明股市整体格局较乱,处于明显的熊市中;只有当熵值充分下穿1.58bH=线,才可以视为熊市结束的信号(图2中2010年03月18日对应的直线).而目前(数据截止日为2012年3月22日)的熵值仍在阀值上方振荡,表明熊市没有结束.   (4)当信息熵值曲线上穿1.58bH=时,价格将要下跌,下穿bH时,价格将要上涨.   (5)当信息熵值曲线下穿和上穿1.19aH=时,要注意其信息熵值变化量的大小.如果熵值变化大,那么,熵值曲线下穿1.19aH=时,价格将要上涨,上穿1.19aH=时,价格将要下跌;熵值变化小,则不一定有价格趋势的形成.   (6)信息熵值在增大过程中,是价格变化由趋势变为无序的过程,一般不是入场的时机[10].信息熵值在1.19aH=以下时的变化过程除外.由以上的几点分析,就对文中起初所提及的几个问题得到了很好的诠释,而入场时间、持仓时间、出场时间方面也得到了较好的回答,在熵值减小过程中,1.19aH=H=是比较好的买入入场点,反之,1.19aH=则是较好的卖出离场点,同样对于H下穿1.58bH=时,为较好的买入入场点,H上穿1.58bH=时,卖出离场.同样,信息熵值能够多次有效给出价格变化局部行情的转折点,牛市和熊市对应不同特点的熵值,熵值增大时往往伴随着价格的震荡或者下跌,信息熵值的这些规律足以反映复杂市场的一个层面.参照图2(A-W)中对应入场、离场点以及买入、卖出量化收益进行总结,表3即为做空统计表。从以上数据可知,根据指标上穿1.58bH=做空入场,下穿平仓离场,每一笔交易均盈利,最后一次是在2010年03月18日做空入场,截至到2012年03月22日指数为2375.77,盈利为670.32元.表4为做多统计表.同理,指标下穿1.19aH=做多入场,上穿平仓离场,每一笔交易也均盈利.#p#分页标题#e#   4结论   借鉴信息熵的概念,将上证指数一系列数据作为信息,利用数据每日变化作为信息熵计算的基础,并利用小波降噪技术实现熵值去噪.当然,文中构建的信息熵技术指标阈值适合于长线交易投资者;如果要做短线交易,有4种办法解决时间跨度问题,一是缩小周期Circel的值,二是将计算得到的信息熵值降噪处理幅度减小,三是可以将前2种方法相结合,四是可以选取较小周期数据(如4H、1H、30M、15M、5M、1M等),方法则完全相同.当然,不管利用那种方法,其信息熵阈值的选取一定要有灵活变化.