目前,程序化交易已經(jīng)成為國外投行和金融機構(gòu)交易的主流手法,因為程序化交易是追求穩(wěn)定持續(xù)的盈利模式,能夠?qū)崿F(xiàn)交易的穩(wěn)定化,從而杜絕人工交易中的諸多不確定性和規(guī)避人性情緒化的干擾,雖然程序化交易本身只是一個工具,用人的思想加上電腦的執(zhí)行,但是真正專業(yè)的程序化模型設(shè)計過程卻不那么簡單。 就交易策略而言,一般分為兩大類,一是人工策略交易即人工下單交易;二是系統(tǒng)策略交易。系統(tǒng)策略交易一般又分為人工系統(tǒng)策略交易和計算機程序化系統(tǒng)策略交易。 計算機程序化系統(tǒng)策略交易又分為半智能程序化系統(tǒng)交易和全智能程序化系統(tǒng)交易。本文所探討的就是后者,即數(shù)學(xué)模型神經(jīng)網(wǎng)絡(luò)如何在全智能程序化系統(tǒng)策略中發(fā)揮作用。 神經(jīng)網(wǎng)絡(luò):我們在此所稱的神經(jīng)網(wǎng)絡(luò)一般指人工神經(jīng)網(wǎng)絡(luò),是一種旨在模仿人腦結(jié)構(gòu)及其功能的信息處理系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)是一種應(yīng)用類似于大腦神經(jīng)聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。在工程與學(xué)術(shù)界也常直接簡稱為神經(jīng)網(wǎng)絡(luò)或類神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是一種運算模型,由大量的節(jié)點(或稱神經(jīng)元)之間相互聯(lián)接構(gòu)成。每個節(jié)點代表一種特定的輸出函數(shù),稱為激勵函數(shù)(activationfunction)。每兩個節(jié)點間的連接都代表一個對于通過該連接信號的加權(quán)值,稱之為權(quán)重,這相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出則依網(wǎng)絡(luò)的連接方式,權(quán)重值和激勵函數(shù)的不同而不同。而網(wǎng)絡(luò)自身通常都是對自然界某種算法或者函數(shù)的逼近,也可能是對一種邏輯策略的表達(dá)。人工神經(jīng)網(wǎng)絡(luò)通常是通過一個基于數(shù)學(xué)統(tǒng)計學(xué)類型的學(xué)習(xí)方法(Learning Method)得以優(yōu)化,所以人工神經(jīng)網(wǎng)絡(luò)也是數(shù)學(xué)統(tǒng)計學(xué)方法的一種實際應(yīng)用,通過統(tǒng)計學(xué)的標(biāo)準(zhǔn)數(shù)學(xué)方法我們能夠得到大量的可以用函數(shù)來表達(dá)的局部結(jié)構(gòu)空間,另一方面在人工智能學(xué)的人工感知領(lǐng)域,我們通過數(shù)學(xué)統(tǒng)計學(xué)的應(yīng)用可以來做人工感知方面的決定問題(也就是說通過統(tǒng)計學(xué)的方法,人工神經(jīng)網(wǎng)絡(luò)能夠類似人一樣具有簡單的決定能力和簡單的判斷能力),這種方法比起正式的邏輯學(xué)推理演算更具有優(yōu)勢。 神經(jīng)網(wǎng)絡(luò)的基本構(gòu)成:神經(jīng)網(wǎng)絡(luò)主要是由神經(jīng)元構(gòu)成,而神經(jīng)元是按照一定拓?fù)浣Y(jié)構(gòu)廣泛互聯(lián)形成的,并按照一定的學(xué)習(xí)規(guī)則,通過對大量樣本數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,把網(wǎng)絡(luò)掌握的知識以神經(jīng)元之間的連接權(quán)值和閾值的形式儲存下來,利用這些知識可以實現(xiàn)某種人腦功能的推理機,這種推理機通過機械化運作方式發(fā)揮功能。人工神經(jīng)元是對生物神經(jīng)元的一種形式化描述,它對生物神經(jīng)元的信息處理過程進(jìn)行抽象,并用數(shù)學(xué)語言予以描述,對生物神經(jīng)元的結(jié)構(gòu)和功能進(jìn)行模擬,并用模型圖給以表達(dá)。單個的人工神經(jīng)元的功能是簡單的,只有通過一定的拓?fù)浣Y(jié)構(gòu)將大量的人工神經(jīng)元廣泛連接起來,組成龐大的人工神經(jīng)網(wǎng)絡(luò),才能實現(xiàn)對復(fù)雜信息的處理與儲存,并表現(xiàn)出各種優(yōu)越的特性。 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):就數(shù)學(xué)模型而言,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一般分為兩大類,即層次型結(jié)構(gòu)和互聯(lián)型結(jié)構(gòu),層次型結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)將神經(jīng)元按功能分為若干層,一般有輸入層、中間層和輸出層,各層順序連接。輸入層接受外部的輸入信號,并由各輸入單元傳遞給直接相連的中間層單元。中間層是網(wǎng)絡(luò)的內(nèi)部處理單元,與外部沒有直接聯(lián)系。神經(jīng)網(wǎng)絡(luò)所具有的模式變換能力,如模式分類、模式完善、特征提取等,主要是在中間層進(jìn)行的。根據(jù)處理功能的不同,中間層可以有多層也可以為簡單層。由于中間層單元不直接與外部輸入輸出打交道。故常將神經(jīng)網(wǎng)絡(luò)的中間層稱為隱含層。輸出層是網(wǎng)絡(luò)輸出運行結(jié)果并與顯示設(shè)備或執(zhí)行機構(gòu)相連接的部分。 人工神經(jīng)網(wǎng)絡(luò)的特點和優(yōu)越性:主要表現(xiàn)在幾個方面:第一,具有自學(xué)習(xí)功能。例如實現(xiàn)實現(xiàn)圖像識別時,只在先把許多不同的圖像樣板和對應(yīng)的應(yīng)識別的結(jié)果輸入人工神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)就會通過自學(xué)習(xí)功能,慢慢學(xué)會識別類似的圖像。自學(xué)習(xí)功能對于預(yù)測有特別重要的意義。預(yù)期未來的人工神經(jīng)網(wǎng)絡(luò)計算機將為人類提供經(jīng)濟(jì)預(yù)測、市場預(yù)測、效益預(yù)測,其應(yīng)用前途是很遠(yuǎn)大的。第二,具有聯(lián)想存儲功能。用人工神經(jīng)網(wǎng)絡(luò)的反饋網(wǎng)絡(luò)就可以實現(xiàn)這種聯(lián)想。第三,具有高速尋找優(yōu)化解的能力。尋找一個復(fù)雜問題的優(yōu)化解,往往需要很大的計算量,利用一個針對某問題而設(shè)計的反饋型人工神經(jīng)網(wǎng)絡(luò),發(fā)揮計算機的高速運算能力,可能很快找到優(yōu)化解。第四,應(yīng)用領(lǐng)域十分廣泛,這些領(lǐng)域主要包括:模式識別、信息處理、知識工程、專家系統(tǒng)、優(yōu)化組合、自動化控制,以及本文所探討的金融市場程序量化交易模型構(gòu)建等等。隨著神經(jīng)網(wǎng)絡(luò)理論本身以及相關(guān)理論、相關(guān)技術(shù)的不斷發(fā)展深入,神經(jīng)網(wǎng)絡(luò)未來的應(yīng)用定將更加深入廣泛。就金融領(lǐng)域自動化交易模型而言,筆者也只是試著探討而已,有不足之處還望讀者多多理解。第五,神經(jīng)網(wǎng)絡(luò)可以用作分類、聚類、預(yù)測等,通過歷史數(shù)據(jù)的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到數(shù)據(jù)中隱含的知識,在問題中找到某些特征以及對應(yīng)的評價數(shù)據(jù),用這些數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),進(jìn)而達(dá)到自適應(yīng)功能,其應(yīng)用較廣泛的就是BP神經(jīng)網(wǎng)絡(luò)。 數(shù)學(xué)模型中常用的兩種神經(jīng)網(wǎng)絡(luò):在數(shù)學(xué)建模中,常用的神經(jīng)網(wǎng)絡(luò)主要有兩種:一種是基于誤差反轉(zhuǎn)算法的前饋神經(jīng)網(wǎng)絡(luò),即BP神經(jīng)網(wǎng)絡(luò),主要用來實現(xiàn)非線性映射;另一種是SOM自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM),主要用來聚類和模式識別。它們兩者在內(nèi)在結(jié)構(gòu)上有所區(qū)別,下面就分別對其進(jìn)行簡要說明: BP神經(jīng)網(wǎng)絡(luò):人工神經(jīng)網(wǎng)絡(luò)有很多模型,但是目前應(yīng)用較廣泛的是前饋神經(jīng)網(wǎng)絡(luò)中的誤差逆?zhèn)鞑W(xué)習(xí)算法(Error Back Propagation),簡稱為BP神經(jīng)網(wǎng)絡(luò)。它是前饋神經(jīng)網(wǎng)絡(luò)中的核心部分?;舅惴ò?個方面,即信息的前向輸入和誤差的反向輸入,計算實際輸出時是按從輸入到輸出的方向進(jìn)行,而權(quán)值和閾值的修正從輸出到輸入的方向進(jìn)行。其結(jié)構(gòu)圖如下: BP網(wǎng)絡(luò)結(jié)構(gòu)是信號前向傳播導(dǎo)入,經(jīng)輸入層到中間隱含層實現(xiàn)正向傳播,若輸出層得到期望值,則學(xué)習(xí)算法結(jié)束。若未得到期望值則反向傳播,將誤差信號按原連接通路反向計算,根據(jù)誤差梯度下降法再調(diào)節(jié)前各層的權(quán)值和閾值,權(quán)值和閾值隨著更多正向信息變量和反向信息變量的不斷進(jìn)入從而始終處于動態(tài)調(diào)節(jié)之中,目的就是使修改后的網(wǎng)絡(luò)最終輸出能接近最佳期望值。通俗點比喻就類似一個人的成長經(jīng)歷,在成長過程中不斷糾正錯誤,不斷吸取教訓(xùn),還不斷總結(jié)成功經(jīng)驗,以免下次再犯同樣錯誤。其模型結(jié)構(gòu)圖見下: 在這里我想特別強調(diào)權(quán)值和閾值的概念,因為它們很重要,關(guān)系到網(wǎng)絡(luò)最后的結(jié)果。權(quán)值和閾值是神經(jīng)元之間的連接,將數(shù)據(jù)輸入計算出一個輸出,然后與實際輸出比較,誤差反傳,不斷調(diào)整權(quán)值和閾值。理論上而言,BP網(wǎng)絡(luò)以其優(yōu)良的非線性逼近性能,在模式識別、智能控制、非線性優(yōu)化等領(lǐng)域都有大量應(yīng)用,近年也有不少人用BP神經(jīng)網(wǎng)絡(luò)應(yīng)用在股指期貨日內(nèi)短模自動化交易上。BP網(wǎng)絡(luò)的理論優(yōu)勢主要表現(xiàn)在學(xué)習(xí)速度和泛化能力上,甚至不需要過多樣本,較適合非線性特征,學(xué)習(xí)速度表現(xiàn)在滿意地逼近訓(xùn)練樣本所花費的時間上,泛化能力表現(xiàn)在對未訓(xùn)練樣本的逼近程度上,既能夠根據(jù)訓(xùn)練集的表現(xiàn)高度擬合未來數(shù)據(jù)即預(yù)測功能,這是一個神經(jīng)網(wǎng)絡(luò)是否優(yōu)良的根本考驗,BP神經(jīng)網(wǎng)絡(luò)在理論推導(dǎo)上似乎完全能做到。 可是真的是這樣嗎?為什么很多運用BP網(wǎng)絡(luò)神經(jīng)模型構(gòu)建起來的交易模型實踐效果并非如訓(xùn)練集效果那樣好甚至出現(xiàn)巨大誤差呢? 泛化能力并沒有得到充分體現(xiàn),這又是什么原因呢?就此筆者淺談點個人看法如下: 1、 很多人過于盲信BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)自適應(yīng)糾錯、數(shù)據(jù)容錯和數(shù)據(jù)泛化能力,特別疏于對歷史樣本數(shù)據(jù)的收集、層次篩選及數(shù)據(jù)內(nèi)含性質(zhì)甄別,缺乏對研究標(biāo)的樣本數(shù)據(jù)含有的內(nèi)在本質(zhì)規(guī)律進(jìn)行挖掘和體驗,導(dǎo)致樣本數(shù)據(jù)噪聲過大、結(jié)構(gòu)不合理不科學(xué)。通常而言,樣本數(shù)據(jù)M增加,泛化能力增加。 樣本數(shù)據(jù)訓(xùn)練效果好,泛化效果也越好。但這種趨勢有個極限和度,當(dāng)達(dá)到某個極限時,隨著訓(xùn)練能力的提高,預(yù)測能力反而下降,陷入兩個極端,要么樣本數(shù)據(jù)存在嚴(yán)重不足和缺陷,要么樣本數(shù)據(jù)過多過細(xì)出現(xiàn)過擬現(xiàn)象。 這兩種現(xiàn)象都是學(xué)習(xí)了過多數(shù)據(jù)樣本細(xì)節(jié),過于注重數(shù)據(jù)現(xiàn)象,而不能反映樣本內(nèi)含有的本質(zhì)性規(guī)律,這也是BP神經(jīng)網(wǎng)絡(luò)的缺陷,過大強調(diào)因數(shù)據(jù)而預(yù)測數(shù)據(jù),過于放大自適應(yīng)預(yù)測,卻不注重樣本數(shù)據(jù)內(nèi)在性質(zhì)上本質(zhì)規(guī)律的挖掘,自然容易走偏,甚至在某些特定階段擬合出錯誤的規(guī)律,尤其不適應(yīng)中線趨勢波段交易模型構(gòu)建。 2、 采用BP網(wǎng)絡(luò)設(shè)計程序化交易模型很容易陷入“自下而上”的模型理念構(gòu)建陷阱,導(dǎo)入過大數(shù)據(jù)噪聲,這是程序化交易模型設(shè)計者要盡量避免的。 通常而言,在程序化模型主體設(shè)計理念上分為“自上而下和自下而上兩種”,前者是理念優(yōu)先,后者是數(shù)據(jù)優(yōu)先。后面會講到它們之間的區(qū)別。 3、 由于學(xué)習(xí)速率是固定的,因此網(wǎng)絡(luò)的收斂速度慢,需要較長的訓(xùn)練時間。對于一些復(fù)雜問題,BP算法需要的訓(xùn)練時間可能非常長,這主要是由于學(xué)習(xí)速率太小造成的。 4、 其次,BP算法可以使權(quán)值收斂到某個值,但并不保證其為誤差平面的全局最小值,這是因為采用梯度下降法可能產(chǎn)生一個局部最小值。 5、 網(wǎng)絡(luò)隱含層的層數(shù)和單元數(shù)的選擇尚無理論上的指導(dǎo),一般是根據(jù)經(jīng)驗或者通過反復(fù)實驗確定。因此,網(wǎng)絡(luò)往往存在很大的冗余性,在一定程度上也增加了網(wǎng)絡(luò)學(xué)習(xí)的負(fù)擔(dān)。 6、 網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性。也就是說,如果增加了學(xué)習(xí)樣本,訓(xùn)練好的網(wǎng)絡(luò)就需要從頭開始訓(xùn)練,對于以前的權(quán)值和閾值是沒有記憶的。但是可以將預(yù)測、分類或聚類做的比較好的權(quán)值保存。 基于上述原因,簡單采用BP神經(jīng)網(wǎng)絡(luò)運用于金融市場的程序化交易模型的構(gòu)建主體還是有一定的局限性,需要結(jié)合其他神經(jīng)網(wǎng)絡(luò)效果應(yīng)該會更好。 SOM自組織特征映射神經(jīng)網(wǎng)絡(luò):生物學(xué)研究表明,人的大腦皮層中存在許多不同功能的神經(jīng)網(wǎng)絡(luò)區(qū)域,每個功能區(qū)域完成各自的特定功能,在接受特定信息刺激時也會做出相應(yīng)特定的反應(yīng),這種特定細(xì)胞對特定信號的特別反應(yīng)并不是天生的而是后天訓(xùn)練形成的。 自組織特征映射神經(jīng)網(wǎng)絡(luò)模擬大腦神經(jīng)系統(tǒng)功能,是一種無監(jiān)督競爭試學(xué)習(xí)的前饋網(wǎng)絡(luò),在訓(xùn)練中能無監(jiān)督自組織學(xué)習(xí),它通過學(xué)習(xí)可以提取一組數(shù)據(jù)中的重要特征或某種內(nèi)在規(guī)律,按離散方式進(jìn)行分類,網(wǎng)絡(luò)可以把任意高維的輸入映射到低維空間,并且使得輸入數(shù)據(jù)內(nèi)部的相似性質(zhì)表現(xiàn)為臨近的特征映射,并保持其拓?fù)浣Y(jié)構(gòu)不變,這種分類反映了樣本集的本質(zhì)區(qū)別,大大簡化了一致性準(zhǔn)則中的人為因素。 在多數(shù)情況下,人在認(rèn)識的過程中沒有預(yù)知的正確模式,人獲得大量知識常常是靠“無師自通”,即通過對客觀事物的反復(fù)觀察、分析與比較,自行揭示其內(nèi)在規(guī)律,并對具有共同特征的事物進(jìn)行分類歸類,對于人的這種學(xué)習(xí)方式,基于有導(dǎo)師學(xué)習(xí)策略的神經(jīng)網(wǎng)絡(luò)(BP)是無能為力的。 所以,自組織神經(jīng)網(wǎng)絡(luò)的無導(dǎo)師學(xué)習(xí)方式更類似于人類大腦中生物神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),其最重要特點是通過自尋找樣本中的內(nèi)在規(guī)律和本質(zhì)屬性,自組織自適應(yīng)地改變網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu),這種學(xué)習(xí)方式大大拓寬神經(jīng)網(wǎng)絡(luò)在模式識別、分類、聚類方面的應(yīng)用。自組織網(wǎng)絡(luò)結(jié)構(gòu)屬于層次型網(wǎng)絡(luò)結(jié)構(gòu),有多種類型。 自組織特征映射是其中之一,它們的共同特點是競爭層。一般自組織神經(jīng)網(wǎng)絡(luò)是輸入層、競爭層、輸出層結(jié)構(gòu),輸入層接受外界信號,向競爭層傳輸,競爭層負(fù)責(zé)對該輸入模式進(jìn)行分析比較、找出規(guī)律、正確分類。 產(chǎn)生模型過擬合的一般原因: A、數(shù)據(jù)抽樣時沒有足夠正確考慮到市場基本特點,導(dǎo)致抽出的數(shù)據(jù)樣本不能有效足夠代表市場運行邏輯或基本特征(市場運行規(guī)律),這往往是BP網(wǎng)絡(luò)模型所忽略的; B、數(shù)據(jù)樣本噪音數(shù)據(jù)干擾過大,大到模型過分記住了噪音特征,反而忽略了真實的輸入輸出間的關(guān)系,即忽略了本質(zhì),模型設(shè)計始終沒抓住核心價值; C、 在決策樹模型搭建中,如果我們對于決策樹的生長沒有合理的限制和修剪的話,決策樹的自由生長有可能每片葉子里只包含單純的事件數(shù)據(jù)(event)或非事件數(shù)據(jù)(no event),可以想象,這種決策樹當(dāng)然可以完美匹配(擬合)訓(xùn)練數(shù)據(jù),但是一旦應(yīng)用到新的業(yè)務(wù)真實數(shù)據(jù)時,效果就不理想。樣本訓(xùn)練集尤其關(guān)鍵條件不要過度細(xì)化,要適當(dāng)限制和修剪。 D、在建模時的“邏輯假設(shè)”到了模型應(yīng)用時已經(jīng)不能成立了。常用模型都是在假設(shè)的基礎(chǔ)上才可以搭建和應(yīng)用的,常用的假設(shè)包括:假設(shè)“歷史數(shù)據(jù)可以推測未來,市場歷史會重演”,假設(shè)業(yè)務(wù)環(huán)節(jié)沒有發(fā)生顯著變化,假設(shè)建模數(shù)據(jù)與后來的應(yīng)用數(shù)據(jù)是相似的,等等。如果上述假設(shè)違反了業(yè)務(wù)場景或者環(huán)境發(fā)送了變化的話,根據(jù)這些假設(shè)搭建的模型就有可能無法有效應(yīng)用。 BP與SOM優(yōu)劣:在金融市場中的量化模型構(gòu)建中到底應(yīng)采用BP還是SOM?這要看投資標(biāo)的、交易理念及模型構(gòu)建者的投資經(jīng)驗而定了,筆者個人認(rèn)為SOM神經(jīng)網(wǎng)絡(luò)特征映射應(yīng)更適合有一定投資經(jīng)驗和交易理念的人,這更有利于思考市場運動的本質(zhì),而非特定階段的數(shù)據(jù)擬合,從而提前避免數(shù)據(jù)陷阱過擬合,更貼近實戰(zhàn)性和適應(yīng)性。 所以SOM神經(jīng)網(wǎng)絡(luò)對模型構(gòu)建者而言一般要求具備一定的投資理念和經(jīng)驗作為基礎(chǔ),也就是先理念后建模。具體而言,SOM神經(jīng)網(wǎng)絡(luò)首先在數(shù)學(xué)建模中根據(jù)廣泛性的歷史樣本理化出性狀,并對樣本進(jìn)行正確的分類和歸類,通過對已知的樣本所蘊含的分類知識進(jìn)行學(xué)習(xí)、提煉出某種基本的規(guī)律和特征,再利用這種分類規(guī)律特征效驗交易理念。 SOM網(wǎng)絡(luò)是直接從所提供的樣本內(nèi)部學(xué)習(xí)分類知識,提煉出蘊含在樣本中的相關(guān)知識,并將這些知識儲存在網(wǎng)絡(luò)的連接之中即拓?fù)浣Y(jié)構(gòu)互聯(lián),利用這些知識可以對未知的樣本進(jìn)行歸類,建立推理機,為了防止數(shù)據(jù)陷阱和過擬合,提煉出的樣本特征規(guī)律,要放在不同的訓(xùn)練集測試并同時具有廣度性和深度性。 全智能程序化交易模型系統(tǒng)的構(gòu)建思路:搞全智能程序化交易模型設(shè)計,是絕對離不開神經(jīng)網(wǎng)絡(luò)知識的運用的,當(dāng)今的市場走勢更加復(fù)雜多變,若想用一種過于簡單的某個突破理念就想在當(dāng)今變換復(fù)雜的市場面前盈利已成為歷史,精明的交易者越來越多,波動特性越來越復(fù)雜多變,面對現(xiàn)今更加復(fù)雜變換的市場,必須要運用更加復(fù)雜的知識工具,才能不斷適應(yīng)市場。因此,數(shù)學(xué)模型中的神經(jīng)網(wǎng)絡(luò)知識運用必不可少。 只是若單純采用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建模型是有一定缺限的,它的作用主要體現(xiàn)在樣本訓(xùn)練集階段,SOM網(wǎng)絡(luò)更多可以達(dá)到檢驗理念和優(yōu)化理念作用,因為理念一定是本質(zhì)性的(下面會具體闡述),若程序化模型完全依靠數(shù)學(xué)模型神經(jīng)網(wǎng)絡(luò)而忽略市場運動的本質(zhì)性,很容易陷入過擬合狀態(tài)和數(shù)據(jù)陷阱,實盤效果一般不會理想,這是程序化交易的另一弊病。 因此,如何在運用數(shù)學(xué)模型神經(jīng)網(wǎng)絡(luò)知識的同時又要避免陷入數(shù)據(jù)陷阱應(yīng)是程序化模型設(shè)計的主要方向。 程序主體設(shè)計理念:要解決上面的問題,首先要解決程序化設(shè)計理念問題,這是決定模型方向的問題,否則很容易陷入數(shù)據(jù)陷阱。在程序化主體設(shè)計理念上,一般分為“自上而下”的理念構(gòu)建和“自下而上”的理念構(gòu)建。“自上而下”的理念構(gòu)建是先有交易理念,這個交易理念往往是建立在多年實戰(zhàn)基礎(chǔ)上,是經(jīng)年累月反復(fù)的市場觀察、體會、領(lǐng)悟和實踐得出的初步經(jīng)驗,這個經(jīng)驗具有普適性、本質(zhì)性,以此作為模型理念主要架構(gòu),再通過理念反推導(dǎo)構(gòu)建交易系統(tǒng),并將其程序化。 比如索羅斯的交易系統(tǒng),便是由他的反射理論推導(dǎo)構(gòu)建出的交易程序。相反,一個無經(jīng)驗的新手,就很容易陷入數(shù)據(jù)陷阱和過度擬合狀態(tài),因為他們普遍不具備“自上而下”構(gòu)建模型理念的能力經(jīng)驗,即對市場缺乏深刻的認(rèn)識、領(lǐng)會及經(jīng)驗,只能盲目“自下而上”構(gòu)建模型理念。 而“自下而上”的建模理念往往不具有未來適應(yīng)性或者實盤誤差大,只是純粹依據(jù)一堆某個特定時期的數(shù)據(jù)理化出的所謂知識和訓(xùn)練集,往往導(dǎo)入過多無關(guān)的、非本質(zhì)的數(shù)據(jù)變量,偏離模型核心價值,導(dǎo)致數(shù)據(jù)噪聲過大,沒有考慮到模型關(guān)鍵本質(zhì)性的特征和信息及其由此構(gòu)建起來的投資理念,這種純數(shù)學(xué)訓(xùn)練集構(gòu)建起來的模型一到真實的實盤運用場景就很容易表現(xiàn)不佳,因為市場波動特性和數(shù)據(jù)樣板會隨著時間的推移而出現(xiàn)復(fù)雜多變狀態(tài),市場不會出現(xiàn)2個完全一模一樣的走勢,歷史會重演但從來不是簡單的重復(fù)。這也就是為什么當(dāng)下很多程序化交易模型實盤效果不佳的根本原因,過于注重數(shù)據(jù)理論推導(dǎo)忽略本質(zhì)理念。 交易系統(tǒng)的優(yōu)化:有些程序化交易者反對優(yōu)化,因為優(yōu)化過度會使交易系統(tǒng)適用于過去而無用于將來,即優(yōu)化陷阱。其實這也是一個“度”的問題,過于簡單的模型已經(jīng)不適應(yīng)當(dāng)下及未來市場,過于復(fù)雜的模型又有可能陷入過度擬合陷阱,因此,我個人認(rèn)為這里的關(guān)鍵就是看你采用的是數(shù)據(jù)優(yōu)化還是理念優(yōu)化,自下而上的模型理念設(shè)計往往是數(shù)據(jù)優(yōu)化。 打個比方,一個交易系統(tǒng)設(shè)計的理念是順勢突破交易法,如海龜交易法(突破20周期高低點),數(shù)據(jù)優(yōu)化就是尋找突破N周期的最合適數(shù)值,而理念優(yōu)化則是尋找比單純的突破法更優(yōu)秀更高效的交易思維或理念或組合。 任何模型交易理念的雛形首先是基于個人實戰(zhàn)經(jīng)驗、觀察和邏輯思考得來,而這種理念還需要通過海量數(shù)據(jù)檢測才可以進(jìn)一步檢驗出交易理念的優(yōu)劣,而這個過程是離不開數(shù)學(xué)模型神經(jīng)網(wǎng)絡(luò)尤其SOM網(wǎng)絡(luò)知識運用的,如合理抽樣、樣本理化、特征提煉、知識提煉、分類等,在這個過程中就可以進(jìn)一步檢驗交易理念雛形是否正確以及進(jìn)行必要的修正優(yōu)化。 運用“層次型拓?fù)浣Y(jié)構(gòu)和SOM神經(jīng)網(wǎng)絡(luò)”應(yīng)該就可以達(dá)到這個目的,找到交易理念的不足和優(yōu)劣之處,去其糟粕取其精華,進(jìn)而才能進(jìn)一步檢驗和確認(rèn)模型的核心理念價值,這個核心交易理念是決定模型是否具有未來適應(yīng)性和實盤性的保障,因為市場波動特性雖然多變,但萬變不離其終,人類的本質(zhì)特性幾百年從未改變,市場也是一樣。 系統(tǒng)整合:一套成熟優(yōu)秀的程序化交易模型一定是系統(tǒng)整合的結(jié)果,交易過程是一個完備的有機體系,包括:模型構(gòu)建基本理念和方式、交易策略、方向識別、信息處理、信號傳輸、執(zhí)行、止盈止損離市策略、風(fēng)險控制/穩(wěn)定性控制等等,每個子系統(tǒng)都不是各自單打獨斗,單個子系統(tǒng)的不合理設(shè)計也會影響到整個交易系統(tǒng)的表現(xiàn),整體系統(tǒng)表現(xiàn)往往取決于各個子系統(tǒng)最佳協(xié)調(diào)組合的結(jié)果,形成一套完整運行的交易體系,這個體系是否優(yōu)秀可以從三個方面檢驗,即“外推、性質(zhì)和量化”,“外推”是檢驗?zāi)P驮趯嵄P前是否具有盈利前景和未來適應(yīng)性的一個重要方法,一般分為時間外推和品種外推,即把模型放在不同數(shù)據(jù)集、不同抽樣時間段、多角度多層次進(jìn)行交叉回測,放在多個品種上進(jìn)行多品種程序回測;所謂“性質(zhì)”就是要避免三個方向,一是盡量避免超高頻率交易;二是盡量避免自下而上構(gòu)建模型交易理念;三是模型設(shè)計內(nèi)容要以接近實戰(zhàn)為原則,信號執(zhí)行方式最好采用收盤價模型,必須要考慮到市場實際情況及滑點損失和交易成本因素等;所謂“量化”就是模型最終要有數(shù)據(jù)做支撐,用回測指標(biāo)說話,任何模型首先必須要經(jīng)得起過去歷史數(shù)據(jù)的回測檢驗并得到各種滿意的量化指標(biāo), 如:年化收益率、盈利率、本金回撤、動態(tài)權(quán)益回撤、動態(tài)損益回撤、勝率、盈虧比、夏普比率、交易成本及滑點預(yù)估,最后還要觀察這些指標(biāo)在不同的回測階段是否具有明顯的變化規(guī)律等等,任何模型若連歷史數(shù)據(jù)回測都無法過關(guān),那可以肯定不會適用于未來,雖然回測過關(guān)并不代表一定適應(yīng)未來,但一套成熟優(yōu)秀的模型一般在設(shè)計階段都會提前過濾和規(guī)避掉實盤中可能面臨的誤差,也會經(jīng)得起實盤考驗。 交易系統(tǒng)的實盤使用和維護(hù):市場行情波動特征也是會變的,主要表現(xiàn)在波動特性和交易環(huán)境上。舉例來說,2002到2005年,只要有個最單純最簡單的均線系統(tǒng),就可以發(fā)財。2005年以后這樣簡單的系統(tǒng)獲利已經(jīng)不穩(wěn)定,而09年以后,基本就不可能再用來獲利了。 又如2015年2月前,股指日間成交跳價單位一般不大都在1個點以內(nèi),止損控制很容易執(zhí)行且不會產(chǎn)生過大滑點,可是到了2015年5月后,日間成交跳價單位變化甚至達(dá)到5個點、10個點也很普遍,這必然會大大增加日內(nèi)高頻交易的滑點成本,若不修正模型必然不會適應(yīng)。前幾年,做股指高頻交易的人都發(fā)財了,一年十倍的都有,但是現(xiàn)在呢,高頻交易已經(jīng)屬于自殺了。 為什么? 因為市場上精明的交易者越來越多了,當(dāng)你的對手還在用肉搏的時候,你有一把手槍就可以稱王,但是現(xiàn)在,別人都開上飛機了。以前套利盈利很容易,但是現(xiàn)在套利盈利越來越難,套利空間越來越少,因為參與套利的人越來越多且都是電腦程序化自動識別,稍有點套利空間立馬就有交易者以最快的速度修補價差的不合理性,價差空間會被市場迅速修補,盈利機會越來越少。 另外一個重要問題就是交易環(huán)境也是會變化的,比如今年,期貨夜盤的大量推出,導(dǎo)致不同時間段的交易分布不再均勻,開收盤時間出現(xiàn)了扭曲,很多交易系統(tǒng)便不能適應(yīng)了。所以交易系統(tǒng)必須時時對模型效果進(jìn)行跟蹤維護(hù)和修補,甚至必要時直接宣布它死亡。市場歷史會不斷重演這是毋庸置疑的,但是其表現(xiàn)方式又不完全簡單重復(fù),表現(xiàn)方式是會變化的,環(huán)境的不同會導(dǎo)致局部的差異,所以交易系統(tǒng)的跟蹤維護(hù)絕對是必要的,模型也不是萬能不變的,即使本質(zhì)上的東西也會在某些特定環(huán)境發(fā)生階段性變異。 責(zé)任編輯:張文慧 |
【免責(zé)聲明】本文僅代表作者本人觀點,與本網(wǎng)站無關(guān)。本網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。
本網(wǎng)站凡是注明“來源:七禾網(wǎng)”的文章均為七禾網(wǎng) m.yfjjl6v.cn版權(quán)所有,相關(guān)網(wǎng)站或媒體若要轉(zhuǎn)載須經(jīng)七禾網(wǎng)同意0571-88212938,并注明出處。若本網(wǎng)站相關(guān)內(nèi)容涉及到其他媒體或公司的版權(quán),請聯(lián)系0571-88212938,我們將及時調(diào)整或刪除。
七禾研究中心負(fù)責(zé)人:劉健偉/翁建平
電話:0571-88212938
Email:57124514@qq.com
七禾科技中心負(fù)責(zé)人:李賀/相升澳
電話:15068166275
Email:1573338006@qq.com
七禾產(chǎn)業(yè)中心負(fù)責(zé)人:果圓/王婷
電話:18258198313
七禾研究員:唐正璐/李燁
電話:0571-88212938
Email:7hcn@163.com
七禾財富管理中心
電話:13732204374(微信同號)
電話:18657157586(微信同號)
七禾網(wǎng) | 沈良宏觀 | 七禾調(diào)研 | 價值投資君 | 七禾網(wǎng)APP安卓&鴻蒙 | 七禾網(wǎng)APP蘋果 | 七禾網(wǎng)投顧平臺 | 傅海棠自媒體 | 沈良自媒體 |
? 七禾網(wǎng) 浙ICP備09012462號-1 浙公網(wǎng)安備 33010802010119號 增值電信業(yè)務(wù)經(jīng)營許可證[浙B2-20110481] 廣播電視節(jié)目制作經(jīng)營許可證[浙字第05637號]
技術(shù)支持 本網(wǎng)法律顧問 曲峰律師 余楓梧律師 廣告合作 關(guān)于我們 鄭重聲明 業(yè)務(wù)公告
中期協(xié)“期媒投教聯(lián)盟”成員 、 中期協(xié)“金融科技委員會”委員單位