为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

运用KeyGraph 解读时间数列资料:台北股市高季投资报酬率个股分析

2010-06-27 37页 pdf 1MB 42阅读

用户头像

is_274853

暂无简介

举报
运用KeyGraph 解读时间数列资料:台北股市高季投资报酬率个股分析 運用 KeyGraph解讀時間數列資料:台北股市 高季投資報酬率個股分析 *許芳誠 真理大學資訊管理系 張順堯 真理大學管理科學所碩士專班 宋孟遠 真理大學管理科學所碩士班 *email: fanechi@email.au.edu.tw 摘要 技術分析學派基本的假設是建立在歷史會不斷重演的基礎上,由於缺乏一套嚴謹 的理論架構支持,經常被學者質疑,但卻被一直沿用迄今,且奉為圭臬,本研究 並不否定技術分析存在的價值,但認為合理的假設是,歷史不一定會重演,但個 股大漲、大跌的模式,有可能在不同的時間點和不...
运用KeyGraph 解读时间数列资料:台北股市高季投资报酬率个股分析
運用 KeyGraph解讀時間數列資料:台北股市 高季投資報酬率個股 *許芳誠 真理大學資訊管理系 張順堯 真理大學管理科學所碩士專班 宋孟遠 真理大學管理科學所碩士班 *email: fanechi@email.au.edu.tw 摘要 技術分析學派基本的假設是建立在歷史會不斷重演的基礎上,由於缺乏一套嚴謹 的理論架構支持,經常被學者質疑,但卻被一直沿用迄今,且奉為圭臬,本研究 並不否定技術分析存在的價值,但認為合理的假設是,歷史不一定會重演,但個 股大漲、大跌的模式,有可能在不同的時間點和不同的股票間複製。 KeyGraph 是一種將資料圖形化的工具,目前被廣泛運用於小世界(Small World) 與機會發現(Chance Discovery)相關研究領域,過去的研究都沒有與股市投資 相結合,因此本研究將 KeyGraph 與移動平均線分析相結合,以台北股市季 投資報酬率前 10 名的個股,為分析樣本,透過 KeyGraph 找出大漲前到大漲的 運動狀態模式(pattern),並以此模式經由比對,期望在未來不同時間點、不同 個股間,找出相同的 pattern,以達複製的效果。 目前對投資領域相關的研究,所用的技術以類神經及遺傳演算法為研究主流,都 是以歷史資料對未來做預測。其共同的缺點是,因為敏感性太高,而產生過度學 習的現象。並且僅能從歷史資料中學習到一些明顯的規則,卻容易對潛藏的規則 予以忽略。KeyGraph 以上下文(context)的關係來分析資料,不會產生過度學 習的現象,並且可以發現資料中所潛藏的規則與關聯。 由於本研究仍在進行中,僅將研究過程中所獲得的成果分述如下: 以小世界的觀點,人際網絡關係,經由六度分離,就可以產生聯繫,本研究 運用 4096 種狀態勾勒出股票市場的動態網絡,透過 KeyGraph 確實也發現了兩 種大漲的 pattern,一種是強關係的 pattern,另一種是罕見的弱關係 pattern,但無 論哪一種,與人際網絡相較,都相對漫長,這也說明了,在股市中成功沒有捷徑。 其差異在於,小世界是屬於群體合作,股票市場是屬於群體競爭,多、空的角力, 使得成功之路更加漫長。 KeyGraph 對時間數列資料研究的問題,本研究發現,只要將資料標準化後, KeyGraph 就可以進行分析。 KeyGraph 將資料圖像化,無法達方向的問題,本研究發現確實可以透過數字 編碼,將 KeyGraph 所產生的圖像,以有向的方式呈現。 KeyGraph 不能表達時間性的問題,本研究透過階段劃分、圖形前後對比的方式, 有助於了解 pattern 形成的過程,想要清晰表達時間移動的過程,則仍顯不足。 第 1 章 緒論 1.1 研究背景與動機 技術分析,易學、易懂,在股市投資方法中,是投資人最常採用的分析工具,其 基本的假設是建立在歷史會不斷重演的基礎上,技術分析學派一直沿用迄今,並 且奉為圭臬,由於技術分析背後沒有一套嚴謹的理論架構支持,其基本假設經常 被學者質疑,雖然本研究並不否定其存在的價值,但對其歷史會不斷的重演的基 本假設,卻抱持著不同的看法,本研究認為比較合理的假設是,歷史不一定會重 演,但個股大漲、大跌的模式,有可能在不同的時間點和不同的股票間複製。 Key Graph 是一種將資料圖形化的工具,目前被廣泛運用於小世界(Small World) 與機會發現(Chance Discovery)相關研究領域,過去的研究都沒有以金融投資 作為主題,因此本研究產生了一個想法,想要將 Key Graph 與技術分析的方法加 以結合,運用在股市投資上。 目前對股市投資領域相關的研究,所用的技術以類神經及遺傳演算法為研究主 流,都是以歷史資料對未來做預測。然而,無論是類神經或遺傳演算法,都會因 為敏感性太高,而產生過度學習的現象。並且僅能從歷史資料中學習到一些明顯 的規則,卻容易對潛藏的規則予以忽略。Key Graph 以上下文(context)的關係 來分析資料,不會產生過度學習的現象,並且可以發現資料中所潛藏的規則與關 聯。 為了將 Key Graph 應用於時間序列的股票資料分析,必需克服的問題有三︰ 1.標準化的問題。2.方向性的問題。3.時間性的問題。 運用原始資料分析,因每檔股票之股價高低不同,會產生標準化的問題,為了解 決此問題,我們提出一種將股價轉換成狀態的方法,來處理標準化的問題。 Key Graph 對資料的處理沒有方向性,但是股價資料是有方向性的,因此我們採 取編碼的方式,來處理方向性的問題。 Key Graph 對資料的處理沒有表達時間的能力,但是股價資料是連續性的時間數 列,因此我們採取階段劃分的方式,透過對比來處理時間性的問題。 1.2 研究目的 本研究運用台北股市歷史資料,以一季為單位,計算出該季投資報酬率前 10 名 的股票,擷取當季與前一季,兩季之資料,將資料經過前處理後,由上下文的關 係,透過 Key Graph 找出大漲前到大漲的運動狀態模式(pattern),並希望能以 此模式經由比對,在未來不同時間點、不同個股間,找出相同的 pattern,以達複 製的效果。 第 2 章 文獻探討 2.1 技術分析 技術分析認為股價是由市場供需來決定,而與股票真值無關,縱使股價以 股票真值為基礎,但影響因素過於複雜,不易瞭解和量化,因此,應藉由市場的 交易活動來瞭解,因為交易情況反應所有決定供需狀況因素的相關資訊,因此在 採行技術分析時對基本面、消息面的變化自然不需注意。 技術分析所重視的是市場上價量關係的變動,至於變動的原理與因素則不 是其關切的重點,簡單地說,技術分析的重點在於研究買進與賣出股票的適當時 機。本研究,將技術分析的重點歸納如下: (1)以市場資訊為分析對象,包括市場整體資訊與個別股票資訊,除了價格與 成交量,還包含各種技術分析指標。 (2)技術分析的目的在於股票買賣時點的選擇,注重股價的變動,而不是股價 水準。 (3)著重研究市場與個股內部的計量變動,而不是市場外部整體環境的變動。 (4)著重在偵測短期股價變動。 技術分析主張藉由分析市場資料即足以獲利,而在學術界部分的實證研究 的確發現利用一些技術分析方法作為買賣的判斷依據的確能擊敗市場獲取超額 利潤,亦即技術分析有其存在的價值;例如美國學者 Pruitt and White(1988),綜 合運用成交量、相對強弱勢指標及移動平均線三種技術分析方法,提出 CRISMA 的交易法則,並透過模擬操作,證實的確可以獲得超額績效。該研究,如同是對 弱式效率市場假說的反證,加上一般認為台灣股市應較美國股市更缺乏效率性, 運用技術分析應能產生更高的超額報酬。 由於技術分析沒有一套嚴謹的理論架構,因此隨著『隨機漫步假說』(Random Walk Hypothesis)的出現,使得技術分析面對的質疑更強,因為若股價是隨機變 動的,則歷史重演或趨勢都將不存在,另外縱使存在某種有效的技術分析,隨著 更多投資人的加入,超額報酬也將漸漸消失。對此批評,Granville(1976)提出 辯護: (1)技術分析的種類甚多,有效獲得超額報酬的方法未必是公開的,所以可以 持續使用。 (2)有些人因為主觀喜惡而否定成功技術指標的存在。 (3)若干技術分析建立在電腦與數學運算上,由於其需花費金錢與訓練,所以 不是大多數人可以運用的。 (4)技術分析的應用需要花費時間、精力,使得投資人沒有時間、耐力和慾望 來作這種工作。 技術分析的假設 技術分析學派認為,股價變動有其規則可循,略述國外學者對技術分析的相關假 設如下: Robert(1966)技術分析的假設 (1) 股價決定於供需關係,而與股票內含價值無關。 (2) 除了短期波動外,股價本身也會以某種趨勢移動。 (3) 反映於股價的是理性和非理性因素,這是基本分析無法分析的。 (4) 歷史會不斷的重演。 (5) 股價的任何變動均可由圖表走勢觀察出來。 Murphy(1986)技術分析的假設 (1) 股價的變動乃反應市場基本面與消息面的因素。 (2) 股價的變動有一定之趨勢。 (3) 歷史會不斷重演。 技術分析的假設,其建立在股價係決定在市場供需情況,而影響供需狀況的 因素又極其複雜,但終將反映於市場上,因此透過市場自然可以獲得最豐富的資 訊,加上供需情況的改變有一定之趨勢,所以股價變動也有其趨勢可循,這也正 是應用技術分析可預測股價變動趨勢的原因所在。本研究並不否定技術分析其存 在的價值,但對其歷史會不斷重演的基本假設,持不同看法,本研究認為歷史不 一定會重演,但各股大漲(成功)的模式,有機會在不同時間點、不同股票或投 資組合間被成功複製。 2.2 關聯網絡 Stanley Milgram(1967)所做的郵件實驗,其假定每一個人都有 100 個朋友, 朋友和朋友之間的網絡關聯,成指數型的發展,僅需要六度的連結,就可以涵蓋 地球上所有的人口。實驗的過程,他寄了數百封信給距離他家很遠的不認識的 人,請求他們透過所有人際管道,可能認識 Milgram 本人,或是認識 Milgram 的 朋友、或是透過朋友的朋友將信件轉寄給 Milgram,其目的是在測量,人際網絡 中經過多少過程就可以與人相識,實驗結果,平均經過六次轉寄,Milgram 就可 以收到信件。這也證明了人際網絡中,人與人之間的距離,僅僅只有六度分離。 Mrk S﹒Granovetter(1973)認為,如果兩個人 A 與 B 彼此不認識,但是他們有一 個共同的朋友 C,A 與 B 之間就有可能以一個弱關係產生連結,這種弱關係能夠 傳達一些難以理解的訊息,例如謠言、小道消息和一些其他的狀況,而這種弱關 係在朋友網絡中將會自然的變成一種真實的關係。以這種方式,人們能在朋友網 絡中彼此認識,縮短群聚的距離,進而擴展他們的關聯,達到向更寬廣的世界發 散。 台北股市全體上市、上櫃掛牌交易的個股,也可以視為一種小型的關聯網 絡,用小世界六度分離的理論來解釋,如果股票市場有大漲的路徑,理當在六次 以內的連結就可搜尋出來,雖然連結在小世界理論強調的是弱關係,應用在股市 上,本研究認為連結的方式有可能是以強關係、弱關係或是強弱並存的姿態來呈 現。 2.3 移動平均線(Moving Averages) 移動平均線最早是由美林證券研究員 Richard Donchain 及工程師 J.M.Hurst 所發明,其概念來自於二次世界大戰的防空砲兵利用移動平均來計算砲彈的軌 跡,在 J.M.Hurst 所著 The Profit Magic of Stock Transaction Timing 一書中,將其 運用於股市投資,主要用來計算某一段時間內所有買賣者的平均成本。 移動平均線用統計原理加以解釋,就是將若干天的股票收盤價格加以平均, 然後連接成一條線,用以觀察股價趨勢。理論基礎是「平均成本」的概念。一般 使用有 5 日(週)、10 日(兩週)、20 日(月)、60 日(季)、120 日(半年)、240 日(一年),其目的在取得某一段期間的平均成本,並以此平均成本的移動曲線, 搭配每日收盤價,觀察線路的變化來分析某一期間多空的優劣形勢,以研判股價 未來的可能走向。一般來說,目前市場價格在移動平均線之上,意味著市場買力 (需求)較大,行情看好;反之,市場價格在移動平均線之下,則意味著供過於 求,賣壓顯然較重,行情看淡。 計算方法: (1)當日收盤價=每檔股票,當日交易期間,最後一筆交易之成交價格。 (2)5 日移動平均線=(當日收盤價+前四日收盤價)÷5。 (3)10 日移動平均線=(當日收盤價+前九日收盤價)÷10。 (4)20 日、60 日、120 日、240 日等移動平均線計算方法類推。 2.4 階層式分群法(hierarchical clustering) 透過階層架構的方式,將資料層層反覆地進行分裂或聚合,整個階層式分群 法可由樹狀結構來表示,常見的方式有兩種: 1.分裂的方式:則由樹狀結構的頂端開始,將群聚逐次分裂。 2.聚合的方式:由樹狀結構的底部開始,將資料或群聚逐次合併。 2.4.1 階層式分裂演算法(hierarchical divisive algorithm) 由樹狀結構的頂端開始,如同細胞分裂般層層將直徑最大的群聚一分為二, 直到群聚數目達到我們預期的目標。 而所謂群聚的直徑 D 指的是一個群聚中,最遠兩點間的距離。假設現在有一個 群聚 C,那麼 C 的直徑可以表示為: D(C) = maxa, b d(a, b),其中 a 和 b 都屬於 C。 我們要先定義某一點 x 與某個群聚 C 的距離 d(x, C): * 如果 x 不屬於 C,那麼 d(x, C) 等於 x 和 C 的每個資料點的距離的平均值。 * 如果 x 屬於 C,那麼 d(x, C) 等於 x 和 C 的其他各個資料點的距離的平均值。 整個階層式分裂演算法的流程可概述如下: 1.將全部的資料視為同一個群聚。 2.在現有的群聚中,挑出直徑最大的群聚 C。 3.在 C 中找出一點 x,d(x, C)≧max{d(y, C)},其中 y 屬於 C。 4.將 x 由 C 中分裂出來形成新的群聚 N,將 y 由 C 中分裂出來形成新的群聚 K。 假設原有的群聚 C 中仍剩下的資料稱為 Mc 5.重複步驟六、七,直到 C=ψ , N 與 K 都不再變化 。 6.計算 Mc 中每筆資料 m 與群聚 C、群聚 N 及群聚 K 的距離 d(m, C)、d(m, N) 、 d(m, K)。 7.假如 d(m, C) ≧ d(m, N),則將 m 由群聚 C 分裂出來歸入 N ,假如 d(m, C) < d(m, N),則將 m 由群聚 C 分裂出來歸入 K。 8.如果目前的群聚數目少於我們預期的標準,則回到步驟二。 2.4.2 階層式聚合演算法(hierarchical agglomerative algorithm) 由樹狀結構的底部開始層層聚合。一開始我們將每一筆資料視為一個群聚 (cluster),群聚與群聚間的距離定義採取單一連結聚合演算法(single-linkage agglomerative algorithm)的定義,為不同群聚中最接近兩點間的距離: D(Ci, Cj) = mina, b d(a, b),其中 a 屬於 Ci 且 b 屬於 Cj。 假設我們現在擁有 n 筆資料,則將這 n 筆資料視為 n 個群聚,亦即每個群聚包含 一筆資料: 1.將每筆資料視為一個群聚 Ci 2.找出所有群聚間,距離最接近的兩個群聚 Ci、Cj 3.合併 Ci、 Cj 成為一個新的群聚 4.假如目前的群聚數目多於我們預期的群聚數目,則反覆重複步驟二至四,直到 群聚數目已將降到我們所要求的數目。 整體來說,階層式分群法的優點如下: * 概念簡單,可用樹狀結構來表現整個計算過程。 * 只需要每個資料點之間的距離,就可以建構分群結果,而不需要計算資料點的 中心位置。(因此每一個資料點可以示一個物件,而不必是空間中的一點。) 但是階層式分群法也有下列缺點: * 只是用於少量資料,很難處理大量資料。 * 若需要某一個特定群數的分群結果,就必須從頭做起,耗時較久。 2.5KeyGraph 演算法 Ohsawa & McBurney(2003)KeyGraph 是 Yukio Ohsawa 所獨創發明的電腦 軟體,運用一些資料探勘的演算法,將不同的事件、文字、和事實,以圖形來表 示彼此之間的關係。其最大的特點,不僅可以發現資料中的強關係,也可以發現 資料中潛藏的弱關係,將其以視覺化的圖形呈現。我們依據 Ohsawa﹐Benson and Yachida(1998)將 KeyGraph 的演算過程,透過範例的解說,分述如下: 假設有一份文件資料 D,是由許多句子 S 所組成,每一個句子又由單字 W 及詞 組合而成,KeyGraph 的演算過程如下: 文件的前置處理:也就是斷詞、斷字、處理虛字、同義字的過程。首先將文件中 所有的標點符號去除,文件就被斷成許許多多的句子。再將每一個句子依據語意 的重要性加以拆解成單字及詞或是片語,同時去除沒有意義的虛字,如之、乎、 也、者、呀、哦、嗯……等。再處理句子之間的同義字,將其統一,例如我、個 人、本人、吾、在下,在不同句子中,都代表“我"的意思,就以“我"取代上 述的字,詞或是片語處理的方式亦然。文件經由前置處理後,我們可以將文件 D 轉換成文件 D1,在文件 D1 中,無論是字、詞或是片語,我們都將其視為單一的 字,如果文件有 N 個字,用 W1,W2,W3,…,Wn 相對應來代表。 擷取高頻(high frequency)字: 我們將文件 D1 中所有出現的字,按照其在文件中出現的頻率(次數)加以 排序,擷取高出現頻率的字,這些高頻字的集合,我們以 hfN 來表示,在 KeyGraph 所產生的圖形中,是以黑色節點(black node)的姿態來出現。 擷取高頻連結(link): 連結表示,在同一個句子中,高頻字之間(成對)共同出現的關係。計算所有(兩 兩成對出現)這種關係在整個文件中出現過多少次,加以排序,擷取高出現頻率 的,在這兩個高頻字(黑色節點)之間給一條連接線,所有高頻字之間有連接線 的集合,我們以 G 來表示,在 KeyGraph 所產生的圖形中,高頻連結是以黑色實 線表示。計算式如下: ( ) ( )∑ ∈Ds s jsiji w,wminw,wassoc = iw , jw 都屬於 hfN , sjsi w,w 是 iw , jw 在句子 S 中發生的次數。 擷取重要字: 重要字是與一群高頻字連結的字,如何測量一個重要字 W 與高頻字群緊密 連結的關係。計算式如下: ( ) ( )( )∏⊂ ⎥⎦ ⎤⎢⎣ ⎡ Gg gneighbors gw,based-1-1wkey = where g is a cluster,and ( ) ∑ ∈Ds ss w-gwgw,based = ( ) ∑∑ ∈ ∈Ds sw ss w-gwwneighbors = ⎪⎩ ⎪⎨⎧ ∉ ∈= g wif g g wif ,w-g w-g s ss s s g 一個字群 g 在句子 S 中發生的次數。 ( )wkey 是測量文件中所有的字與一群高 頻字共同出現的次數,共同出現較高者就是重要字。如果重要字∉G,則將其歸 類到 hfK ,在 KeyGraph 所產生的圖形中以紅色節點表示。 擷取重要連結: 高頻字 iw ∈ hfN 與重要字 jw ∈ hfK 在同一個句子中(成對)共同出現的關 係。計算所有(兩兩成對出現)這種關係在整個文件中出現過多少次,加以排序, 擷取高出現頻率的 jw ,高頻率的 jw 連結兩個或兩個以上的高頻字群,就被挑選 為重要連結,在高頻字(黑色節點)與重要字之間給一條連接線,在 KeyGrap 所 產生的圖形中是以紅色虛線表示。計算式如下: ( ) ( )∑ ∈Ds s jsiji w,wminw,wassoc = iw ∈ hfN , jw ∈ hfK 擷取關鍵字: G 中的節點與重要連結相接,其出現頻率在文件 D 中超過一個確定的門檻 值,就將其視為關鍵字,在 KeyGraph 所產生的圖形中以雙黑圈節點表示。 2.6 資料分析的雙螺旋(Double-helix)過程 Ohsawa(2002)整個資料分析的過程,是一連串的人、機(電腦)互動,其 中一個螺旋是人所執行,在整個分析的過程中,對電腦下達指令並詮釋電腦所產 生的資料,以發現資料中所潛藏的資訊。另一個螺旋,是由電腦所執行,依據人 們所下的指令,執行資料的分類、運算、轉換、資料形象化等過程。 其中最容易產生問題的地方,是使用者對 KeyGraph 形象化的圖形,做出錯誤的 詮釋。 Takama and Iwase(2004)將可能產生的問題歸納如下: 1.使用者可能會依據圖形上,節點之間的距離,來估算他們之間的關係。 2.同一種資料,因設定參數不同,會產生不同的圖形。 3.在圖形很複雜,節點數非常多的情況下,使用者可能只是發現了一個“幻覺"。 4.相同的圖形,不同的人來詮釋,會產生出不同的劇本。 從大量的資料中,透過 KeyGraph 形象化的圖形,發現資料中所潛藏的資訊, 最關鍵的因素是人,必須具備很強的專業領域知識,對 KeyGraph 演算法圖形產 生的過程非常熟悉,才能順著圖形的連結,經由專業的判斷,合邏輯的表達,產 生合理的劇本。 第 3 章 研究方法 3.1 研究架構 本研究依據研究動機與目的,透過理論及文獻探討,發展出研究架構,如圖 3-1,以成功(大漲)族群樣本,經由 Key Graph 找出成功的 pattern,並驗證此 pattern 是否能在不同時間點、不同股票間,成功複製。 資料前處理與轉接 挑選目標資料 編排投入文件 整調文件 KeyGraph圖形分析 調整參數 挑選投資組合 測 試 結果與分析 結論與建議 滿 意 是 否 圖 3-1 研究架構圖 訓 練 期 測 試 期 3.2 研究設計 資料來源:台灣經濟新報(TEJ)資料庫,上市、櫃股票日交易資料,資料期間 2001-2004 年。 步驟一:資料前處理和資料轉換 為了將 Key Graph 應用於時間序列的股票資料分析,資料必須經過複雜的處理及 轉換過程,依序說明如下: 1. 以收盤價來計算每檔股票,2001-2004 年,自己的 5 日、10 日、20 日、60 日、 120 日、240 日移動平均線,捨去前面 239 筆資料,只取所有移動平均價共同 出現以後的資料。 2 每檔股票當日的收盤價,必定會與自己的 5 日、10 日、20 日、60 日、120 日、 240 日移動平均價,產生“≧"或“<"的關係,我們運用階層式分裂演算法, 將其關係,劃分為 64 種狀態,並加以編號 00 至 63,每檔股票被定會處於其中 的一種狀態,我們將取用的資料全部加以轉換成狀態碼。這種狀態編碼方式, 可以將所有資料標準化。如圖 3-2,舉例說明: 狀態 00:收盤價<5 日<10 日<20 日<60 日<120 日<240 移動平均價。 至 狀態 63:收盤價≧5 日≧10 日≧20 日≧60 日≧120 日≧240 移動平均價。 收盤價 5 10 20 60 120 240 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 註記一:紅色線條代表≧,黑色線條代表<。 註記二:5、10、20、60、120、240代表 N 日移動平均價。 圖 3-2 階層式分裂分群架構圖 3 為了有利於後續 Key Graph 所產生的圖形分析判讀,我們運用階層式聚合演算 法,60 日代表中期趨勢,240 日代表長期趨勢,將收盤價與 60 日、240 日移動 平均線,產生“≧"或“<"的關係,加以聚合成 4 大狀態群。如圖 3-3 收盤價 ≧ 240 日 ≧ 60 日 代表 中長多 收盤價 ≧ 240 日 < 60 日 代表 長多中空 收盤價 < 240 日 ≧ 60 日 代表 長空中多 收盤價 < 240 日 < 60 日 代表 中長空 2 4 0 6 0 63 31 47 15 55 23 39 7 59 27 43 11 51 19 35 3 61 29 45 13 53 21 37 5 57 25 41 9 49 17 33 1 62 30 46 14 54 22 38 6 58 26 42 10 50 18 34 2 60 28 44 12 52 20 36 4 56 24 40 8 48 16 32 0 註記一:紅色線條代表≧,黑色線條代表<。 圖 3-3 階層式聚合分群架構圖 註記二:60、240代表 N 日移動平均價。 收 盤 價 4. 為了使 Key Graph 所產生的圖形能具有方向性,我們將每日的狀態前後加以組 合,重新編碼,將 2 位數編碼轉換為 4 位數編碼。當日狀態有 64 種可能,次 日狀態也有 64 種可能,因此 64*64=4096 種狀態,可涵蓋所有的運動狀態,舉 例說明: 期 間 第一天 第二天 第三天 第四天 2 位數狀態碼 00 32 32 16 4 位數狀態碼 00-00 00-32 32-32 32-16 前 2 碼表示前一天狀態(來向),後 2 碼表示當天狀態。 步驟二:挑選目標資料 本研究主要的目的,在複製成功的模式(pattern),太過頻繁的交易,交易成本 (手續費+證交稅)會嚴重侵蝕獲利,因此我們取樣,一季(60 個交易日)投資 報酬率漲幅前 10 名的股票,這 10 檔股票我們將其命名為“成功族群"。 投資報酬率的計算方式:(期末股價-期初股價)*100﹪/期初股價 成功族群當季(期初 到 期末)整個連續性狀態的移動,我們將其命名為“成功 之路"。 成功族群前一季(尚未大漲前)整個連續性狀態的移動,我們將其命名為“醞釀 成功"。 舉例說明:|←1-60→|(前一季),|←61-120→|(當季) 醞釀成功 → 成功之路 也就是說由醞釀成功到成功之路,要涵蓋 120 筆資料,我們透過資料庫的運算, 排序,挑選出成功族群,並擷取出醞釀成功到成功之路,整個狀態的資料。10 檔股票*120 筆資料,研究目標資料共 1,200 筆。 步驟三:編排投入(Key Graph)文件資料 將資料編排的方式,符合 Key Graph 演算的過程,簡單地說,就是一份文件需要 包含多少句子,一個句子要包含多少字。為了表達時間序列資料的運動狀態,本 研究採取階段劃分,將資料累加式投入。概略說明如下: 1.我們將 10 檔股票,每一檔股票視為一份文件,一份文件有 120 筆(天)資料, 每一筆資料都代表一個字,假設以 5 個字為一個句子,那麼這一份文件,就是由 24 個句子,每個句子 5 個字(天),組合而成。 2.假設我們以 10 天為一個階段,120 天將被劃分為 12 個階段。每一階段都要製 作一份投入文件,共計 12 分文件,文件製作方式說明如下: 第一階段文件(10 天):擷取每檔股票 10 天的資料,也就是第一個句子和第二 個句子,組合而成一份新的文件,這份文件由 20 個句子,100 個字所組成。 第二階段文件(20 天):擷取每檔股票 20 天的資料,也就是第一個句子、第二 個句子、第三個句子、第四個句子,組合而成一份新的文件,這份文件由 40 個 句子,200 個字所組成。 其餘階段文件類推。 藉由逐步投入資料,所產生的圖形也會由簡單到複雜,如果 Key Graph 所產生的 圖形,不令人滿意,也可以藉由調整文件中句子的數目,句子中字的數目,來加 以改善。 步驟四:Key Graph 圖形分析 將文件資料投入 Key Graph 軟體後,Key Graph 演算法,會計算出一系列的數據, 例如:每一個字在文件中個別出現的次數、每一個字與其他所有的字成對共同出 現的次數...等,研究者據以設定參數(高頻字、高頻連結、低頻字與高頻字群連 結、關鍵字、關鍵連結),Key Graph 軟體依據設定的參數,將文件資料圖像化, 研究者以專業領域的知識,來判讀、解析圖形,並且做出合理、合邏輯的表達。 簡單的說,就是看著節點,順著連結,編出一個合情合理的故事。就本研究而言, 是要透過圖形,經由合理的分析,找出大漲的 pattern。如果研究者對 Key Graph 所產生的圖形不滿意,或是覺得不合理,可藉由調整參數來加以改善,直到產生 滿意的圖形、合理的劇本為止。否則就重複步驟三與步驟四。 步驟五:挑選投資組合 我們將 Key Graph 所找出的大漲的 pattern,分析出切入點(數個連續的狀態), 例如:00-00 → 00-32 → 32-48 → 48-56(醞釀成功),可有效通往成功之路, 從資料庫當中搜尋、比對未來的 60 天的資料,從所有股票中挑出符合 00-00 → 00-32 → 32-48 → 48-56(順序由左至右)目前停留在 48-56 狀態的所有股票。 步驟六:測試(複製大漲的 pattern) 將所有挑出的股票,採取模擬交易的方式,以當天收盤價各買進一張,持有 60 天,第 60 天以收盤價全數賣出,並計算投資損益,以驗證大漲的 pattern,是否 能在不同的時間、不同的股票間,複製成功。 交易成本=賣出價*(0.003+0.001425)+買進價*(.001425),0.001425 為手續 費,0.003 為證交稅 損益計算方式=賣出價-買進價-交易成本 步驟七:驗證結果與分析 步驟八:結論與建議 第 4 章 驗證結果與分析 挑選出目標資料: 經由資料前處理和資料轉換後,依據成功族群的定義,資料庫運算後,挑選出 10 檔股票,分別為 1442 名軒、2326 亞瑟、2361 鴻友、2368 金像電、2399 映泰、 2406 國碩、2410 鼎大、2443 利碟、2537 春池、3022 威達電,並由資料庫擷取出 原始狀態碼,如表 4-1 至表 4-10,其中 2326 亞瑟於 2003 年 1 月 10 日至 2003 年 2 月 12 日減資,暫停交易 18 天,因資料不全將其踢除,訓練期資料共計 9 檔股 票 1080 筆資料。 製作投入文件 我們將 9 檔股票,每檔股票的 120 筆(天)資料,以 5 筆(天)資料畫分為一個 句子,共分為 24 個句子,本研究以 10 天為一個階段,120 天將被劃分為 12 個 階段。每一階段都由 9 檔股票資料中擷取相應的資料,共製作 12 份投入文件。 KeyGraph 圖形判讀與分析 第 1 階段投入文件 KeyGraph 所產生的圖形,如圖 4-1 圖 4-1 KeyGrap 1-10 日 圖形分析:本階段為“醞釀成功"的第 1-10 天,由圖形可以得知 9 檔股票產生 2 種群聚,左邊的群聚屬於長多、中、短空狀態,目前處於半年線及年線之上,季 線上下震盪,屬於漲多拉回的格局。右邊的群聚屬於中長空、短多狀態,目前處 於年線、半年線、季線、月線之下,屬於破底反彈,反複測底的格局。由圖形推 估左邊的群聚有 2-3 檔股票,右邊的群聚有 6-7 檔股票。 第 2 階段投入文件 KeyGraph 所產生的圖形,如圖 4-2 圖 4-2 KeyGrap 1-20 日 圖形分析:本階段為“醞釀成功"的第 1-20 天,由圖形可以得知 9 檔股票仍然 產生 2 種群聚,原本在圖 4-1 中左邊的群聚,在本圖中消失了,原本處於其中的 2-3 檔股票,由“03-03"開始上漲至“63-63",因上漲的時間點(先後)不同, 狀態之間的連結就消失了,原本的島形也就跟著碎了,但整體仍然處於中長多狀 態。原本在圖 4-1 中右邊的群聚,在本圖中很明顯的圖形變大,狀態也變多了, 其中有很多股票曾經上攻月線(XX-56)、季線(XX-60),但仍處於年線、半年 線、季線之下,仍屬於中長空狀態,但已由破底格局,進入築底階段。其中值得 一提的是“56-24"連結兩座島,曾經上攻月線(XX-56)、季線(XX-60)的個股, 會經由(XX-56)→“56-24"→(24-XX)→(XX-00)退回到“00-00",因此 “56-24"在連續性的 pattern 中代表的是風險,一個小波段下跌的確認點。 第 3 階段投入文件 KeyGraph 所產生的圖形,如圖 4-3 圖 4-3 KeyGrap 1-30 日 圖形分析:本階段為“醞釀成功"的第 1-30 天,由圖形可以得知 9 檔股票震盪 變得更加劇烈,由原本的兩大態族群,隱約已產生第三種狀態,描述如下︰ 1. 中長多狀態中,有股票,目前短線走弱且跌破季線(03-03),回測半年線。 2. 中長空狀態中,有股票,已經成功挑戰季線(60-60)、半年線(62-62),因其 上漲過程沒有同伴,所以形成孤島,並且突破半年線後回測季線有守(06-06), 該股票已屬於中期回升階段,但尚未突破年線。 3. 中長空狀態中,大部分的股票,仍屬於循環築底的狀態(短線挑戰月線、季 線後依然回跌),其中“56-24"與“28-08"在連續性的 pattern 中代表的是風 險,一個小波段下跌的確認點。 a.(48-56)或(56-56)經由“56-24"→(24-XX)→(XX-08)→(08-08)跌 回(00-00) b.(56-60)經由(60-XX)→(XX-28)→“28-08"→(08-00)跌回(00-00) 4. 中長空狀態中,其中一種短多上漲 pattern(00-00) →“00-56"(月線)→(56-60) 其中(00-00)可以直接運動到“00-56",表示 5 日、10 日、20 日移動平均 線之間的垂直距離非常接近。 第 4 階段投入文件 KeyGraph 所產生的圖形,如圖 4-4 圖 4-4 KeyGrap 1-40 日 圖形分析:本階段為“醞釀成功"的第 1-40 天,由圖形可以得知 60day 70day 80day 90day 100day 第 5 章 結論與建議 5.1 研究貢獻與發現 經由研究的過程與驗證的結果,我們可以歸納出以下幾點結論: 1. 以 Chance Discovery 理論的論述,機會存在於一個稀有事件,或是罕見的狀態, 但是本研究發現,在時間序列的投資領域中,機會也存在於一個不常發生的連 續性狀態轉換過程或是反應,以鏈子的方式來呈現。 2. 以小世界的觀點,人際網絡關係,經由六度分離,就可以產生聯繫,本研究 運用 4096 種狀態勾勒出股票市場的動態網絡,透過 Key Graph 確實也發現了 兩種大漲的 pattern,一種是強關係的 pattern,另一種是罕見的弱關係 pattern, 但無論哪一種,與人際網絡相較,都相對漫長,這也說明了,在股市中成功沒 有捷徑。其差異在於,小世界是屬於群體合作,股票市場是屬於群體競爭,多、 空的角力,使得成功之路更加漫長。 3. 罕見的弱關係 pattern,非常特別,是一條大漲與暴跌共用的通道,也說明機 會與風險在股市中是禍福相生的,需透過專業判斷,謹慎做出決策。 4. 過去相關研究運用 Key Graph 將資料圖像化,均無法具體的表達方向,本研究 發現確實可以透過數字編碼,將 Key Graph 所產生的圖像,以有向的方式呈現, 並且可以大幅縮短 Key Graph 演算法,運算的時間。 5 .Key Graph 對時間數列資料研究的問題,本研究提出一個將資料標準化的方 法,只要將資料標準化後,Key Graph 就可以進行分析。 6. Key Graph 不能表達時間性的問題,本研究透過階段劃分、圖形前後對比的方 式,有助於了解 pattern 形成的過程,想要清晰表達時間移動的過程,則仍顯 不足,搭配原始狀態碼或 k 線來分析,則可有效改善。 5.2 後續研究的方向 本研究在研究的過程中,發現 Key Graph 應用在投資領域是一件非常有趣的事, 而且可以研究的主題非常寬廣,可在本研究架構下朝下列方向發展: 1. 以 Key Graph 如何發現投資風險及規避之道。 2. 以 Key Graph 發現集團股做帳之路。 3. 以外資劵商進進出表,以 KeyGraph 發現外資在期貨市場潛藏的意圖。 4. 以更有效的方法解決 KeyGraph 時間性的問題。 5. 以 KeyGraph 同時結合量、價、技術指標發現機會與風險。 6. 以特殊事件發現個別股漲跌潛藏的機會與風險。 參考文獻 1. Granville, Joseph, 1963, Granville's New Key to Stock Market Profits, Prentice Hall, Englewood Cliffs, NJ. 2. Granovetter﹐M.,(1973)‘The Strenght of Weak Ties' ,American Journal of Sociology﹐vol.78﹐1360-1380 3. Levy, Robert A., 1966, Conceptual foundations of technical analysis, Financial Analyst's Journal. 4. Milgram﹐S.,(1967)‘The Small World Problem’,Psychology Today﹐vol.(1)﹐60-67 5. Murphy J.J., 1986,Technical analysis of the futures markets, a comprehensive guide to trading method and application, New York Institute of Finance Prentice Hall Company. 6. Ohsawa﹐Y. Benson﹐N.E., and Yachida﹐M.(1998)KeyGraph: Automatic indexing by co-occurrence graph based on building construction metaphor. 7. Ohsawa﹐Y. and McBurney﹐P.,(2002)“Modeling the process of Chance Discovery" Chance Discovery,Springer. 8. Ohsawa﹐Y. and McBurney﹐P., eds﹐(2003) Chance Discovery, Springer Verlag 9. Pruitt, Stephen W. and Richard E. White, (1988)Spring, The CRISMA trading system: Who says technical analysis can't beat the market?, Journal of Portfolio Management, 55-58. 10. Yasufumi Takama and Yoshihiro, (2004)“Scenario to Data Mapping for Chance Discovery Process " 表 3-1 分群狀態一覽表(1) 狀態碼 收盤價 5日 10 日 20 日 60 日 120 日 240 日 00 收盤價 < < < < < < 01 收盤價 < < < < < ≧ 02 收盤價 < < < < ≧ < 03 收盤價 < < < < ≧ ≧ 04 收盤價 < < < ≧ < < 05 收盤價 < < < ≧ < ≧ 06 收盤價 < < < ≧ ≧ < 07 收盤價 < < < ≧ ≧ ≧ 08 收盤價 < < ≧ < < < 09 收盤價 < < ≧ < < ≧ 10 收盤價 < < ≧ < ≧ < 11 收盤價 < < ≧ < ≧ ≧ 12 收盤價 < < ≧ ≧ < < 13 收盤價 < < ≧ ≧ < ≧ 14 收盤價 < < ≧ ≧ ≧ < 15 收盤價 < < ≧ ≧ ≧ ≧ 16 收盤價 < ≧ < < < < 17 收盤價 < ≧ < < < ≧ 18 收盤價 < ≧ < < ≧ < 19 收盤價 < ≧ < < ≧ ≧ 20 收盤價 < ≧ < ≧ < < 21 收盤價 < ≧ < ≧ < ≧ 22 收盤價 < ≧ < ≧ ≧ < 23 收盤價 < ≧ < ≧ ≧ ≧ 24 收盤價 < ≧ ≧ < < < 25 收盤價 < ≧ ≧ < < ≧ 26 收盤價 < ≧ ≧ < ≧ < 27 收盤價 < ≧ ≧ < ≧ ≧ 28 收盤價 < ≧ ≧ ≧ < < 29 收盤價 < ≧ ≧ ≧ < ≧ 30 收盤價 < ≧ ≧ ≧ ≧ < 31 收盤價 < ≧ ≧ ≧ ≧ ≧ 表 3-1 分群狀態一覽表(2) 狀態碼 收盤價 5日 10 日 20 日 60 日 120 日 240 日 32 收盤價 ≧ < < < < < 33 收盤價 ≧ < < < < ≧ 34 收盤價 ≧ < < < ≧ < 35 收盤價 ≧ < < < ≧ ≧ 36 收盤價 ≧ < < ≧ < < 37 收盤價 ≧ < < ≧ < ≧ 38 收盤價 ≧ < < ≧ ≧ < 39 收盤價 ≧ < < ≧ ≧ ≧ 40 收盤價 ≧ < ≧ < < < 41 收盤價 ≧ < ≧ < < ≧ 42 收盤價 ≧ < ≧ < ≧ < 43 收盤價 ≧ < ≧ < ≧ ≧ 44 收盤價 ≧ < ≧ ≧ < < 45 收盤價 ≧ < ≧ ≧ < ≧ 46 收盤價 ≧ < ≧ ≧ ≧ < 47 收盤價 ≧ < ≧ ≧ ≧ ≧ 48 收盤價 ≧ ≧ < < < < 49 收盤價 ≧ ≧ < < < ≧ 50 收盤價 ≧ ≧ < < ≧ < 51 收盤價 ≧ ≧ < < ≧ ≧ 52 收盤價 ≧ ≧ < ≧ < < 53 收盤價 ≧ ≧ < ≧ < ≧ 54 收盤價 ≧ ≧ < ≧ ≧ < 55 收盤價 ≧ ≧ < ≧ ≧ ≧ 56 收盤價 ≧ ≧ ≧ < < < 57 收盤價 ≧ ≧ ≧ < < ≧ 58 收盤價 ≧ ≧ ≧ < ≧ < 59 收盤價 ≧ ≧ ≧ < ≧ ≧ 60 收盤價 ≧ ≧ ≧ ≧ < < 61 收盤價 ≧ ≧ ≧ ≧ < ≧ 62 收盤價 ≧ ≧ ≧ ≧ ≧ < 63 收盤價 ≧ ≧ ≧ ≧ ≧ ≧ 表 4-1 1442 名軒原始狀態碼 (資料起迄時間: 91.12.20 ~ 92.06.19 ) 編號 狀態碼 編號 狀態碼 編號 狀態碼 編號 狀態碼 1 62-60 31 06-06 61 00-32 91 00-00 2 60-62 32 06-06 62 32-50 92 00-32 3 62-12 33 06-06 63 50-50 93 32-00 4 12-04 34 06-06 64 50-50 94 00-32 5 04-04 35 06-38 65 50-58 95 32-48 6 04-04 36 38-06 66 58-58 96 48-00 7 04-04 37 06-06 67 58-58 97 00-48 8 04-36 38 06-06 68 58-58 98 48-56 9 36-52 39 06-02 69 58-58 99 56-56 10 52-52 40 02-02 70 58-58 100 56-56 11 52-62 41 02-02 71 58-10 101 56-56 12 62-54 42 02-02 72 10-58 102 56-56 13 54-62 43 02-02 73 58-58 103 56-24 14 62-62 44 02-50 74 58-58 104 24-00 15 62-62 45 50-50 75 58-58 105 00-56 16 62-62 46 50-50 76 58-58 106 56-56 17 62-63 47 50-54 77 58-58 107 56-56 18 63-63 48 54-02 78 58-10 108 56-56 19 63-63 49 02-02 79 10-00 109 56-56 20 63-63 50 02-00 80 00-00 110 56-60 21 63-63 51 00-00 81 00-00 111 60-60 22 63-31 52 00-34 82 00-00 112 60-63 23 31-31 53 34-34 83 00-00 113 63-63 24 31-63 54 34-00 84 00-00 114 63-63 25 63-63 55 00-50 85 00-00 115 63-63 26 63-63 56 50-02 86 00-00 116 63-63 27 63-15 57 02-50 87 00-00 117 63-63 28 15-15 58 50-50 88 00-00 118 63-63 29 15-06 59 50-00 89 00-00 119 63-63 30 06-06 60 00-00 90 00-00 120 63-63 表 4-2 2326 亞瑟原始狀態碼 (資料起迄時間: 91.12.20 ~ 92.06.19 ) 編號 狀態碼 編號 狀態碼 編號 狀態碼 編號 狀態碼 1 00-00 31 07-07 61 63-63 91 63-63 2
/
本文档为【运用KeyGraph 解读时间数列资料:台北股市高季投资报酬率个股分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索