不僅僅是蟲:從昆蟲行為到股票分析
99/05/06
瀏覽次數
20503
藍艷秋|
立德大學休閒資源暨綠色產業學系
陳淑君|
中央研究院數學研究所
昆蟲行為包羅萬象
昆蟲是世界上物種最多的一群生物,有著多變的外表及迷人的行為,在天擇的作用下,牠們適存在各式各樣的環境中,讓生物學家有挖掘不完的研究題材,探索其演化的機制,並嘗試了解大自然出的難題與生物解題技巧間的演化關係。然而,昆蟲有什麼要面對的難題呢?答案是「吃喝與傳宗接代」,這恐怕是牠們最大的兩個難題!
說到昆蟲的行為,你的腦中會浮現出什麼影像呢?是跳著搖擺舞告訴同伴蜜源位置的蜜蜂?是黑夜裡閃爍著迷人亮光的螢火蟲?是互相打鬥的鍬形蟲?還是辛苦地捲著精巧搖籃的象鼻蟲媽媽?這些行為面對的主要難題,全都攸關吃喝、談戀愛和養小孩。
研究昆蟲行為的科學家利用各式各樣的知識與技能,設計實驗探索昆蟲行為背後的意義,並嘗試解開這些演化的奧祕。你可曾想過連簡單的昆蟲「走路」行為,都可以激發研究的創意,並且應用到股票分析上?請隨著本文一起進入昆蟲世界的探祕之旅吧!
有層次的昆蟲走路行為
昆蟲的走路有什麼特別呢?如果你有興趣去觀察昆蟲是怎麼利用 6 隻腳走路,保證你會得到一堆心得。底下介紹一種專門吃豆子的小甲蟲,叫做豆象,牠走路的「路徑」已成了研究的對象。豆象媽媽的走路行為引起人們的關注,是因為牠們穿梭在豆子之間,走路的目的不是為了吃,而是為了小寶寶!
當豆象媽媽走到一粒豆子上時,牠會仔細地檢查這粒豆子,然後才在上面產下1顆卵。這顆黏在豆子表皮上的卵會自行孵化,並鑽到豆子裡面吃個飽,一直到變為成蟲以後才鑽出豆子,開始另一個生命的循環。這樣說來,你可能會想,豆象媽媽如果為小孩著想,應該把卵分別產在不同的豆子上,這樣豆象小寶寶在鑽進豆子時,才不至於互相爭搶食物。
因此,豆象媽媽應該會聰明地儘量讓一粒豆子上只有1顆卵。但是,要怎樣才能做到呢?當然是要不停地走路,不停地檢查!
科學家發現,豆象媽媽果然會在每個豆子都已有 1 顆卵之後,才會再加上第 2 顆。豆象媽媽的這個特性,在自然選汰過程中,扮演著相當重要的角色。問題是,牠怎麼知道每粒豆子上都已有 1 顆卵了呢?
在大自然的環境中,豆象媽媽除了要具備前面說的產卵行為特性外,還需具備走路檢查豆子的能力和記憶力。為了解牠是怎麼辦到的,針對專吃紅豆和綠豆的綠豆象設計了一個實驗,並錄影觀察牠的行為。
實驗步驟是先選取 12 顆質地、大小均勻的豆子,在玻璃培養皿中依時鐘數字的位置排列,然後把一隻豆象媽媽放在正中央,開始錄影,並記錄下被拜訪的豆子號碼。豆象媽媽所走過的路徑,就會記錄成一連串由 1 到 12 所組成的數字,而牠在哪一粒豆子上產卵,也可以清楚記錄下來。
豆象的體形比豆子小,實驗發現豆象喜歡走短距離的路。舉例來說,如果豆象媽媽在 3 號豆子上,牠下一步走到 2 號或 4 號的機會大概有百分之六十、七十。這不難理解,因為走路會花費豆象的體力,而且豆象成蟲因不再吃東西,體力有限,所以要偷懶點,少走一點路。
不過,牠其實也不是真的懶,當牠在鄰近豆子晃一晃之後,也會「探險」到比較遠的地方。例如從 3 號豆子離開後,會走長距離到 11 號或 7 號豆子上。也就是說,牠好像會在一連串約 3 至 5 次的短距離行走後,就會有 1 到 2 次的長距離行走,然後又是一連串的短距離行走。
當豆象媽媽生產越多的卵之後,環境裡沒被產卵的豆子會越來越少,長距離的行走就越容易發生。而且,當每一粒寄主豆上都已有 1 顆卵後,接下來豆象會進行一連串長距離的搜尋,這個行為可以讓豆象媽媽很快地探索完整個環境。在確認環境中已經沒有未被產卵的豆子後,才會在已有 1 顆卵的豆子上再次產卵。原來,豆象媽媽一點都不懶!牠可是「很聰明地在走路」喲!
這種聰明的「走路行為」,可以說是「有層次的昆蟲走路行為」!先走短距離,再走長距離,然後一直以走長距離的方式搜尋新地點。在確定已沒有乾淨的豆子後,再下決定產第 2 顆卵在同一粒豆子上。
從豆象媽媽走路造訪每顆豆子所獲得的一連串數字,發展出一個特殊的分析方法,來呈現走短距離和走長距離的特性,稱作階層因子區間。我們把有興趣的「事件」出現點,進行一層一層的分層編碼。
以豆象媽媽走的路徑上的豆子數字當作第1層符號為例,如果把從 1 號豆走到 2 號豆的短距離走路編成代碼 1,把從 1 號豆走到 5 號豆的長距離走路編成代碼 2,就會形成第 2 層由 1 及 2 所組成的數字代碼。在這一階層的代碼中,如果有一連串的 1 出現,代表著一連串的短距離走路,出現 1-2-1 則代表著短-長-短距離的走路。當然,如果出現 1-2-2,則代表著短-長-長距離的走路。
如果再把這第 2 層代碼間的變化編成第 3 層代碼,例如把 1-1、1-2、2-1 及 2-2 分別再編成不同的代碼,就可以表示出連串的短距離、短長轉換、連串長距離走路等特性。這 3 層的編碼可以非常容易地把一個連續性的資料,切割成「事件」密集或「事件」稀少區間。
事件密集區間表示在那段時間內,事件出現的次數較頻繁;相反地,事件稀少區間就表示事件出現的次數稀少。因此,階層因子區間是一種切割一連串資料的方法,它的特性是可以找出事件密集和事件稀少的區間。
當豆象媽媽進行一連串的長距離走動時,可以從第 2 及第 3 層編碼裡看出跡象,然後就能預測有1顆卵的豆子快被豆象媽媽接受了,它會被產上第 2 顆卵!我們稱這一段連續長距離的搜尋期間是非平穩區間。
實驗證實大部分的豆象媽媽在經過非平穩區間後,才會選擇把卵產在已經有 1 顆卵的寄主豆上。因此豆象媽媽在這一段非平穩區間內產生了複雜的行為,包含評估、衡量和決策。這種為了照顧寶寶所演化出的行為,背後的生物意義是不是很有意思呢?
生物時鐘
階層因子區間是由豆象的走路行為發展出來的,把對於感興趣的「事件」出現點進行一層一層的編碼,但在研究其他昆蟲行為上也適用嗎?以生物時鐘的研究為例,說明階層因子區間的特性。
生物時鐘是什麼?簡單地說,是指生物體內有類似時鐘的機制,指揮生物的生理或行為的表現時機。舉例而言,我們體內有一個時鐘會因為受陽光照射的關係,指揮生理或行為出現光亮—黑暗周期的反應,使我們在白天比較活躍,晚上就需休息睡眠。即使長期沒有陽光的照射,身體也會自動有「活躍—休息」反覆出現的行為。
你也許想像不到,在遺傳學實驗裡鼎鼎大名的昆蟲—果蠅,以及最受拖鞋歡迎的「小強」—蟑螂,竟然是生物時鐘實驗的重要代表。在這裡以德國蟑螂的活動行為,來說明階層因子區間應用在生物時鐘上的研究。
做法是把德國蟑螂放在活動偵測器中央的壓克力盒中,盒子中央放置足夠的食物和水,盒子兩側分別裝有 6 組對應的紅外線感應器。當蟑螂走路時,若阻斷了紅外線,電腦就會記錄時間和感應器編號,同時會在活動紀錄圖上記錄一條黑色的「|」。也就是說,在那個時間點上,蟑螂被記錄了一次活動。
從德國蟑螂在完全黑暗的情況下連續記錄9天的活動圖可發現,若把每天 24 小時的活動量記錄在同一列上,且把連續 9 列的紀錄線排在一起,它們會呈現出一些密集的黑線集中區域和一些密集的黑線分散區域,好像遵守某種規律性!每一列紀錄都出現這種現象,也就是有穩定的周期。
若把活動量變多視為活動開始,該如何定義開始時間?同理,活動量變少的休息狀態,它的界定也很模糊。而一個「活動—休息」的周期又是多長呢?
大家可以發現,在生物時鐘的研究上,活動的周期和起始點的界定是基本的困擾。透過階層分子區間,這個問題可以解決,因為階層分子區間的特性,是把一連串的時間序列資料切割成「事件」密集和稀少的兩群。可以把「事件」定義為兩個活動之間的間隔時間,當活動量高時,被記錄到的活動間隔時間就會短;相對地,當活動量低的時候,間隔的時間就拉長。
根據紀錄圖的分析,在一個低活動量的區間和一個高活動量的區間相交的地方,就是活動的起始點。當找出每日活動量的起始點後,把每一列的起始點(0 時)對齊,就可以得到一條直線。有趣的是,這條直線的斜率剛好可得出蟑螂的活動周期!
生物資訊
階層因子區間是對感興趣的「事件」出現點進行一層一層的編碼,如果資料的特性是由一連串「事件」所組成的,即使不是昆蟲行為的資料,也適用嗎?我們發現,在目前非常熱門的生物資訊上,也可以利用階層分子區間來分析資料。
大家都知道 DNA 序列是由4個核苷酸 A、C、G 及 T 所構成,而這 4 個核苷酸在相鄰的兩個核苷酸的分布比例卻不是均勻的。舉例來說,在人體第 22 條染色體一段稱為 bA111E21 的 DNA 序列上,A、C、G 及 T 的個數分布並不相同;而相鄰兩個核苷酸的組合,也就是 AA、AC、AG……TG、TT 的個數分布也不相同!
在這一段 DNA 序列中,發現 CG 的組合只出現 1,655 次,明顯比其他組合少很多。這是因為 CG 兩端容易被甲基化,一般都以「CpG」來稱呼兩個相鄰的 C 和 G 核苷酸。如果有一連串的 CpG「事件」出現,就是有許多 CpG 聚集的 DNA 片段,這片段就稱為「CpG 島」。目前的研究顯示,CpG 島的長度一般約在 300 ~ 3,000 個鹼基間。
CpG 島在基因組裡扮演著重要的角色,通常位於轉錄啟動子附近,而且參與基因的行為表現。一段基因如果要開始作用,起動子就是開啟這個基因,表現出它的功能的關鍵。科學家發現,CpG 島有將近 40% 位在哺乳類基因的啟動子上,70% 位在人類基因的啟動子上。基於這樣的關係,許多科學家利用 CpG 島來預測基因的啟動子。
因為 CpG 分布不均勻和容易甲基化,所以尋找 CpG 島也是一個「事件— CpG」密集和稀少的問題,當然階層因子區間也可以運用在這個研究的分析上。從階層因子區間分析可發現 CpG 出現密集的區段(這些區段稱為「核心」),以這個區段為中心,向左、右延伸,就可以進一步尋找可能的 CpG 島。
目前科學家也發現,有一些 CpG 島被甲基化的現象,和癌細胞的發展有密切的關聯。如果能更明確地尋找出 CpG 島,或許對於癌症的研究會有很大的幫助!
股票分析
在 2008 年全球的金融風暴中,所有投資人,不論是股票、基金或房地產的投資,都遭到很大的虧損,所有財務數學的分析模式完全崩盤。股票或基金的資料也是屬於一連串的時間序列資料,雖然股票的價格上上下下波動,我們最常聽到的股市新聞就是「今天股市大漲或是大跌」,但其實這並不是一個常態呢!通常大漲或是大跌之間都伴隨著一段相當長的「盤整」期間,也就是股票價格波動相對小的區間。也就是說,如果把股票價格波動相對小的區間稱做價格非波動區,那麼,當這個區間結束時,應該就是價格波動區,也就是大漲或大跌的區間。然而,該如何判斷區間的開始和結束呢?我們是不是可以利用階層因子區間將股票資料區分成和非波動區,來幫助我們了解股票市場的結構和價格波動機制?以下就以 IBM 股票為例進行分析。
首先,定義階層因子區間的「事件」。在股票市場裡,一般是將股票「價格」轉換成「投資報酬率」來進行研究。價格波動大,相對的投資報酬率也會大。因此可以將「事件」定義為投資報酬率大於 90 百分位和低於 10 百分位。同樣地,可以把資料切割成事件密集和稀少的區間。觀察 2005 年 10 月 IBM 公司的股市資料,把每 30 秒觀察一次的股市資料繪成圖。在圖上以紅色線和藍色線代表利用階層因子區間所找出來事件較密集的區間,紅色線代表價格上升,藍色線代表價格下降。
從圖中可以看到,利用階層因子區間所找出的區間,大致上都能抓住股價上升或下降的趨勢。再看看 IBM 股票在 30 秒內相對應的交易量和交易次數,同樣以紅色和藍色區域代表階層因子區間對於交易量和交易次數分析的結果。如果把這些對股票 3 個不同的維度(投資報酬率、交易量及交易次數)的分析圖排列做比較,可以說價格和交易量之間的確有一個緊密的關係。
在股票市場中,有「量帶動價或價影響量」的名言。從階層因子區間分析中,印證了這句話!談到這裡,你會不會驚訝,從昆蟲行為研究,竟然也可以因為創意發揮而發展出股票分析的技術?
在文章中所提的例子,主要是用來說明從研究昆蟲行為所發展出來的階層因子區間演算法,它的應用範圍竟然可以這麼廣泛,遠超出發展當初所能想像的。不過,這篇文章的目的不是吹噓這套演算法有多神奇,而是想讓讀者知道,對於生物或昆蟲行為的觀察和研究,往往可以為人類帶來一些新的想法和創意。