首頁 > 看不懂財務報表?介紹你從沒想過的另類讀法——情緒分析與風險預測
:::

看不懂財務報表?介紹你從沒想過的另類讀法——情緒分析與風險預測

過去我們往往都以財務報表之類的數值類資訊來分析或預測公司的財務狀況。除了數值外,是否還能用其他方式預測公司的財務狀況呢?中央研究院資訊科技創新研究中心副研究員王釧茹團隊透過情緒分析的方式來觀察「財務報告」上的潛藏情緒資訊,進而找出情緒文字與風險預測的關係。
 
 
我們就來介紹這項在金融科技中運用到的人工智慧技術吧!(圖/東吳大學巨量資料管理學院黃福銘教授改寫團隊提供)
▲我們就來介紹這項在金融科技中運用到的人工智慧技術吧!(圖/東吳大學巨量資料管理學院黃福銘教授改寫團隊提供)
 
要以海量資料來預測未來的情勢和狀況,交給AI來處理最合適啦!過去我們往往都以財務報表之類的數值類資訊來分析或預測公司的財務狀況。除了數值外,是否還能從其他地方找出端倪,預測公司的財務狀況呢?
 
中央研究院資訊科技創新研究中心副研究員王釧茹團隊提供了另一種答案。他們透過情緒分析的方式來觀察「財務報告」上的潛藏情緒資訊,進而找出情緒文字與風險預測的關係。接下來,我們就來介紹這項在金融科技中運用到的人工智慧技術吧!

「文字情緒」是什麼?

在Google上的餐廳評價有分為評分和評語,假設今天把評分遮住,我們往往也能透過評語來回推使用者對這間餐廳的評分高低。舉例來說,「好吃!大推」我們會認為是評分高的(正向);「有夠難吃,不會再來」我們會認為是評分低的(負向);但像「特別,但…」我們就無法直接得知它的評分高低,因為可能是諷刺也可能是稱讚。
 
我們說話時往往會使用有情緒或評斷的字詞,因此透過文字就有機會得知我們心裡的情緒和評分。「文本情緒分析」就是用一些人工智慧的方法(自然語言處理、文字探勘和其他方法),讓電腦來解讀大量文字內容內潛藏的情緒。
 
「文本情緒分析」是以人工智慧的方法,讓電腦來解讀大量文字內容內潛藏的情緒。(圖/Pixabay)
▲「文本情緒分析」是以人工智慧的方法,讓電腦來解讀大量文字內容內潛藏的情緒。(圖/Pixabay)
 
「自然語言處理」簡單來說,就是將人類所使用的語言(英文、中文、台語等)內容,轉化成電腦能夠理解和計算的形式,也就是程式語言或標記,電腦才能夠判讀語言的特性。自然語言處理包含了許多面向,實際應用也很廣泛。除了剛剛提到的情緒分析,像是文字或語音的辨識、解析及生成、文字校正和文本朗讀,以及我們熟知的「聊天機器人」,都有應用到自然語言處理的技術。而「文字探勘」(Text Mining)主要的目的就是要從大量的非結構性資料(圖片、文字、影片…)裡找出我們所需要的資訊。

上述的兩個人工智慧技術就是我們用來達成文本情緒分析的主要工具。利用「文字探勘」擇取需要的資訊,再透過「自然語言處理」轉換成電腦可處理的形式。如此一來,我們就可以達成「文字情緒分析」的目標!這些技術的應用範圍很廣,只要能從我們有興趣主題的文章、圖片或報表中,找出訊息裡的情緒,就能發揮很大的功用。

那要如何用文字資訊預測財務風險呢?

在王釧茹的研究中,文字資訊的分類主要是以美國聖母大學提姆.洛格倫教授(Tim Loughran) 和比爾.麥克唐納德教授(Bill McDonald)所歸納的「財務情緒字典」為基礎,這個字典將詞語分為六種不同的類別:正面、負面、不確定正負的商業用語,以及表達強烈信心或者微弱信心的詞語,另外也將法律用語歸類出來。
 
財務情緒字典分類示意圖。(圖/林冠廷繪製)
▲財務情緒字典分類示意圖。(圖/林冠廷繪製)
 
分類好財務情緒的字詞後,就要進行文字資訊的處理。文字情緒有許多不同的計算方式,王釧茹團隊採用詞頻-逆向文件頻率(Term Frequency Inverse Document Frequency, TF-IDF)來計算某一個字詞在某篇文章中的重要性。在TF-IDF的核心概念裡,「在所有文章都會出現的字」不是很重要,也就是說DF(Document Frequency)愈高,重要性就會愈低;「在單一篇文章頻繁出現的字」可能會很重要,也就是說TF(Term Frequency)愈高,重要性就愈高。

在觀察財務文字資訊的過程中,運用上述的方法結合財務情緒字典,找出了文字資訊中重要性較高的字詞後,再對照文字資訊發布之後的財務風險。舉例來說,如果一個公司的財務報告裡頻繁地出現「達成」、「獲利」這類在財務相關報告比較常出現的金融正向字詞,模型運算後就會認為這個公司未來的財務狀況會是穩定的。
 
實驗的結果顯示,在分析的過程中僅考慮財務相關的詞語,去除掉無關的連接詞、代名詞等,結果會與使用充滿數字的財報分析接近。也就是說,我們僅需要考慮與財務相關的字詞來進行分析,就能達到良好的效果。

硬資訊搭配軟資訊

多數在財務資料分析的研究或實務處理上,傾向分析「硬資訊(數字)」,來觀察局勢的發展。但現在不只運用數字資料來進行分析,還可以從文字資料中找出一些「軟資訊(文字)」來搭配分析,例如:財務報表中使用了哪些詞彙來描述公司經營的方向。王釧茹團隊這次的研究結果,讓金融界了解到「軟資訊」也有重要的用途。
 
王釧茹老師利用公司財務報告進行文字情緒分析(包含自然語言處理和文字探勘等等技術)成功預測下一年度的公司財務風險。(圖/林冠廷繪製)
▲王釧茹老師利用公司財務報告進行文字情緒分析(包含自然語言處理和文字探勘等等技術)成功預測下一年度的公司財務風險。(圖/林冠廷繪製)
 
是不是很訝異有這樣的資訊處理方式呢?人工智慧竟然也擁有閱讀文字的能力!透過此篇文章,也可以再深入思考,生活中有哪些事物,其實也應用了文字探勘?或是,自己來打造更有趣的文字處理方式吧!
 
參考資料
1. Tsai, M. F., & Wang, C. J. (2017). On the risk prediction and analysis of soft information in finance reports. European Journal of Operational Research, 257(1), 243-250.
2. Petersen, M. A. (2004). Information: Hard and soft. Technical report.
3. Tim Loughran and Bill McDonald, 2011, When is a Liability not a Liability? Textual Analysis, Dictionaries, and 10-Ks, Journal of Finance, 66:1, 35-65. 
4. Lin, M. C., Lee, A. J., Kao, R. T., & Chen, K. T. (2011). Stock price movement prediction using representative prototypes of financial reports. ACM Transactions on Management Information Systems (TMIS), 2(3), 19.

 
來源:
  • 科技部107年度「科轉計畫:前沿科技轉化暨教育應用推廣」專案計畫
推薦文章