情緒分析 Sentiment Analysis

廣義來講,情緒意見分析是利用自然語言處理、文本分析以及語意特性來決定句子、文章甚至文本的主觀訊息(Subjective Information)。

其中最基本的主題是情緒極性分類(Sentiment Classification),將文本的極性分類成負向(negative)、中性(neutral)以及正向(positive)。
例如:"I am really happy.",這個句子就是正向的語句,而"Today is not my day."就是負向的語句,諸如此類等等。

一般來說,情緒極性分類都是使用機器學習(Machine Learning)來達到效果,並且搭配傳統的Bag-of-Words(BoW)特徵值,如此一來就能達到還不錯的精準度。但如果想要追求更高的精準度呢?本實驗室的情緒極性分類系統搭配一個特有的字典—SentiConceptNet,使用除了BoW的特徵值外,也利用較新穎的特徵值Bag-of-Sentmental-Concepts(BoSC)來提升準確度。

而本系統參加在ESWC 2014中的Concept-level Sentiment Analysis Challenge,並且打敗IBM隊伍取得第一名。下圖即是本系統的截圖,如果有興趣可以到 http://140.115.51.136:5000/ 試試看!
* SentiConceptNet 是一部包含26萬個Concept以及其情緒值的字典,由蔡宗翰教授與臺灣大學合作研發。