數位人文 Digital Humanities

數位人文(Digital Humanities)為資訊科技與人文研究結合的跨領域研究。

中華文化源遠流長,留下了斗量車載的歷史文獻,更有著無以數計的文學經典。而隨著資訊技術的發展,傳統的人文資料也逐漸數位化,數位化的資料更利於研究與應用,因此有了數位人文這個研究領域,探討如何用資訊方法讓這些人文資料更有效的應用。

其中一個議題是將數位文本資料經由自然語言處理(Natural language processing)抓出如人、事、時、地、物等資訊,進一步以進行資料探勘。

而透過對文史資料的資料探勘、視覺化、圖像化,可以讓人們經由更有系統的方理解資料的脈絡,並更容易從中發掘未曾知曉的訊息,並也提供了文史學者一個新的研究工具,為傳統的人文研究方法帶來新的視野。

本實驗室做過的數位人文研究項目如下:

  • 漢文歷史文獻詞彙擷取
    • 歷史文獻的命名實體擷取―結合主動學習法之半監督式模型,從保存到創造:開啟數位人文研究,項潔編,131-144,臺灣大學出版中心,臺灣,2011。
  • 佛典音譯詞擷取與辨識
    • 王昱鈞及蔡宗翰,歷史佛典文獻外來語借詞對辨識系統,數位人文研究的新視野:基礎與想像,項潔編,臺灣大學出版中心,臺灣,2012.
    • Yu-Chun Wang, Chun-Kai Wu, Richard Tzong-Han Tsai, and Jieh Hsiang, "Transliteration Pair Extraction from Classical Chinese Buddhist Literature Using Phonetic Similarity Measurement", New Generation Computing, 31(4), 265-283, 2013.
    • Yu-Chun Wang and Richard Tzong-Han Tsai, "Transliteration Extraction from Classical Chinese Buddhist Literature Using Conditional Random Fields", Proceedings of the 27th Pacific Asia Conference on Language, Information, and Computation (PACLIC), 2013.
  • 漢文歷史文獻音譯詞擷取
    • 王昱鈞、呂翊瑄、蔡宗翰、劉青峰、金觀濤及劉昭麟,漢文文獻之外來語音譯詞擷取方法,數位人文研究與技藝,項潔編,121-137,臺灣大學出版中心,臺灣,2014。
  • 漢文歷史文獻事件描述辨識
    • 王昱鈞、邱偉雲、吳俊鍇、呂翊瑄、蔡宗翰及金觀濤,基於人時地物脈絡之漢文歷史事件描述辨識方法:以清季外交史料為例,第五屆數位典藏與數位人文國際研討會,2014。
主要開發成果與競賽:                                 
  • 史語組     明代衛所擷取與鏈結Demo網頁