蔡宗翰教授 (Richard Tzong-Han Tsai)

辦公室:工程五館E6-B203室
電話:886-3-4227151 ext. 35203
實驗室:工程五館E6-A305室
學歷:國立台灣大學資訊工程所博士
     國立台灣大學資訊工程所碩士
     國立台灣大學資訊工程系學士
E-mail: thtsai@csie.ncu.edu.tw




研究興趣
  • 自然語言處理

  • 文本探勘數位人文意見探勘

  • 跨語檢索

  • 深度學習


  現職   
  • 中央大學資訊工程系教授

  • 中央研究院人文與社會科學中心合聘副研究員

  • 台大智慧聯網創新研究中心專案主持人


  展示系統
     
       生醫文獻探勘

本團隊針對專利文件辨識化合物與藥物名稱,提出將原子與化合物分開來辨識之方式,並利用事先辨識易與化合物混淆的專有名詞來提升化合物辨識的正確率,在專利文獻化合物辨識競賽得到第四名。

本系統整合近幾年實驗室開發的基因與化合物專有名詞辨識正規化技術,並結合實驗室開發的生醫語意角色標註技術,發展出可自動化擷取學術文獻中各類專有名詞與它們的生物關連性,在生物性表現語言競賽中榮獲第二名。

此資料庫利用文字探勘的技術來收集和高血壓(Hypertension)、肥胖(Obesity)、糖尿病(Diabetes)有關的候選基因,並依照權重給予適當的排序,並且利用視覺化方式呈現文獻搜尋結果。
此系統能自動將以名詞或動詞為中心的語意框架(Semantic Frame) 解析出來,其中語意框架主要由述語(predict)、主語(agent)、賓語(patient)及其他形容事件    的片語所組成,如時間(time)、地點(location)等等。
一種非常好用的瀏覽器附加元件, 可以幫助閱讀PubMed資料庫收藏的文獻. 安裝完PubMed-EX, PubMed搜尋到的論文標題與摘要中出現的生醫專有名詞會以不同顏色顯示, 這些專有名詞也會被標上超連結, 導引使用者到資料庫閱讀詳細資訊. 此外, 摘要中重要的語意框架會被列出, 摘要也會被自動分段. 目前已有數十個不同國家的學者持續使用中.
生醫文獻搜尋引擎. 搜尋到的論文標題與摘要中出現的生醫專有名詞會以不同顏色顯示, 這些專有名詞也會被標上超連結, 導引使用者到資料庫閱讀詳細資訊. 此外, 摘要中重要的語意框架會被列出.
基因名稱辨識與基因編號搜尋工具