時間:11/18(六)-11/19(日)下午1點到5點
地點:成功大學成功校區-計網中心二樓75209電腦教室
報名截止時間:11/15(三)下午5點
相關課程訊息如下:
- 2017-11-18 文本分析(一):全文檢索與資料處理
在這次的工作坊,我們將利用免費而著名的Notepad++文字編輯軟體,來進行兩種數位人文的基本工作:自建全文檢索系統與初步的資料整理作業。全文檢索是數位化資料最基本的運用,在二十多年前需要程式特別處理的功能,現在卻內建在很多的軟體裏。Notepad++裏也有這樣的功能。但不管是全文檢索的結果,或是數位化的資料,例如光學辨識的文件或網路上擷取的資料,常常需要進一步的整理才能更好地利用。而整理的方式常常是利用整體取代的功能來完成。我們將利用Notepad++裏的規則運算式(Regular Expression, 也譯作正則表示式、正規表示式)進行比較複雜的檢索與取代來完成資料 的初步整理。 - 2017-11-19 文本分析(二):分析、統計與圖表資料比對是文史工作者必須常常面對的問題、從事的工作,也與我們種種對文本的判斷有所關聯。而電腦的特長正在於快速的資料比對,全文檢索就是一個很好的例子。在這次的工作坊中,我們將利用Notepad++處理資料,然後利用AntConc統計資料,最後利用MSExcel將來視覺化種種分析、統計的結果。視覺化不但會影響到我們的研究視角,也是教學上的利器,更是文史科系與其它學科進行交流最好的橋樑。而如何藉由處理資料、分析資料、統計資料,完成從文字到數字、表格與圖表的轉換,正是本次工作坊要完成的目標。