【學術報導】國史館及臺灣文獻館1,229萬頁檔案,全面開放免費下載

國史館繼開放線上閱覽檔案數位圖檔後,今(5)日起和臺灣文獻館提供 1,229 萬頁檔案的數位檔免費下載功能;先前開放數位檔之《國民政府》檔案,也已完成 19 萬 5 千餘筆的分件作業,提供以「件」為單元的目錄查詢,讓研究者透過目錄檢索檔案時可以更加精準。 完整新聞稿 國史館網址

【學術報導】「主義」退位,「資料」先行—臺灣文學研究的新型態

文/黃美娥(臺灣大學臺灣文學研究所長) 圖/聯合知識庫 數年前拜讀項潔教授〈什麼是數位人文〉一文時,有段文字令我印象非常深刻。他提到2010年的美國《紐約時報》,刊載了一系列名為「人文2.0」的報導,其中〈打開人文寶藏的數位鑰匙〉,指出在二十世紀歷經許多「主義」洗禮的人文學研究,下一個關鍵詞將會是「資料」(data)。此處預告的是,經由資訊技術所提供的巨量資料(big data),將為人文研究帶來新衝擊,特別是過去十分依賴各種西方理論所進行的人文研究習性。 實際上,取藉數位科技,轉化人文研究視野或方法論,很早就在世界各地引起熱潮,臺灣自不例外,即以「臺灣文學」此一學科而言,近年來也已置身於這一波數位新浪潮之中。回溯臺灣文學學科發展的歷程,是在90年代後期才得以進入大學體制內,作為一門新興學科,初期為了建立自身主體性,其研究趨向相當重視在地化、本土性,後來為能快速與國際接軌,乃關注起和東亞文學、世界文學之間的關係性,並熱切援引西方理論裨益融入全球化語境,頻繁召開許多與「主義」有關的會議。於是無形中,促使此一學科,孕育出勇於嘗試接納各種文學/文化/社會理論的「趨新」性格。 當然,臺灣文學的「趨新」活力,也表現在對數位典藏和數位人文研究的高度興趣。近幾年結合數位技術的臺灣文學研究或計畫案,正在逐年增加,在網路上便可找到若干有關臺灣古典文學、民間文學、新文學各類範疇的資料庫、網站,例如中興大學邱貴芬教授策劃的「臺灣文學大典」,筆者與遠流公司王榮文先生執行文化部委託案「臺灣工具箱•臺灣文學」,以及施懿琳教授在國立臺灣文學館支持下的「智慧型全臺詩知識庫」等。至於,學者個人參與科技部執行的數位人文研究議題,近五年也有增多趨勢,在在說明臺灣文學的推廣與研究,已經進入善用新工具,走向新型態的模式了。 臺灣文學知識庫中的文訊期刊,可瀏覽查訊各刊期。 不僅官方經費挹注帶來研究型態的更新,民間力量其實也發揮推波助瀾的作用,其中聯合線上公司近期發行的「臺灣文學知識庫」,便值得注意。目前,有關臺灣現代文學的資料庫,多數係以作者小傳、作家作品目錄、作家手稿典藏、學者研究論著為主要登載對象,但「臺灣文學知識庫」所收錄為創刊於1984年11月的《聯合文學》、1983年7月的《文訊》,以及 2003年至2015年的《聯合副刊》,針對三份重要報紙、雜誌內容進行全文掃描和典藏,因此在資料庫的性質上甚具獨特意義。 其次,由於「臺灣文學知識庫」資料涵蓋時間超過三十年之久,故已累積成為巨量訊息,透過數位資料庫的迅速耙梳,能夠輔助人工研究的侷限,節省時間與精力,同時提醒當前研究者在專注作家個案研究、作品文本分析,以微觀見長的「質」性研究之外,亦當留心「量」化研究的價值。更何況,資料庫在建置時,也配有欄位檢索:《聯合文學》所設為刊期瀏覽(2006-2015)、分類瀏覽(封面故事、專欄、獨家特輯、聯文選書、作品刊登、當月作家、編輯室報告、藝文精選……)、小說新人獎(1987-2012);《文訊》為刊期瀏覽(1983-2016)、分類瀏覽(各地藝文採風、書評書介、人物春秋、銀光副刊、人文關懷、全球華文文學通訊、大陸有關華文文學研究動態、談文論藝、懷念作家、作家行止……)、百大作家(黃秋芳、李潼、陳芳明、余光中、向陽、郝譽翔……);《聯合副刊》則是日期瀏覽(2003.1-2015.12)、百大作家(楊照、張作錦、陳克華、李進文、晶晶、蔣勳、廖玉蕙……)、精選(小品、小說、文學獎、專欄、散文、詩、雜文、藝術、書評、文學沙龍、文學遊藝場),而這也顯示了三種報刊對於自我內容特色的選擇與標榜。 臺灣文學知識庫中的聯合文學期刊,完整記錄25年間小說新人獎創作樣貌演變。 另,上列資料庫所附欄位查索,無疑也暗示了重要的研究路徑,例如掌握《聯合文學》「小說新人獎」,便可一窺二十五年間臺灣小說新人蠭出情形,以及其間創作樣貌演變歷程;又如《文訊》「各地藝文採風」欄目,資料庫顯示自1994年至2015年共收錄有4347筆訊息,則在這長達20年的記錄中,可以發現臺灣各地區域文學深耕概況,統合起來正是一部最能刻畫地方文學生命力的臺灣當代文學史;再如《文訊》「大陸有關華文文學研究動態」,由1987年至2015年,計有633筆介紹,從中得以一窺近三十年來對岸研究臺灣文學的重點與旨趣所在。 除此之外,「臺灣文學知識庫」也能以自訂關鍵詞的方式進行查尋,即以「香港」一詞為例,《聯合文學》共得1662筆、《文訊》1000筆、《聯合副刊》26筆,若將之比對與合觀,便能掌握三者與香港文學場域產生連結、交錯的異同狀態,以及彼此所扮演傳播香港文學的角色為何?乃至鳥瞰臺灣對於香港文學的接受史與傳播史概況?又,再以「馬來西亞」搜索,《聯合文學》計有202筆、《文訊》265筆、《聯合副刊》129筆,顯示《聯合副刊》雖然資料歷時較短,卻刊有不少與馬來西亞有關的作品或訊息,故頗堪玩味。再者,整體來看,以《聯合文學》和《文訊》而言,其與香港文學關係互動較諸馬來西亞更加密切。 大抵,由上可知,「量化」研究或者「欄位」查索、「關鍵詞」研究,亦可引來新的「蛛絲馬跡」,足以協助醞釀新問題意識,甚或開拓新研究領域,日後若能配合更為高端的電子分析技術、數據統計、標記方式,就能愈加呈顯資料庫的工具性和問題性意義。其次,在上述「臺灣文學知識庫」內部三種資料庫之間的串連或參照之餘,倘能進一步延伸、利用香港地區的香港文學資料庫、香港文化資料庫,馬來西亞的馬華文學書庫、馬華文學電子圖書館、馬華文學論文索引資料庫,將能使得臺灣文學在地研究,有機會進展成為跨界、跨國研究。簡言之,未來善用、連結各類、各地、各國「資料」庫,將會是二十一世紀最要重要的人文研究新趨向,也會是臺灣文學研究的新型態與新範式。 (《聯合文學》12月號同步刊載) https://reader.udn.com/reader/story/7924/2867913

【學術報導】余光中書寫香港紀錄片 中山大學首映

紀錄片預告:https://drive.google.com/file/d/0B-odRZ72QUKReEFtRGRRUWU5ek0/view 國立中山大學今(26)日慶祝榮譽退休教授余光中90大壽,慶生會上首播全台首支「余光中書寫香港紀錄片」作為獻禮。拍攝團隊實地走訪香江取景,訪談余光中多位文壇舊識,歷時數月錄製成40分鐘的紀錄片,回顧余光中教授文學生涯中長達11年的「香港時期」,呈現其文學創作、教學與生活點滴。首映會上除余光中教授伉儷蒞臨參與,校方也特別邀請香港中文大學榮譽退休講座教授金聖華、退休教授黃維樑、圖書館人員及余教授香港友人與會出席。 余光中1928年生於南京,20歲遷居台灣,西元1974年至1985年曾在香港中文大學聯合書院中文系任教,這段期間創作出已出版的163首詩作及25篇散文,是創作的黃金歲月時期,對於往後臺灣時期的創作有著深遠的影響。余光中曾說「大陸是母親,台灣是妻子,香港是情人」,其作品充滿對兩岸三地的感情。文學家梁實秋先生也曾說:「余光中右手寫詩,左手寫散文,成就之高一時無兩」,學者黃維樑教授更稱其有「璀璨的五采筆」。「余光中書寫香港紀錄片」藉由旅行詩篇般的影像,生動地再現余光中教授在香港書寫的那段美好歲月。 本紀錄片從余光中教授朗誦詩作〈望海〉說起,全片以香港中文大學為主軸,實地走訪香港機場、沙田、船灣、馬鞍山等地,並拍攝中文大學圖書館典藏余光中教授任教時期相關手稿文物、獲頒榮譽文學博士等實體資料,搭配余光中教授友人金聖華教授、黃維樑教授與高足黃秀蓮老師、樊善標教授的深度訪談。此外,影片音樂皆以余光中教授的詩文入曲,其中兩首獲得現代民歌之父楊弦,和歌手羅大佑等著名作曲者無償授權;另兩首配樂則由中山兩名學生吳翊菱和劉羿均作曲創作,讓觀賞者共同沉浸在余光中教授那段創作時光,同時認識現代詩文學創作的風華與精隨。 余光中談到詩文創作歷程時提到,〈望海〉是從香港到高雄不久寫的,當時他相當懷念香港,來到西子灣,望著茫茫台灣海峽,越看越遠;最後,最遙遠的是望海的眼睛,深刻表達自己對香港時期的戀慕。他表示,當時全家「連根拔起」,舉家遷至香港,首先遇到的就是語言問題,因為他不會講廣東話,別人問他問題,他只能用普通話回答,「這大概是世界少有」。余教授也回憶,當時在台灣當教授一個月薪水7千元,到了香港也是7千元,「不過,是港幣7千!」待遇確實不錯。 中山大學副校長陳陽益表示,10月28日重陽節是余光中教授的生日,今天提前為余大師暖壽並發表紀錄片。「余光中書寫香港紀錄片」部份將收錄於校方圖書館內的「余光中數位文學館」,完整版另製成VCD,珍藏余學研究於香港的精采篇章。 新聞來源:http://news.nsysu.edu.tw/files/14-1342-176074,r2910-1.php?Lang=zh-tw

【學術報導】「數位人文技術於佛典文獻研究之應用與發展」演講報導

本次演講洪振洲教授以「數位人文技術於佛典文獻研究之發展與應用」為題,探討法鼓文理學院近年的數位人文專案和工具,如何支援佛學研究。 洪教授先提出了兩個問題:「要怎麼利用數位人文技術進行佛學研究?」以及「數位人文技術,要怎麼輔助人文學者進行佛學研究?」但要解決此二問題,必須先去理解現在佛學研究的主流研究方法為何。以蕭振邦〈佛學研究一般方法論〉(2003)書中內容為例,佛學研究的研究方法有四:文本解讀、理論重構、解釋模型的建構和撿別,以及相關解題的後續檢驗。 為了輔助佛學學者的研究,數位人文工具和資源可以從以下三方面進行著手。方向一:以數位技術產生更好的材料(例如:建立資料庫,將經、書、論等相關原始資料放置再一起);方向二:以電腦協助進行大規模的資料整理(例如:資料彙總、內容比對,從大量語料資料中整理出重要的研究內容);方向三:以資訊科學研算法輔助判讀(例如:利用統計分析或人工智慧,彌補文史哲個別研究者閱讀文獻量較少,解釋比較重特殊性和片面性的缺陷)。 而數位人文資源又可以區分出以下五類:基礎文獻資料庫、格式妥善的原始資料、資料分析與應用:結合GIS呈現、資料分析與應用:社會網絡分析,以及資料分析與應用:文字量化分析。洪教授在五類資源中分別提出相關的實例,展現法鼓文理學院近近十年數位人文專案的豐富成果。 中華電子佛典協會(CBETA)研究平台是其中相當成功的案例。不只整合了經典閱讀,還提供全文搜尋、字典內容、經典背景、人名地名參考資料、字詞統計,以及相關研究文獻,是多達兩億中文字的文獻庫。原本資料內容是以往以光碟方式呈現,後來開發並打造新的網頁閱讀介面,未來期望可以開發「搜尋與比對」和「文字數位分析」功能。然而洪教授也不諱言,系統建置的困難在於metadata本身就存有爭議(例如:佛典譯者的認定),致使系統需要極大的彈性來建置相關資料。 這些數位人文專案的資料開放政策,基本上資料都是完全公開下載(除了少許外部合作案),都套用CC授權(BY-NC-SA),所以大家都可以自由使用。全文資料都是符合TEI規範的XML檔案。 在資料分析與應用上,洪教授歸類出三類:結合GIS呈現、社會網絡分析,以及文字量化分析,這是數位人文目前最常用的研究方法。首先,結合GIS呈現的專案,可以參考《佛教傳記文學的視覺化與搜尋》,此資料庫利用Google Earth和高僧傳記的結合,將各高僧的生平要事及足跡,進行視覺化呈現。第二,社會網絡分析的專案,可以參考《高僧傳社會網絡視覺化》,把高僧傳內容所提到的高僧間的往來關係,構建成人際關係的網絡圖。最後,文字量化分析,開發出Search & Comparison的功能,可以找出特定詞彙在佛典中的出現頻率,透過資料聚合,進行統計和視覺化,呈現研究成果。(張天心撰) 演講PPT

【學術報導】「以社會網路分析數位人文領域知識結構」演講報導

本次演講唐牧群教授從社會網絡分析(Social Network Analysis, SNA)的角度,來看數位人文領域的知識整合。唐教授首先介紹社會網絡分析的特性,再來以數位人文文獻為例,進行書目網絡的探討。 以社會網絡分析為方法的研究出版,自2000年初以後逐漸盛行。主要原因在於,一方面以前的資料取得不易,另一方面則是社群網路於近年的增長,使得社會網絡分析的資料取得變得容易。相關研究多集中在美國等國家,台灣亦有相關的研究;研究領域多集中在電腦科學和社會科學。 若將社會網絡分析一詞進行拆解:社會(Social)代表的社會實體可以指個人、群體、機構或社群;網絡(Network)則指關係;分析(Analysis)可指計量、測量和視覺化。社會網絡分析旨在找尋節點之間的關係,幫助研究者找出結構對個體的影響,既可見樹又見林,在社會科學研究中是偏向結構性層面的解釋。而網絡分析測量指標的類型有三。一為凝聚力(cohesion):探討網絡是否聚集或分散;二為中心性(centrality),何為網絡中的中心點或有影響力者;三為群聚性(clustering),探究網絡中是否有次群體或者社群存在。社會網絡假設個體之間彼此是有關係、且互相影響,而網絡結構會促使或者限制個體的行動。 數位人文存在跨領域的特性,不像圖書資訊學或電腦科學是固定的領域,專門機構並不多,也缺少相對應的資料庫。所以唐老師與三位研究者選定的資料集,是以關鍵字輸入Scopus資料庫,以及ADHO期刊的2115篇文章為例,來探討數位人文文獻的多樣性(diversity)和凝聚性(cohesion)。 研究結果發現,數位人文每一篇文獻的平均作者數為1.33人,有近半數的文獻作者只有一人,型式偏向社會科學研究的作者數量。隨著時間演進,數位人文出版主題的豐富性也在增加,儘管不同時代的研究關鍵字與主題不盡相同。 從資料集延伸出三種網絡:一、共同作者網絡:網絡密度相當低,是相當分散的網絡。作者們侷限在彼此認識的小團體,跨國合作也相當少見。此現象可以歸因於數位人文研究很多單一作者,且人文學領域中本來就存在很多子領域,加之語言和國籍的障礙,導致網絡相當分散。二、共被引網絡:利用google scholar找出兩篇文章被未來文章所引用的關係,發現共被引的節點在2000年初大幅增加,而要透過共被引進行主題的分群並不容易。三、書目耦合網絡:各節點呈現出多個次領域的主題群聚。 由以上研究得出結論:數位人文領域的多元性日漸增加;共同作者的網絡則呈現相當零散的樣態,可以視為平行世界模型(Plural worlds model);而共被引網絡和書目耦合網絡,則呈現逐漸聚合的樣態,可歸結為小世界模型(Small world model)。(張天心撰) 演講PPT

【學術報導】「數位人文研究:從人文社會學科領域出發」演講報導

數位人文研究在臺灣已經展開多年,國立臺灣大學成立的數位人文研究中心、中央研究院的數位文化中心等機構的成立,都可以看出數位人文發展的趨勢。今年,臺灣數位人文學會成立,亦隨之組成學術委員會、技術委員會等委會員,協助會務的推動。技術委員會在今年(2016年)10月21日展開了第一場的學術活動——由臺灣大學生物產業傳播暨發展學系的闕河嘉老師帶來「數位人文研究:從人文社會學科領域出發」的演講。 闕河嘉老師從臺大農推系畢業,後來在紐西蘭奧克蘭大學就讀教育學博士,研究領域是鄉村研究和後結構主義,本次演講的主題正是以一個社會科學學者的領域來看現在的數位人文研究。 數位人文是利用資訊工具等技術來進行人文學或社會科學的研究,可以說是技術和社會科學的聯姻。然而使用聯姻二字也可以再思考兩者在發展中的關係。台灣從數位典藏,典藏保存後加值,發展到數位人文,或許不可避免有著技術層面凌駕於人文社會研究的傾向,以不同的演算法來進行人文學或社會科學研究,如詞頻 (Term frequency)、主題叢集 (Topic clustering)或是機器學習 (machine learning)等技術。在這樣的趨勢下,對於研究的詮釋權該落在哪一方,是資訊技術產出之結果,還是人文社會學者本身?對此,闕河嘉老師提出數位人文研究應該為技術與人文學或社會科學的共振 (Synergies),在兩者的平衡合作之下,創造出新的研究方法,像是machine reading加上close reading,在機器閱讀的情況加上自己對於主題的長期關注、深讀的結果,呈現嶄新的研究成果。 資料量雖不及資料探勘和大數據的研究,但社會科學自身有語料庫分析的方法。根據自已的研究主題建立文本集,利用餵入大量文本進行文本的分析,在拆解文本的詞句後,再次連結出意義,配合社會現象作解釋。語料庫分析又分成以語料庫驅動 (Corpus-driven)和以語料庫為本 (Corpus-based),前者為由語料庫分析呈現的數據來作解釋;後者為以語料庫之內容做為佐證補足論述,不論哪一種研究方法,闕老師認為都不要因為落入對於工具本身的美好想像,而除去「人」(dehumanize)在參與其中的重要。 最後闕老師展示由她與陳光華老師開發的語料庫工具—庫博 (Corpro),在文本集已事先建立好的情形下,我們看到如字詞的出現頻次 (frequencies)、共現(Co-occurrence)、搭配關係(collocation)、關鍵詞的上下文(Key word in context)分析等功能的呈現,也能以同一字詞不同主題的分類,看出字句是在何種背景下進行論述,藉此對社會現象等研究主題有更進一步的分析。在今年暑假的臺大夏季學院的「認識數位人文」課程,便有許多學生利用此一工具進行近來社會現象的研究。 此次演講,闕河嘉老師讓我們能從社會科學的角度看到數位人文,去認知到在不同學科領域中的所見所得,也呈現了語料庫分析的方法與工具,使聽者能對人文學及或社會科學的研究有多一層的想像。(許淑莉撰)