:::

詳目顯示

回上一頁
題名:中央研究院古籍全文資料庫的發展概要
書刊名:International Journal of Computational Linguistics & Chinese Language Processing
作者:謝清俊林晰
作者(外文):Hsieh, Ching-chunLin, Shih
出版日期:1997
卷期:2:1
頁次:頁105-130
主題關鍵詞:全文資料庫標誌全文檢索字形資料庫內容檢索Full-text databaseMarkupFull-text searchHTMLCTPFont databaseContent index
原始連結:連回原系統網址new window
相關次數:
  • 被引用次數被引用次數:期刊(0) 博士論文(1) 專書(0) 專書論文(0)
  • 排除自我引用排除自我引用:0
  • 共同引用共同引用:0
  • 點閱點閱:39
     中央研究院利用計算機處理古籍已有十二年,其中以全文資料庫的發展最受矚目,目前上線的全文資料庫文總字數已超過一億一仟萬字,其所用的技術則全由院內同仁自行開發。參與製作資料庫共有五所:史語所、臺史所、資訊所、近史所、文哲所,以及本院計算中心,總統府國史館亦積極參與清史資料庫之開發。1995年開始,有些大學與本院發展合作關係共享古籍資料,包括國內的中山、中正、師大各大學,國外的倫敦大學、史丹佛大學、密西根大學、香港中文大學等。本文首先介紹各全文資料庫的發展現況,其次介紹自行開發的相關技術,包括:全文資料庫的結構、文章的標誌系統、資料登錄之管理、缺字造字之管理以及目前各單位相關的研究發展計劃等。
     A survey of full-text data bases and related text processing techniques for Chinese ancient document in the past 12 years in Academia Sinica is presented in this paper. Five Institutes, (namely the Institute of History and phonology, the Institute of Taiwan History, the Institute of Literature and Philosophy, the Institute of Information Science and the Institute of Modern History) and the Computing Centere of Academia Sinica actively participated in this long range project since 1984. Beside, the Archival Library of National History also participated in developing the database of Ching Dynasty. Since 1995, some co-laboration projects with other Universities, such as London University in England, Stanford University, Michigan University in USA, Chinese University in Hong Kong and Chung-Cheng University, Chung-San University and National Taiwan Normal University in Taiwan have been launched to produce more digital texts. Now, the total character count of on-line full-text data bases are over 115 millions, and the data bases of more then 80 million characters are coming. In this report, we also survey some important techniques developed, including the structure of full-text database, the ways of handling missing characters, the management of data entry jobs, the development of markup system, etc. Besides, the status of some on going related research projects are summarized in this paper as a future perspective of the development of digital Chinese ancient documents.
期刊論文
1.謝清俊(1995)。電子佛典的意義。人生雜誌,147,32-39。  延伸查詢new window
2.簡立峰(1995)。A Model-Based Signature File Approach for Full-text Retrieval of Chinese Document Databases。Computer Processing of Chinese and Oriental Languages。  new window
會議論文
1.謝清俊、莊德明、張翠玲、許婉蓉(1995)。中文字形資料庫的設計與應用。第六屆中國文字學全國學術研討會,中興大學中國文學系所、中國文字學會 (會議日期: 1995年4月29日)。臺中。  延伸查詢new window
2.謝清俊(1996)。電子古籍中的缺字問題。第一屆中國文字學會學術討論會,(會議日期: 1996年8月25-30日)。天津。  延伸查詢new window
3.謝清俊(1996)。談資訊的定義與性質。資訊科技與社會轉型學術研討會,(會議日期: 1996年12月20日)。  延伸查詢new window
4.簡立峰。Fast and Quasi-Natural Language Search for Gigabytes of Chinese Texts。ACM-SIGIR'95。  new window
5.簡立峰。尋易(Csmart): A High Performance Chinese Document Retrieval System。ICCPCOL95。  new window
6.簡立峰。適合大量中文文件全文檢索的文件索引及壓縮技術。ROCLING95。  延伸查詢new window
7.陳昭珍(1995)。建立古籍多版本超文件之探討--以文心雕龍為例。中國古籍整理研究出版現代化國際會議。  延伸查詢new window
8.謝清俊(1996)。A Descriptive Method for Re-engineering Hanzi Information Interchange Codes。漢字字碼與資料庫國際研討會,(會議日期: 1996年10月4日)。京都:東京。  延伸查詢new window
9.謝清俊(1996)。漢字的字形與編碼。漢字字碼與資料庫國際研討會,(會議日期: 1996年10月4日)。京都:東京。  延伸查詢new window
10.謝清俊、莊德明(1995)。古籍校讀工具「中文文獻處理系統」的設計。中國古籍整理研究出版現代化國際會議。  延伸查詢new window
11.王梅玲、郭怡雯、李明錦、張翠玲(1995)。內容賞析資料庫初探。中國古籍整理研究出版現代化國際會議。  延伸查詢new window
圖書
1.(1996)。中文全文檢索統FTMS第三版使用指引。中央研究院算中心。  延伸查詢new window
2.SNOW, C. P.(1964)。The Two Cultures and A Second Look。  new window
3.SNOW, C. P.(1959)。The Two Cultures。  new window
4.張俊盛(1995)。Linguistic Markup: ROCLING Text Corpus Exchange Format。  new window
單篇論文
1.莊德明(1995)。以心經為例說明如何利用計算機處理佛經的多版本,中華佛學研究所。  延伸查詢new window
 
 
 
 
第一頁 上一頁 下一頁 最後一頁 top
QR Code
QRCODE