資料載入處理中...
臺灣人文及社會科學引文索引資料庫系統
:::
網站導覽
國圖首頁
聯絡我們
操作說明
English
行動版
(18.191.111.30)
登入
字型:
**字體大小變更功能,需開啟瀏覽器的JAVASCRIPT,如您的瀏覽器不支援,
IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,
如為IE7以上、Firefoxy或Chrome瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
來源文獻查詢
引文查詢
瀏覽查詢
作者權威檔
引用/點閱統計
我的研究室
資料庫說明
相關網站
來源文獻查詢
/
簡易查詢
/
查詢結果列表
/
詳目列表
:::
詳目顯示
第 1 筆 / 總合 1 筆
/1
頁
來源文獻資料
摘要
外文摘要
引文資料
題名:
中文全文文件群集索引理論研究與實證
書刊名:
圖書與資訊學刊
作者:
黃雲龍
作者(外文):
Huang, Yun-long
出版日期:
1998
卷期:
24
頁次:
頁44-68
主題關鍵詞:
自動索引
;
群集索引
;
資訊檢索
;
向量空間模型
;
群集索引模型
;
奇異值分解
;
Automatic indexing
;
Cluster indexing
;
Information retrieval
;
Vector space model
;
VSM
;
Cluster index model
;
CIM
;
Singular value decomposition
;
SVD
原始連結:
連回原系統網址
相關次數:
被引用次數:期刊(0) 博士論文(0) 專書(0) 專書論文(0)
排除自我引用:0
共同引用:0
點閱:36
當前商業應用的全文檢索系統仍以字串比對的全文檢視法,配合布林查詢介面為 主流,這種系統過於簡化電子文件檢索系統環境的形式與內容關係。本研究根據向量空間模 型 (VSM),探討索引詞彙的形式與文件內容關係,運用奇異值分析技術 (SVD),建構中文全 文文件的群集索引模型 (CIM)。 本文從兒童日報全文語料庫中選取醫藥新聞 502 篇文件, 經由各項實驗設計初步獲致以下結論:CIM 索引的效果優於傳統 VSM,而且可以提昇其效能 ,達到具有權威控制機制下的索引效果。
以文找文
Since most popular commercialized systems for full text document retrieval are designed with full text scanning and Boolean logic query mode. These systems use an oversimplified relationship between the indexing form and the content of document. We use Singular Value Decomposition (SVD) try to develop a Cluster Indexing Model (CIM) based on Vector Space Model (VSM) in order to explore the index theory of cluster indexing for Chinese full test document. Test corpus was selected from Children's Daily News: the medicine news( MED) with 502 documents. Under a seriesx of experiments, the following conclusions are discovered: we find the indexing performance of CIM is better than traditional VSM, and has almost equivalent effectiveness of the authority control of index terms.
以文找文
期刊論文
1.
Deerwester, Scott、Dumais, Susan T.、Furnas, George W.、Landauer, Thomas K.、Harshman, Richard(1990)。Indexing by Latent Semantic Analysis。Journal of the American Society for Information Science,41(6),391-407。
2.
Iivonen, M.(1995)。Consistency in the Selection of Search Concepts and Search Terms。Information Processing & Management,31(2),173-190。
3.
Shannon, C. E.(1948)。A Hathematical Theory of Communication。Bell System Technical Journal,27,379-423+623-656。
4.
Wong, S. K. M.、Yao, Y. Y.(1992)。An Introduction-Theoretic Measure of Term Specificity。JASIS,43(1),54-61。
5.
Everett, D. M.、Cater, S. C.(1992)。Topology of Document Retrieval Systems。Journal of the American Society for Information Science,43(10),659。
6.
Can, F.、Ozkarahan, E. A.(1987)。Computation of Term/ Document Discrimination Values by Use of the Cover Coefficient Concept。JASIS,38(3),171。
7.
Can, F.(1994)。On The Efficiency of Best-Match Cluster Searches。Information Processing & Management,30(3),343-361。
8.
Lu, X.(1990)。Document Retrieval: a Structural Approach。Information Processing & Management,26(2),209-218。
9.
Kristensen, J.(1993)。Expanding End-User's Query Statements for Free Text Searching with a Search-Aid Thesaurus。Information Processing & Management,29(6),733-744。
10.
Yang, Y.、Wilbur, J.(1996)。Using Corpus Statistics to Remove Redundant Words in Text Categorization。JASIS,47(5),357-369。
11.
Crouch, C. J.(1990)。An Approach to the Automatic Construction of Global Thesauri。Information Processing & Management,26(5),632。
12.
Yang, Y.、Chute, C. G.(1994)。An Example-Based Mapping Method for Text Categorization and Retrieval。ACM Transaction on Information Systems,12(3),252-277。
13.
Borkr, H.、Bernick, M.(1963)。Automatic Document Classification。Journal of Association of Computing Machinery,11,151-162。
14.
Kurfeerst, M.、Asher, J. W.(1968)。A Factor Analysis of the Education Laws of Pennsylvania。Information Storage & Retrieval,4,257-270。
15.
Burgin, R.(1995)。The Retrieval Effectiveness of Five Clustering Algorithms as a Function of Indexing Exhaustivity。JASIS,46(8),562-572。
16.
Fox, A. E.、Koll, M. B.(1988)。Practical Enhanced Boolean Retrieval: Experiences with the SMART and SIRE Systems。Information Processing & Management,24(3),257-267。
會議論文
1.
簡立峰(1996)。尋易系統(Csmart)與中文智慧型資訊檢索。在21世紀資訊科學與技術的展望國際學術研討會,世界新聞傳播學院圖書資訊學系、國家圖書館 (會議日期: 1996/11/07-09)。
延伸查詢
2.
謝清俊(1992)。從二十五史全文資料庫的經驗談中文文件檢索系統設計的考量。第三屆中文信息處理國際會議,(會議日期: 1992/10/16-28)。北京。
延伸查詢
3.
謝清俊(1994)。語文工作與資訊發展--從電子文件的發展談對語文研究的期盼。在當前語文問題學術研討會,行政院國家科學委員會、國立台灣大學中國文學系 (會議日期: 1994/06/26)。
延伸查詢
4.
黃蕙株(1994)。索引典的基礎理論。索引典理論與實務研討會。台北市:中國圖書館學會。20-34。
延伸查詢
5.
Salton, G.(1975)。A Theory of Indexing。Regional Conference Series Application Mathematics。Society for Industrial and Applied Mathematics。55。
6.
Salton, G.(1991)。The Smart Document Retrieval Project。The 14th annual international ACM SIGIR conference on Research and development in information retrieval,357-358。
7.
Lewis, D. D.(1992)。An Evaluation of Phrasal and Clustering Representations on a Text Categorization Task。The 15th annual international ACM SIGIR conference on Research and development in information retrieval,37-50。
8.
Wilkinson, R.、Hingston, P.(1991)。Using the Cosine Measure in A Neural Network for Document Retrieval。The 14th annual international ACM SIGIR conference on Research and development in information retrieval,202-210。
9.
Syu, I.、Lang, S. D.、Deo, N.(1996)。Incorporating Latent Semantic Indexing into a Neural Network Model for Information Retrieval。The 5th International Conference on Information and Knowledge Management。
10.
Yang, Y.、Chute, C. G.(1993)。An Application of Least Squares Fit Mapping to Text Information Retrieval。The 16th annual international ACM SIGIR conference on Research and development in information retrieval,281-290。
11.
Wong, S. K. M.、Ziarko, W.、Wong, P. C. N.(1985)。Generalized Vector Space Model In Information Retrieval。The 8th annual international ACM SIGIR conference on Research and development in information retrieval,18-25。
12.
Yang, Y.(1995)。Noise Reduction in a Statistical Approach to Text Categorization。The 18th annual international ACM SIGIR conference on Research and development in information retrieval,256-263。
13.
Lang, Sheau-Dong(1996)。Tutorial on Text Retrieval Techniques and Their WWW Applications。資訊擷取技術及其在WWW之應用研討會,國立清華大學 (會議日期: 1996/08/13)。
延伸查詢
14.
Nie, J. Y.、Brisebois, M.、Ren, X.(1996)。On Chinese Text Retrieval。The 19th annual international ACM SIGIR conference on Research and development in information retrieval,225-233。
15.
謝清俊(1996)。電子古籍中的缺字問題。第一屆中國文字學會學術討論會,(會議日期: 1996年8月25-30日)。天津。
延伸查詢
學位論文
1.
楊允言(1993)。文件自動分類及其相似性排序(碩士論文)。國立清華大學。
延伸查詢
2.
陳淑美(1992)。財經新聞自動分類之研究(碩士論文)。國立臺灣大學。
延伸查詢
圖書
1.
Salton, G.(1989)。Automatic Text Processing。Addison-Wesley Publishing Company。
2.
鐘聖校(1993)。認知心理學。台北市:心理出版社。
延伸查詢
3.
方師鐸(1970)。國語詞彙學構詞篇。益智書局。
延伸查詢
4.
Salton, G.(1971)。The SMART Retrieval System--Experiments in Automatic Document Processing。Englewood Cliffs, N. J.:Prentice-Hall, Inc.。
5.
Press, Willian H.、Teukolsky, Saul A.、Vetterling, William T.、Flannery, Brian P.(1992)。Numerical Recipes in C。Cambridge University Press。
6.
Salton, Gerald、McGill, Michael J.(1983)。Introduction to modern information retrieval。McGraw-Hill。
其他
1.
朱邦復(1993)。概念網路。
延伸查詢
2.
Fox, A. E.(19961126)。Technical Report 83-560,http://cs-tr.cs.cornell.edu/。
3.
Buckley, C.(1996)。Technical Report 85-686,http://cs-tr.cs.cornell.edu/。
圖書論文
1.
謝清俊、林晰(1997)。中央研究院古籍全文資料庫的發展概要。中央研究院資訊科學研究所文獻處理實驗室技術報告。
延伸查詢
2.
趙元任(1992)。語言成分裡意義有關的程度問題。中國現代語文學的開拓與發展:趙元任語言學論文集。北京市:清華大學出版社。
延伸查詢
推文
當script無法執行時可按︰
推文
推薦
當script無法執行時可按︰
推薦
引用網址
當script無法執行時可按︰
引用網址
引用嵌入語法
當script無法執行時可按︰
引用嵌入語法
轉寄
當script無法執行時可按︰
轉寄
top
:::
相關期刊
相關論文
相關專書
相關著作
熱門點閱
1.
利用相關回饋建立概念化的使用者興趣檔以協助使用者進行網頁查詢
2.
網路文件自動分類
1.
中文全文文件群集索引理論研究--向量空間模型的建構
無相關書籍
無相關著作
1.
中文全文資訊檢索研究架構與重要議題探討
QR Code