資料載入處理中...
臺灣人文及社會科學引文索引資料庫系統
:::
網站導覽
國圖首頁
聯絡我們
操作說明
English
行動版
(3.144.228.19)
登入
字型:
**字體大小變更功能,需開啟瀏覽器的JAVASCRIPT,如您的瀏覽器不支援,
IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,
如為IE7以上、Firefoxy或Chrome瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
來源文獻查詢
引文查詢
瀏覽查詢
作者權威檔
引用/點閱統計
我的研究室
資料庫說明
相關網站
來源文獻查詢
/
簡易查詢
/
查詢結果列表
/
詳目列表
:::
詳目顯示
第 1 筆 / 總合 1 筆
/1
頁
來源文獻資料
摘要
外文摘要
引文資料
題名:
網路文件自動分類
書刊名:
臺大管理論叢
作者:
顧皓光
/
莊裕澤
作者(外文):
Ku, Hao-kuang
/
Joung, Yuh-jzer
出版日期:
1998
卷期:
9:1
頁次:
頁201-242
主題關鍵詞:
資訊檢索
;
文件自動分類
;
向量空間模型
;
超文件連結
;
HTML TAG
;
Information retrieval
;
Automatic documents classification
;
Vector space model
;
Hypertext links
原始連結:
連回原系統網址
相關次數:
被引用次數:期刊(0) 博士論文(0) 專書(0) 專書論文(0)
排除自我引用:0
共同引用:0
點閱:31
隨著網路的蓬勃發展,網路上的資訊也相對增加,絕大多數使用過Internet的人,對網路上多采多姿的資訊,均會驚訝不已;但讚嘆之餘,使用者也會發現,大量且缺乏整理的資訊反而了造成更大的困擾。新資訊時代裡,最根本的問題之一就是:如何在浩翰如海的資訊空間裡,快速的找到並取得所需的資訊。 本論文提出一個適合網路文件自動分類的模型,藉以幫助使用者處理這些資訊。首先,我們使用網路資源蒐集程式將蕃薯藤搜尋引擎上的文件取回,接著使用這些已經具備分類特性的文件當作訓練文件,在機器中建立一個可以模擬人工的向量空間模型。再由測試資料決定系統正確率。另外,鑑於Web文件提供了超文件連結的特性、HTML TAG標籤加註的功能,我們充分利用這兩項特性,設計實驗方法,藉以提昇系統分類能力。 實驗結果顯示我們提出的方法在13個法本類別條件下,可以正確辨識文件集合中71.2%的文件,辨識錯誤的文件有24.3%,另外有4.5%的文件是屬於無法辨識的文件。
以文找文
As WWW becomes increasingly popular, more and more Chinese documents have been placed in the web, and so a classification of the documents is often useful in helping the users to find an appropriate document. In this paper, we propose and build an automatic web document classification system. This system learns its classification skill from the well-known YAM search engine site, whose documents are classified manually by a group of experts. The system also takes the advantage of web tags such as links, highlighting, and document structures to enhance the certainty of classification. Our experiments show that, given a system of 13 disjointed classes, the proposed scheme can correctly classify 71.2% of the documents. For the rest of the documents, 4.5% of them cannot be classified, and 24.3% of them will be mis-classified.
以文找文
期刊論文
1.
Sproat, Richard、石基琳(1990)。A Statistical Method for Finding Word Boundaries in Chinese Text。Computer Processing of Chinese and Oriental Languages: an international journal of the Chinese Language Computer Society,4(4),336-351。
2.
Croft, W. Bruced、Turtle, Howard R.(1993)。Retrieval Strategies for Hypertext。Information Processing & Management,29(3),313-324。
3.
果芸(1996)。網際網路發展之回顧與展望。資訊與電腦,196,26-31。
延伸查詢
4.
Aboud, M.、Chrisment, C.、Razouk, R.、Sedes, F.、Soule-Dupuy, C.(1993)。Querying a Hypertext Information Retrieval System by the use of Classification。Information Processing & Management,29(3),387-396。
5.
Dunlop, M. D.、van Rusbergen, C. J.(1993)。Hypermedia and Free Text Retrieval。Information Processing and Management,29(3),287-298。
6.
Wong, Jacqueline W. T.、Kan, W. K.、Young, Glibert(1996)。ACTION: Automatic Classification For Full-Text Document。ACM-SIGIR,30(1),26-41。
7.
Savoy, Jacques(1996)。An Extended Vector-Processing Scheme for Searching Information in Hypertext。Information Processing & Management,32(2),155-170。
8.
Lucarella, D.、Zanzi, A.(1993)。Information Retrieval from Hypertext: An Approach Using Plausible Inference。Information Processing & Management,29(3),299-312。
9.
Valery I, F.、Nick I, K.、Jacob, S.(1993)。One Approach TO Classification of Users and Automatic Clustering of Documents。Information Processing & Management,29(2),187-195。
會議論文
1.
Broder, Andrei Z.、Glassman, Steven C.、Manasse, Mark S.(1997)。Syntactic Clustering of the Web。沒有紀錄。
2.
Yuwono, Budi、Lam, Savio L. Y.、Ying, Jeffy H.、李迪麟(1995)。A World Wide Web Resource Discovery System。沒有紀錄。
研究報告
1.
中央研究院中文詞知識庫小組(1993)。中文詞類分析技術報告。沒有紀錄。
延伸查詢
學位論文
1.
洪振超(1996)。網路首頁資源之國語語音檢索及其動態語言模型技術,0。
延伸查詢
2.
黃雲龍(1997)。中文全文文件群集索引理論研究-向量空間模型(Vector-Space Model)的建構,0。
延伸查詢
3.
陳淑美(1992)。財經新聞自動分類研究,0。
延伸查詢
4.
彭載衍(1993)。中文詞彙歧異之研究-斷詞與詞性標示,0。
延伸查詢
5.
楊允言(1993)。文件自動分類及其相似性排序,0。
延伸查詢
6.
蔣俊霞(1994)。中文文件自動分類之探討,0。
延伸查詢
7.
劉孟達(1995)。中文詞及自動產生及中文拼字檢查,0。
延伸查詢
圖書
1.
Frankes, William B.、Baeza-Yates, Ricardo(1992)。Information Retrieval Data Structures & Algorithms。Englewood Cliffs, NJ:Prentice Hall。
2.
Salton, Gerald、McGill, Michael J.(1983)。Introduction to modern information retrieval。McGraw-Hill。
3.
Charniak, gEugene(1993)。Statistical Language Learning。Statistical Language Learning。沒有紀錄。
4.
Heaps, H. S.(1978)。Information Retrieval Computational and Theoretical Aspects。Information Retrieval Computational and Theoretical Aspects。沒有紀錄。
5.
Oddy, R. N.、Robertson, S. E.、Van Rijsbergen, C. J.、Williams, P. W.(1981)。Information Retrieval Research。Information Retrieval Research。沒有紀錄。
其他
1.
Berners-Less, T.,Conolly, D.(1995)。Hypertext Markup Language - 2.0. Request for Comments 1866,0。
2.
XML(1997)。Document Object Model (XML) Level 1, W3C Working Draft 9-October-1997,0。
推文
當script無法執行時可按︰
推文
推薦
當script無法執行時可按︰
推薦
引用網址
當script無法執行時可按︰
引用網址
引用嵌入語法
當script無法執行時可按︰
引用嵌入語法
轉寄
當script無法執行時可按︰
轉寄
top
:::
相關期刊
相關論文
相關專書
相關著作
熱門點閱
1.
利用相關回饋建立概念化的使用者興趣檔以協助使用者進行網頁查詢
2.
中文全文文件群集索引理論研究與實證
1.
中文全文文件群集索引理論研究--向量空間模型的建構
無相關書籍
無相關著作
無相關點閱
QR Code