資料載入處理中...
臺灣人文及社會科學引文索引資料庫系統
:::
網站導覽
國圖首頁
聯絡我們
操作說明
English
行動版
(3.135.203.119)
登入
字型:
**字體大小變更功能,需開啟瀏覽器的JAVASCRIPT,如您的瀏覽器不支援,
IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,
如為IE7以上、Firefoxy或Chrome瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
來源文獻查詢
引文查詢
瀏覽查詢
作者權威檔
引用/點閱統計
我的研究室
資料庫說明
相關網站
來源文獻查詢
/
簡易查詢
/
查詢結果列表
/
詳目列表
:::
詳目顯示
第 1 筆 / 總合 1 筆
/1
頁
來源文獻資料
摘要
外文摘要
引文資料
題名:
引文元數據的自動發現和標注方法研究--以外文引文為例
書刊名:
數據分析與知識發現
作者:
姜霖
/
王東波
出版日期:
2017
卷期:
2017(1)
頁次:
47-54
主題關鍵詞:
引文元數據
;
元數據抽取
;
機器學習
;
神經網絡
;
Bibliographic metadata
;
Metadata extraction
;
Machine learning
;
Neural network
原始連結:
連回原系統網址
相關次數:
被引用次數:期刊(0) 博士論文(0) 專書(0) 專書論文(0)
排除自我引用:0
共同引用:0
點閱:0
【目的】在總結當前引文元數據抽取方法的基礎上,結合語義學知識和機器學習方法,對引文元數據的自動抽取方法進行探索。【方法】實驗中采用神經網絡模型對人工分割過的語料進行詞向量訓練。利用相同類型的元數據會相對集中地出現在向量空間中某一位置的現象,通過支持向量機分類算法實現對元數據的自動歸類和標注。【結果】在以外文引文數據作為測試集的實驗中,本文方法取得了較高的準確率和召回率,特別是針對引文中含有多種語言和縮寫的現象,具有較好的處理能力。【局限】在對于引文元數據時間內容的細粒度抽取中存在一定的局限性。【結論】實驗結果表明,此方法在引文元數據的自動發現和標注上具有良好的效果,并能很大程度地提高方法的適用性和容錯率。
以文找文
[Objective]This paper proposes a new method to automatically extract bibliographic metadata, with the help of semantic knowledge and machine learning technologies.[Methods]We used the neural network model to create word vectors from manually split data, and then found that same type of metadata is relatively concentrated at certain locations in the vector space. Thus, we proposed a new SVM classification algorithm to classify and annotate the bibliographic metadata automatically.[Results]The proposed method achieved high recall and precision rates with citation data,especially for citations with various languages and abbreviations.[Limitations]The fine-grained extraction of the time related content could be improved.[Conclusions]The proposed method could effectively detect and tag bibliographic metadata, and improve the system's compatibility and fault tolerance ability.
以文找文
期刊論文
1.
蔣新(2003)。英美學術文獻的幾種主要引文方式。圖書與情報,2003(3),26-30。
延伸查詢
2.
李朝光、張銘、鄧志鴻(2002)。論文元數據信息的自動抽取。計算機工程與應用,38(21),189-191。
延伸查詢
3.
Day, M. Y.、Tsai, R. T. H.、Sung, C. L.(2007)。Reference Metadata Extraction Using a Hierarchical Knowledge Representation Framework。Decision Support Systems,43(1),152-167。
4.
周練(2015)。Word2Vec的工作原理及應用探究。科技情報開發與經濟,2015(2),145-148。
延伸查詢
會議論文
1.
Lafferty, John D.、McCallum, Andrew、Pereira, Fernando C. N.(2001)。Conditional random fields: Probabilistic models for segmenting and labeling sequence data。The 18th International Conference on Machine Learning,282-289。
2.
Wei, W.、King, I.、Lee, J. H. M.(2007)。Bibliographic Attributes Extraction with Layer-upon-Layer Tagging。9th International Conference on Document Analysis and Recognition。IEEE。804-808。
3.
Besagni, D.、Belaïd, A.、Benet, N.(2003)。A Segmentation Method for Bibliographic References by Contextual Tagging of Fields。7th International Conference on Document Analysis and Recognition。IEEE。384-388。
4.
Cortez, E.、da Silva, A. S.、Gonçalves, M. A.(2007)。FLUX-CIM: Flexible Unsupervised Extraction of Citation Metadata。7th ACM/IEEE Joint Conference on Digital Libraries。ACM。215-224。
5.
Huang, I. A.、Ho, J. M.、Kao, H. Y.(2004)。Extracting Citation Metadata from Online Publication Lists Using BLAST。8th Pacific-Asia Conference, PAKDD 2004。Springer Berlin Heidelberg。539-548。
6.
Chen, C. C.、Yang, K. H.、Kao, H. Y.(2008)。BibPro: A Citation Parser Based on Sequence Alignment Techniques。22nd International Conference on Advanced Information Networking and Applications- Workshops。IEEE。1175-1180。
7.
Han, H.、Giles, C. L.、Manavoglu, E.(2003)。Automatic Document Metadata Extraction Using Support Vector Machines。2003 Joint Conference on Digital Libraries。IEEE。37-48。
8.
Peng, F.、McCallum, A.(2004)。Accurate Information Extraction from Research Papers Using Conditional Random Fields。Human Language Technology Conference of the North American Chapter of the Association-for-Computational-Linguistics,329-336。
9.
Yu, J.、Fan, X.(2007)。Metadata Extraction from Chinese Research Papers Based on Conditional Random Fields。4th International Conference on Fuzzy Systems and Knowledge Discovery。IEEE。497-501。
研究報告
1.
Stitson, M. O.、Weston, J. A. E.(1996)。Theory of Support Vector Machines。London:University of London。
單篇論文
1.
Mikolov, T.,Le, Q. V.,Sutskever, I.(2013)。Exploiting Similarities Among Languages for Machine Translation。
其他
1.
Mikolov, T.。Word2Vec Code,http://word2vec.googlecode.com/svn/trunk/.。
推文
當script無法執行時可按︰
推文
推薦
當script無法執行時可按︰
推薦
引用網址
當script無法執行時可按︰
引用網址
引用嵌入語法
當script無法執行時可按︰
引用嵌入語法
轉寄
當script無法執行時可按︰
轉寄
top
:::
相關期刊
相關論文
相關專書
相關著作
熱門點閱
1.
融合表示學習與機器學習的專利科學引文標題自動抽取研究
無相關博士論文
無相關書籍
無相關著作
無相關點閱
QR Code