【目的】針對專利引文類別繁多的問題,研究自動識別其中專利科學引文這一特定類別的方法,進而準確抽取專利科學引文的標題特征項,支撐后續專利科學引文深度分析與挖掘。【方法】引入表示學習方法 Doc2Vec實現專利科學引文整體的語義向量表示,結合機器學習分類方法實現專利科學引文這一特定類別的識別;在此基礎上,利用表示學習方法實現專利科學引文標題等內容元數據的語義向量表示,結合機器學習分類方法抽取專利科學引文標題。【結果】在基因領域專利的實驗中,專利科學引文的識別精確率達到99.27%,專利科學引文標題抽取精確率達到92.59%,抽取精確率較單純的機器學習方法提高5.96%。【局限】人工標注訓練集較為耗時;對實驗數據格式有一定要求。【結論】本文方法在專利科學引文識別和標題抽取上具有良好效果。