【目的/意義】互聯網上的信息資源日益豐富,開放信息源成為一些領域知識獲取的重要渠道。本文以中醫領域為例,為向本體和知識圖譜的構建提供數據,提出了一種基于開放信息源的知識挖掘方法。【方法/過程】在缺乏領域訓練語料的情況下,先獲取一部分語料,使用規則模板、詞向量結合詞分類的方法獲取部分領域實體詞,通過回標文本語料得到訓練集,再使用條件隨機場進行實體的識別和抽取。【結果/結論】本文提出的規則結合SVMCRF實體抽取模型具有較高的有效性和通用性。在所使用的中醫實體中,方劑和癥型實體的抽取準確率仍待進一步提升。