在資訊爆炸的時代中,數位化的資料與資訊,呈現了大幅成長的現象。數位資料的普遍存在,雖然營造出便利使用的生活環境,但同時也對資訊處理領域造成了技術性的挑戰。繼資料管理的議題之後,接踵而來的議題便是所謂的資料探勘(data mining,或稱資料發掘)議題。資料探勘不單牽涉到資料管理,同時也牽涉到部分統計與機率的理論,可謂是頗具挑戰的研究領域。對巨量文件的管理應用來說,如何搜尋整理相關的文件,並給予相關文件㆒定的重要性,便顯得相當的重要,這也是資料探勘技術中的㆒種重要的應用領域。就目前的資訊技術發展來看,巨量文件的搜尋是由搜尋引擎技術來予以解決,至於更具智慧的搜尋技術(也就是分析使用者的各項活動來給予更貼切的搜尋結果),目前則仍正在大力發展之㆗。不論是使用者行為分析或是文件集的統計分析,都是資料探勘技術所欲強調與發展的議題。本文針對將文件集的各項探勘技術,做一概念性的介紹.