基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)分析與設計
發(fā)布時間:2017-08-17 05:24
本文關鍵詞:基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)分析與設計
更多相關文章: 專利檢索 知識發(fā)現(xiàn) 關聯(lián)分析 向量空間模型 夾角余弦
【摘要】:專利技術是反映一個國家或一個企業(yè)技術創(chuàng)新水平和潛在競爭力的重要因素,無論是國家追求高的專利轉化率,還是企業(yè)的技術改進與創(chuàng)新,一個準確有效的專利檢索平臺是連接專利持有方和專利需求方的橋梁,是至關重要的環(huán)節(jié)。目前我國專利數量激增,專利需求市場不斷擴大,專利轉化實施率卻很低,主要原因之一是現(xiàn)存的專利檢索系統(tǒng)大都是基于關鍵詞的簡單檢索,一方面檢索結果過分依賴檢索關鍵詞,另一方面對查詢用戶的要求過高,這都給專利的檢索造成了困難。 解決這些問題,探究方便實用的專利檢索平臺,從宏觀上講能夠促進專利的實施轉化,提高我國的專利水平;從微觀上講,一個適合的專利對于企業(yè)來講就意味著一個發(fā)展機遇,它直接關系到企業(yè)的發(fā)展前景。本論文運用知識發(fā)現(xiàn)方法,提出了一種專利檢索的新思路,旨在構建一個高效、準確的專利檢索平臺,為用戶提供方便、有效的檢索方法。 本論文研究的是基于知識發(fā)現(xiàn)的專利檢索系統(tǒng),討論了現(xiàn)有的專利檢索系統(tǒng)存在的不足,針對現(xiàn)存專利檢索系統(tǒng)的不足,提出了一個基于知識發(fā)現(xiàn)的專利檢索系統(tǒng),即將知識發(fā)現(xiàn)的整個過程融入到專利檢索的過程中,通過知識發(fā)現(xiàn)的過程達到專利檢索的目的。整個專利檢索過程主要包括數據準備、查詢關鍵詞擴展和相似度計算三個部分,是關聯(lián)分析、向量空間模型及相似度計算等知識發(fā)現(xiàn)方法在專利檢索中的綜合應用。首先通過分詞、濾詞及特征篩選將初檢到的專利數據進行預處理,然后應用關聯(lián)分析算法進行查詢關鍵詞擴展,以擴展用戶需求,使檢索結果更全面準確,最后,運用向量空間模型進行專利文本特征表示,并運用夾角余弦進行相似度計算對專利初檢結果進行再排序,以得出最終檢索結果。不同于傳統(tǒng)專利檢索,本文所研究的檢索技術得到的檢索結果不僅是基于用戶所給出的關鍵詞,而且在其基礎上對查詢關鍵詞進行擴展,給用戶提供更加全面準確的檢索結果。論文第五章的實例演示結果也證明了基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)對于提高檢索結果的準確性與實用性起到了有效作用。 論文所研究的專利檢索系統(tǒng)在借鑒國內外當前主流專利檢索系統(tǒng)的基礎上,綜合運用知識發(fā)現(xiàn)與數據挖掘的各種方法,提出了一種新的專利檢索思路,其研究有助于我國專利檢索技術的發(fā)展,并為知識發(fā)現(xiàn)在專利分析研究等諸多技術領域的進一步推廣提供了支持與借鑒,具有積極的現(xiàn)實意義。
【關鍵詞】:專利檢索 知識發(fā)現(xiàn) 關聯(lián)分析 向量空間模型 夾角余弦
【學位授予單位】:東北林業(yè)大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP391.3;G306
【目錄】:
- 摘要4-5
- Abstract5-10
- 1 緒論10-18
- 1.1 研究背景及意義10-13
- 1.1.1 研究背景10-12
- 1.1.2 研究目的意義12-13
- 1.2 國內外研究現(xiàn)狀13-16
- 1.2.1 專利檢索技術國內外研究現(xiàn)狀13-14
- 1.2.2 知識發(fā)現(xiàn)國內外研究現(xiàn)狀14-16
- 1.3 研究內容及技術路線16-18
- 1.3.1 研究內容16-17
- 1.3.2 技術路線17-18
- 2 知識發(fā)現(xiàn)基礎理論介紹18-26
- 2.1 知識發(fā)現(xiàn)概述18-21
- 2.1.1 知識發(fā)現(xiàn)概念18
- 2.1.2 知識發(fā)現(xiàn)背景18-19
- 2.1.3 知識發(fā)現(xiàn)過程19-20
- 2.1.4 知識發(fā)現(xiàn)常用算法介紹20-21
- 2.2 本文中的相關知識發(fā)現(xiàn)算法21-24
- 2.2.1 關聯(lián)分析算法21-23
- 2.2.2 聚類分析算法23-24
- 2.3 本章小結24-26
- 3 基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)分析與總體設計26-37
- 3.1 專利檢索現(xiàn)狀分析26-29
- 3.1.1 信息檢索與專利檢索相關概念26
- 3.1.2 常見專利檢索模型26-27
- 3.1.3 檢索技術的發(fā)展27-28
- 3.1.4 專利的分類方法28-29
- 3.1.5 國內外現(xiàn)有的專利檢索系統(tǒng)29
- 3.2 系統(tǒng)需求與系統(tǒng)目標分析29-32
- 3.2.1 現(xiàn)有專利檢索系統(tǒng)存在的問題及系統(tǒng)需求分析29-30
- 3.2.2 系統(tǒng)總體目標分析30-32
- 3.3 基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)要解決的問題分析32-33
- 3.3.1 專利文檔分詞存在問題的分析32
- 3.3.2 專利文檔特征篩選存在問題分析32-33
- 3.3.3 查詢關鍵詞擴展存在的問題分析33
- 3.3.4 專利特征表示存在的問題分析33
- 3.4 基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)總體設計33-36
- 3.4.1 系統(tǒng)功能結構設計33-35
- 3.4.2 系統(tǒng)流程設計35-36
- 3.5 本章小結36-37
- 4 基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)具體設計37-48
- 4.1 專利名稱及摘要的分詞處理設計37-38
- 4.1.1 分詞算法類型37
- 4.1.2 文檔分詞軟件的選擇37-38
- 4.2 專利文檔特征篩選設計38-39
- 4.2.1 專利文檔特征篩選軟件選擇38
- 4.2.2 專利文檔特征篩選過程設計38-39
- 4.3 基于關聯(lián)分析算法的查詢關鍵詞擴展設計39-42
- 4.3.1 約束條件的設計39-40
- 4.3.2 約束在查詢關鍵詞擴展中的作用40
- 4.3.3 約束性關聯(lián)挖掘算法在查詢擴展中的應用40-42
- 4.4 專利特征表示設計42-45
- 4.4.1 常用專利特征表示方法43-44
- 4.4.2 基于向量空間模型的專利本文特征表示設計44-45
- 4.5 專利文本相似度計算設計45-47
- 4.5.1 文本相似度計算的方法45-46
- 4.5.2 基于夾角余弦的專利文本相似度計算設計46-47
- 4.6 本章小結47-48
- 5 基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)的實例演示48-62
- 5.1 準備工作48
- 5.1.1 系統(tǒng)環(huán)境48
- 5.1.2 實驗數據48
- 5.2 專利文本數據預處理的實現(xiàn)48-50
- 5.2.1 實現(xiàn)背景48
- 5.2.2 實驗具體操作演示48-50
- 5.3 查詢關鍵詞擴展部分的實現(xiàn)50-56
- 5.3.1 實現(xiàn)背景50-51
- 5.3.2 實驗具體操作演示51-56
- 5.4 相似度計算的實現(xiàn)56-60
- 5.4.1 實現(xiàn)背景56
- 5.4.2 實現(xiàn)具體操作演示56-60
- 5.5 結果分析60-61
- 5.6 本章小結61-62
- 結論62-64
- 參考文獻64-67
- 附錄1 國家知識產權局網站的專利初檢結果67-69
- 附錄2 基于相似度的最終排序結果69-71
- 攻讀學位期間發(fā)表的學術論文71-72
- 致謝72-73
【參考文獻】
中國期刊全文數據庫 前10條
1 王立偉;;數據挖掘研究現(xiàn)狀綜述[J];圖書與情報;2008年05期
2 游湘濤,葉施仁,史忠植;多策略通用數據采掘工具MSMiner[J];計算機研究與發(fā)展;2001年05期
3 李艷;季新生;項君;;基于UIMA的知識發(fā)現(xiàn)框架研究及實現(xiàn)[J];計算機工程;2010年21期
4 郭曉;楊乃定;董鐵牛;;基于數據挖掘技術的客戶知識發(fā)現(xiàn)[J];科技管理研究;2010年05期
5 楊丹丹;;基于數據挖掘的企業(yè)專利價值評估方法研究[J];科學學與科學技術管理;2006年02期
6 王惠中;彭安群;;數據挖掘研究現(xiàn)狀及發(fā)展趨勢[J];工礦自動化;2011年02期
7 王克奇;于江濤;李海英;;TRIZ理論在專利檢索系統(tǒng)中的應用研究[J];情報科學;2011年02期
8 張翠玲;論自然語言檢索[J];情報理論與實踐;2003年04期
9 劉翔;施干衛(wèi);丁祖榮;;論文相似度的計算研究——基于VSM模型[J];情報雜志;2010年02期
10 吳思竹;;數據挖掘和知識發(fā)現(xiàn)領域熱點主題分析[J];情報雜志;2010年07期
,本文編號:687336
本文鏈接:http://www.sikaile.net/guanlilunwen/keyanlw/687336.html
教材專著