基于神經(jīng)網(wǎng)絡(luò)的專利智能侵權(quán)檢索研究
發(fā)布時間:2017-08-14 21:23
本文關(guān)鍵詞:基于神經(jīng)網(wǎng)絡(luò)的專利智能侵權(quán)檢索研究
更多相關(guān)文章: 侵權(quán)檢索 中文專利 SOM 模糊聚類 知識產(chǎn)權(quán)
【摘要】:專利作為知識產(chǎn)權(quán)中至關(guān)重要的一部分,已經(jīng)受到了各社會經(jīng)濟體的普遍關(guān)注,日益健全的專利保護機制一方面極大推動了專利申請量和授權(quán)量的增加,另一方面也在很大程度上導(dǎo)致了專利侵權(quán)情況的頻繁出現(xiàn)。面對專利侵權(quán)案件的發(fā)生,原告與被告可能面臨長時間的法律訴訟以及高額的賠償,對于涉及專利侵權(quán)的任何企業(yè)和個人,這都意味著沉重的負擔(dān)和巨大的成本。因此,為了有效規(guī)避上述風(fēng)險,,并為相關(guān)利益人提供權(quán)益保護,合理而高效的專利侵權(quán)檢索方法顯得尤為重要。 本文在研究專利侵權(quán)檢索研究現(xiàn)狀的基礎(chǔ)上,以專利文獻的文本數(shù)據(jù)為基礎(chǔ),采用文本挖掘技術(shù),提出一種基于自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)算法的中文專利侵權(quán)檢索模型,主要內(nèi)容包括中文專利文本數(shù)據(jù)的采集、文本信息的加工和優(yōu)化、中文專利侵權(quán)檢索模型的構(gòu)建及其主要功能模塊的實現(xiàn)。本文選取專利說明書中的權(quán)項要求作為數(shù)據(jù)源。在文本預(yù)處理部分,首先采用語料庫編制技術(shù)領(lǐng)域詞表和停用詞表,并對專利數(shù)據(jù)集進行專利篩選;其次,在復(fù)旦大學(xué)自然語言處理系統(tǒng)的基礎(chǔ)上,提出一種適合于中文專利權(quán)利要求書的分詞算法——TextRank算法,對實驗數(shù)據(jù)進行分詞處理;最后,通過對專利權(quán)項要求的關(guān)鍵詞進行提取,并計算關(guān)鍵詞在專利中所占的權(quán)重大小,得到專利-關(guān)鍵詞共現(xiàn)矩陣。在中文專利侵權(quán)檢索模型構(gòu)建部分,本文采用SOM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,以Matlab軟件為平臺,實現(xiàn)被檢專利的聚類分析,并通過進一步歸類處理,檢索出待檢專利的疑似侵權(quán)專利組,最后,通過聚類結(jié)果的評價及專利權(quán)項要求書的比對分析,證明該方法具有可行性。另外,本文完成了上述模型的基本功能模塊的實現(xiàn)。 面對海量的專利文本信息,本文提出的方法旨在幫助可能涉及專利侵權(quán)的利益相關(guān)者快速方便地進行中文專利的侵權(quán)檢索,一方面為企業(yè)的研發(fā)人員或?qū)@暾堈咛峁?zhǔn)確、全面的侵權(quán)檢索結(jié)果,避免新產(chǎn)品侵權(quán)或申請專利失敗,另一方面為專利審查人員提供快速、精確的專利審查方法,提高專利審查的時效性和準(zhǔn)確率。實驗結(jié)果表明,該方法能夠在一定程度上精簡檢索過程、提高檢索準(zhǔn)確度。
【關(guān)鍵詞】:侵權(quán)檢索 中文專利 SOM 模糊聚類 知識產(chǎn)權(quán)
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:G306;G252.7
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-19
- 1.1 研究背景及意義9-11
- 1.1.1 問題提出10
- 1.1.2 研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-15
- 1.2.1 國外研究現(xiàn)狀11-12
- 1.2.2 國內(nèi)研究現(xiàn)狀12-14
- 1.2.3 研究現(xiàn)狀評述14-15
- 1.3 本文主要研究工作15-19
- 1.3.1 研究內(nèi)容和研究路線15-17
- 1.3.2 論文組織結(jié)構(gòu)17-19
- 第2章 相關(guān)理論背景19-33
- 2.1 專利侵權(quán)檢索概述19-22
- 2.1.1 專利檢索的類型19-20
- 2.1.2 專利侵權(quán)檢索20-22
- 2.2 SOM 神經(jīng)網(wǎng)絡(luò)理論22-26
- 2.2.1 SOM 神經(jīng)網(wǎng)絡(luò)模型23-24
- 2.2.2 SOM 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法24-26
- 2.3 專利信息的文本挖掘理論26-29
- 2.3.1 專利文本挖掘概念26-27
- 2.3.2 TextRank 算法27
- 2.3.3 語料庫理論27-28
- 2.3.4 專利文本挖掘流程28-29
- 2.4 系統(tǒng)開發(fā)環(huán)境介紹29-31
- 2.4.1 Visual Studio 2010 介紹29-31
- 2.4.2 Microsoft SQL Server 介紹31
- 2.5 本章小結(jié)31-33
- 第3章 專利數(shù)據(jù)采集及文本預(yù)處理33-53
- 3.1 中文專利數(shù)據(jù)來源及特征33-35
- 3.1.1 中文專利數(shù)據(jù)來源33
- 3.1.2 中文專利權(quán)項要求書的內(nèi)容及結(jié)構(gòu)特點33-35
- 3.2 專利數(shù)據(jù)的文本預(yù)處理35-51
- 3.2.1 專利領(lǐng)域語料庫的構(gòu)建35-37
- 3.2.2 專利領(lǐng)域的語料預(yù)處理37-47
- 3.2.3 專利領(lǐng)域的語料特征選擇和抽取47-51
- 3.3 本章小節(jié)51-53
- 第4章 中文專利侵權(quán)檢索模型構(gòu)建53-65
- 4.1 中文專利的侵權(quán)檢索簡介53
- 4.2 中文專利侵權(quán)檢索模型的總體框架53-54
- 4.3 SOM 神經(jīng)網(wǎng)絡(luò)算法設(shè)計54-56
- 4.3.1 基于 SOM 算法的模糊聚類54-55
- 4.3.2 SOM 聚類結(jié)果的評價55-56
- 4.4 專利侵權(quán)檢索實驗結(jié)果及分析56-63
- 4.4.1 實驗假設(shè)56-57
- 4.4.2 數(shù)據(jù)獲取與處理57-59
- 4.4.3 SOM 網(wǎng)絡(luò)設(shè)計59-60
- 4.4.4 實驗結(jié)果及分析60-63
- 4.5 本章小結(jié)63-65
- 第5章 中文專利侵權(quán)檢索原型系統(tǒng)實現(xiàn)65-83
- 5.1 系統(tǒng)架構(gòu)及數(shù)據(jù)流程圖65-68
- 5.2 原型系統(tǒng)主要功能模塊展示68-75
- 5.3 原型系統(tǒng)實現(xiàn)的主要算法及語法75-82
- 5.4 本章小結(jié)82-83
- 結(jié)論83-85
- 參考文獻85-89
- 攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文89-91
- 致謝91
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 郭煒強,文軍,文貴華;基于貝葉斯模型的專利分類[J];計算機工程與設(shè)計;2005年08期
本文編號:674774
本文鏈接:http://www.sikaile.net/guanlilunwen/keyanlw/674774.html
最近更新
教材專著