基于相似性度量的專利分類方法研究
發(fā)布時間:2024-02-17 17:33
隨著人類社會日新月異的變化,技術的革新速度越來越快,同一領域的行業(yè)競爭變得愈發(fā)激烈,這對企業(yè)在某一領域下的技術創(chuàng)新提出了更高的要求。專利作為一種含有豐富信息的特殊知識文本,在教育、金融、生產(chǎn)等一系列領域中為技術發(fā)展提供強有力的支撐。面對海量的專利文本,如何改變傳統(tǒng)的文本分類算法使其適應專利文本的特性成為現(xiàn)在專利分類亟待解決的問題。相似性度量是指通過某種方法來衡量數(shù)據(jù)之間相似程度的一種度量方法。由于目前基于統(tǒng)計和機器學習的專利分類方法,在分類精度方面很難再有更大的提高,因此如何選擇一個優(yōu)秀的相似性度量方法使其達到更好的分類效果,是當前的研究重點和熱點。本文根據(jù)專利文本的特點結(jié)合傳統(tǒng)的相似性度量方法提出了兩種基于相似性度量的專利分類方法。首先,使用TF-IDF方法從專利摘要中篩選出特征項,通過CHI統(tǒng)計量判斷特征項與類別之間的關聯(lián)性,然而CHI統(tǒng)計量會夸大某些不具備分類信息的低頻詞的重要程度,影響分類準確性。因此將CHI統(tǒng)計量與夾角余弦相似度結(jié)合,提出了一種新的基于摘要相似度的專利分類方法;诖朔椒,考慮專利的結(jié)構(gòu)化和非結(jié)構(gòu)化特征,提出了一種基于IPC分類號和摘要混合相似度的專利分類方法...
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 專利分類研究現(xiàn)狀
1.2.2 專利相似度計算研究現(xiàn)狀
1.3 主要研究內(nèi)容和預期研究結(jié)果
1.4 本文的組織結(jié)構(gòu)
第2章 相關技術介紹
2.1 文本的特征提取
2.1.1 特征項選取
2.1.2 特征項權重計算
2.2 文本相似性度量方法
2.3 文本分類算法及評價方法
2.3.1 文本分類算法
2.3.2 評價方法
2.4 本章小結(jié)
第3章 基于摘要相似度的專利分類方法
3.1 CHI統(tǒng)計量
3.1.1 CHI統(tǒng)計量的局限性
3.1.2 改進的CHI統(tǒng)計方法
3.2 基于摘要相似度的專利分類方法
3.2.1 算法思想
3.2.2 算法步驟
3.3 基于混合相似度的專利分類方法
3.3.1 基于IPC的專利文本相似性度量
3.3.2 基于混合相似度的專利分類方法
3.4 實驗結(jié)果及分析
3.4.1 實驗環(huán)境及配置
3.4.2 實驗數(shù)據(jù)集
3.4.3 實驗設計及步驟
3.4.4 實驗結(jié)果及分析
3.5 本章小結(jié)
第4章 基于權利要求書相似度的專利分類方法
4.1 權利要求書SAO-x結(jié)構(gòu)提取
4.1.1 SAO結(jié)構(gòu)
4.1.2 SAO-x結(jié)構(gòu)
4.1.3 權利要求書SAO-x結(jié)構(gòu)提取
4.2 基于權利要求書相似度的專利分類方法
4.2.1 算法思想
4.2.2 算法步驟
4.3 實驗結(jié)果及分析
4.3.1 實驗環(huán)境及配置
4.3.2 實驗數(shù)據(jù)集
4.3.3 實驗設計及步驟
4.3.4 實驗結(jié)果及分析
4.4 本章小結(jié)
結(jié)論
攻讀碩士學位期間發(fā)表的論文和取得的科研成果
參考文獻
致謝
本文編號:3901148
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 專利分類研究現(xiàn)狀
1.2.2 專利相似度計算研究現(xiàn)狀
1.3 主要研究內(nèi)容和預期研究結(jié)果
1.4 本文的組織結(jié)構(gòu)
第2章 相關技術介紹
2.1 文本的特征提取
2.1.1 特征項選取
2.1.2 特征項權重計算
2.2 文本相似性度量方法
2.3 文本分類算法及評價方法
2.3.1 文本分類算法
2.3.2 評價方法
2.4 本章小結(jié)
第3章 基于摘要相似度的專利分類方法
3.1 CHI統(tǒng)計量
3.1.1 CHI統(tǒng)計量的局限性
3.1.2 改進的CHI統(tǒng)計方法
3.2 基于摘要相似度的專利分類方法
3.2.1 算法思想
3.2.2 算法步驟
3.3 基于混合相似度的專利分類方法
3.3.1 基于IPC的專利文本相似性度量
3.3.2 基于混合相似度的專利分類方法
3.4 實驗結(jié)果及分析
3.4.1 實驗環(huán)境及配置
3.4.2 實驗數(shù)據(jù)集
3.4.3 實驗設計及步驟
3.4.4 實驗結(jié)果及分析
3.5 本章小結(jié)
第4章 基于權利要求書相似度的專利分類方法
4.1 權利要求書SAO-x結(jié)構(gòu)提取
4.1.1 SAO結(jié)構(gòu)
4.1.2 SAO-x結(jié)構(gòu)
4.1.3 權利要求書SAO-x結(jié)構(gòu)提取
4.2 基于權利要求書相似度的專利分類方法
4.2.1 算法思想
4.2.2 算法步驟
4.3 實驗結(jié)果及分析
4.3.1 實驗環(huán)境及配置
4.3.2 實驗數(shù)據(jù)集
4.3.3 實驗設計及步驟
4.3.4 實驗結(jié)果及分析
4.4 本章小結(jié)
結(jié)論
攻讀碩士學位期間發(fā)表的論文和取得的科研成果
參考文獻
致謝
本文編號:3901148
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3901148.html