專利權(quán)利要求書生成關(guān)鍵技術(shù)研究
發(fā)布時間:2022-08-08 10:35
人工智能的出現(xiàn)推動了多個領(lǐng)域的快速發(fā)展,其中自然語言處理領(lǐng)域通過計算機理解并應(yīng)用人類語言,在機器翻譯、自動寫作等方面已取得了多項研究成果。近代科學(xué)的快速發(fā)展也催生了專利制度,其設(shè)立的目的是鼓勵發(fā)明以及保護(hù)發(fā)明人的權(quán)利。在申請專利時,需要提交說明書及權(quán)利要求書。其中權(quán)利要求書是以說明書為依據(jù),明確發(fā)明內(nèi)容并限定權(quán)利范圍。因此,可以根據(jù)說明書的內(nèi)容自動生成權(quán)利要求書。本文探索專利權(quán)利要求書自動生成技術(shù),從以下三個方面進(jìn)行研究:說明書中權(quán)利要求依據(jù)識別,權(quán)利要求特征和限定部分生成以及權(quán)利要求引用部分生成。本文的研究內(nèi)容及貢獻(xiàn)如下:第一,對專利說明書中權(quán)利要求依據(jù)識別技術(shù)進(jìn)行了探索,涉及到對專利說明書的深度理解及推理,將其形式化為機器閱讀理解任務(wù)。首先通過清洗數(shù)據(jù)并設(shè)計對齊算法將權(quán)利要求對齊到說明書中的內(nèi)容,生成偽標(biāo)注數(shù)據(jù)。然后通過設(shè)計4種不同問題形式探索其對于識別效果的影響,并基于BERT模型完成訓(xùn)練。最后,在BERT模型基礎(chǔ)上添加了Bi DAF網(wǎng)絡(luò)以捕獲問題及篇章間的聯(lián)系,進(jìn)一步提升模型性能,并在測試集上得到EM值35.54,F1值38.08的結(jié)果。第二,對權(quán)利要求特征及限定部分的自動生成...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 研究現(xiàn)狀
1.2.1 機器閱讀理解領(lǐng)域
1.2.2 文本摘要領(lǐng)域
1.2.3 文本分類領(lǐng)域
1.3 本文主要研究內(nèi)容
1.4 論文主要組織結(jié)構(gòu)
第2章 說明書權(quán)利要求依據(jù)識別
2.1 權(quán)利要求到說明書的對齊加工
2.1.1 數(shù)據(jù)清洗
2.1.2 權(quán)利要求到發(fā)明內(nèi)容對齊算法
2.2 不同模型結(jié)構(gòu)對系統(tǒng)性能影響
2.2.1 BERT預(yù)訓(xùn)練模型
2.2.2 引入雙向注意力流網(wǎng)絡(luò)的BERT模型
2.3 問題形式對系統(tǒng)性能影響
2.4 實驗結(jié)果與分析
2.4.1 實驗數(shù)據(jù)集與評價指標(biāo)
2.4.2 實驗設(shè)置
2.4.3 問題形式影響實驗結(jié)果
2.4.4 模型結(jié)構(gòu)影響實驗結(jié)果
2.5 本章小結(jié)
第3章 權(quán)利要求特征及限定部分生成
3.1 不同模型結(jié)構(gòu)對性能影響
3.1.1 seq2seq模型
3.1.2 引入attention機制的seq2seq模型
3.1.3 進(jìn)一步引入copy機制的seq2seq模型
3.1.4 進(jìn)一步引入coverage機制的seq2seq模型
3.2 實驗設(shè)置
3.2.1 實驗數(shù)據(jù)集
3.2.2 評價指標(biāo)
3.2.3 模型參數(shù)設(shè)置
3.3 實驗結(jié)果
3.4 本章小結(jié)
第4章 權(quán)利要求引用部分識別
4.1 引用識別數(shù)據(jù)集構(gòu)造
4.2 不同模型結(jié)構(gòu)對性能影響
4.2.1 引入LSTM結(jié)構(gòu)的BERT模型
4.2.2 引入CNN結(jié)構(gòu)的BERT模型
4.2.3 引入RCNN結(jié)構(gòu)的BERT模型
4.2.4 引入DPCNN結(jié)構(gòu)的BERT模型
4.3 實驗數(shù)據(jù)集與評價指標(biāo)
4.3.1 實驗數(shù)據(jù)集
4.3.2 評價指標(biāo)
4.4 實驗結(jié)果與分析
4.4.1 樣本比例影響實驗結(jié)果
4.4.2 模型結(jié)構(gòu)影響實驗結(jié)果
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3671353
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 研究現(xiàn)狀
1.2.1 機器閱讀理解領(lǐng)域
1.2.2 文本摘要領(lǐng)域
1.2.3 文本分類領(lǐng)域
1.3 本文主要研究內(nèi)容
1.4 論文主要組織結(jié)構(gòu)
第2章 說明書權(quán)利要求依據(jù)識別
2.1 權(quán)利要求到說明書的對齊加工
2.1.1 數(shù)據(jù)清洗
2.1.2 權(quán)利要求到發(fā)明內(nèi)容對齊算法
2.2 不同模型結(jié)構(gòu)對系統(tǒng)性能影響
2.2.1 BERT預(yù)訓(xùn)練模型
2.2.2 引入雙向注意力流網(wǎng)絡(luò)的BERT模型
2.3 問題形式對系統(tǒng)性能影響
2.4 實驗結(jié)果與分析
2.4.1 實驗數(shù)據(jù)集與評價指標(biāo)
2.4.2 實驗設(shè)置
2.4.3 問題形式影響實驗結(jié)果
2.4.4 模型結(jié)構(gòu)影響實驗結(jié)果
2.5 本章小結(jié)
第3章 權(quán)利要求特征及限定部分生成
3.1 不同模型結(jié)構(gòu)對性能影響
3.1.1 seq2seq模型
3.1.2 引入attention機制的seq2seq模型
3.1.3 進(jìn)一步引入copy機制的seq2seq模型
3.1.4 進(jìn)一步引入coverage機制的seq2seq模型
3.2 實驗設(shè)置
3.2.1 實驗數(shù)據(jù)集
3.2.2 評價指標(biāo)
3.2.3 模型參數(shù)設(shè)置
3.3 實驗結(jié)果
3.4 本章小結(jié)
第4章 權(quán)利要求引用部分識別
4.1 引用識別數(shù)據(jù)集構(gòu)造
4.2 不同模型結(jié)構(gòu)對性能影響
4.2.1 引入LSTM結(jié)構(gòu)的BERT模型
4.2.2 引入CNN結(jié)構(gòu)的BERT模型
4.2.3 引入RCNN結(jié)構(gòu)的BERT模型
4.2.4 引入DPCNN結(jié)構(gòu)的BERT模型
4.3 實驗數(shù)據(jù)集與評價指標(biāo)
4.3.1 實驗數(shù)據(jù)集
4.3.2 評價指標(biāo)
4.4 實驗結(jié)果與分析
4.4.1 樣本比例影響實驗結(jié)果
4.4.2 模型結(jié)構(gòu)影響實驗結(jié)果
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3671353
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3671353.html
最近更新
教材專著