基于自然語(yǔ)言處理的軟件需求驗(yàn)證研究
發(fā)布時(shí)間:2021-06-06 05:49
隨著數(shù)字化技術(shù)開(kāi)始在核電站廣泛應(yīng)用,核電領(lǐng)域安全級(jí)軟件的驗(yàn)證與確認(rèn)工作,尤其是針對(duì)核安全級(jí)數(shù)字化儀控系統(tǒng)的軟件驗(yàn)證與確認(rèn)受到廣泛關(guān)注。軟件驗(yàn)證與確認(rèn)的過(guò)程,即為軟件需求與軟件設(shè)計(jì)之間關(guān)系的驗(yàn)證與確認(rèn),貫穿于軟件產(chǎn)品的整個(gè)生命周期。因此尋求更為簡(jiǎn)便、準(zhǔn)確的軟件需求驗(yàn)證方法對(duì)于核電系統(tǒng)技術(shù)發(fā)展以及核能的安全開(kāi)發(fā)利用具有重要意義。軟件需求文檔中軟件特性的結(jié)構(gòu)完整性驗(yàn)證與描述合理性驗(yàn)證是軟件驗(yàn)證與確認(rèn)中重要的一環(huán)。論文針對(duì)自然語(yǔ)言處理在軟件需求驗(yàn)證中的應(yīng)用進(jìn)行了較為系統(tǒng)的研究,主要應(yīng)用了文本的詞性標(biāo)注以及文本相似度計(jì)算的技術(shù),主要工作及創(chuàng)新點(diǎn)如下:1.在隱馬爾科夫詞性標(biāo)注模型的訓(xùn)練中通過(guò)輔助語(yǔ)料采用半監(jiān)督的方式不斷擴(kuò)展訓(xùn)練語(yǔ)料。此方法不需要大量經(jīng)過(guò)標(biāo)注的訓(xùn)練語(yǔ)料,通過(guò)輔助語(yǔ)料迭代訓(xùn)練的方式可以自動(dòng)獲得標(biāo)注準(zhǔn)確度較高的語(yǔ)料,節(jié)省了人力成本和時(shí)間成本。2.利用標(biāo)注模型對(duì)語(yǔ)料進(jìn)行標(biāo)注時(shí),采用Viterbi雙向標(biāo)注。傳統(tǒng)隱馬爾科夫標(biāo)注模型只考慮了詞性的單向轉(zhuǎn)移,遺漏了當(dāng)前詞性與后續(xù)詞性的關(guān)系。雙向標(biāo)注克服了傳統(tǒng)隱馬爾科夫模型單向依賴的缺點(diǎn),同時(shí)提高了詞性標(biāo)注的可靠性。3.通過(guò)引入義原的深度信息改進(jìn)了詞...
【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
天氣的馬爾可夫鏈(a)和單詞的馬爾可夫鏈(b)
上海交通大學(xué)碩士學(xué)位論文-10-圖2-2每天吃冰淇淋的數(shù)量和天氣狀態(tài)之間關(guān)系的隱馬爾科夫模型Fig.2-2AhiddenMarkovmodelforrelatingnumbersoficecreamstotheweather.注意,在圖2-2的HMM中,任意兩種狀態(tài)之間有一個(gè)(非零)過(guò)渡的概率。這樣的HMM稱為全連通HMM或遍歷的HMM。然而,在有的HMMs中,許多狀態(tài)間的轉(zhuǎn)移概率為零。例如,在從左到右(也稱為Bakis)的HMMs中,狀態(tài)轉(zhuǎn)換從左到右進(jìn)行,如圖2-3所示。在BakisHMM中,沒(méi)有從編號(hào)較高的狀態(tài)到編號(hào)較低的狀態(tài)的轉(zhuǎn)換(或者,更準(zhǔn)確地說(shuō),任何從編號(hào)較高的狀態(tài)到編號(hào)較低的狀態(tài)的轉(zhuǎn)移概率為零)。BakisHMMs通常用于模擬像語(yǔ)音這樣的時(shí)間過(guò)程。圖2-3兩種隱馬爾可夫模型Fig.2-3TwohiddenMarkovmodels如圖2-3左邊是一個(gè)從左到右(Bakis)的HMM,右邊是一個(gè)全連通(遍歷的)HMM。在Bakis模型中,所有未表示出的轉(zhuǎn)移概率均為零。Rabiner(1989)在上世紀(jì)60年代JackFerguson所做教程的基礎(chǔ)上提出隱馬爾可夫模型由三個(gè)基本問(wèn)題構(gòu)成:1.概率估計(jì)問(wèn)題:給定模型=(A,B,)和觀測(cè)序列()12TO=o,o,...,o,計(jì)算模型λ下觀測(cè)序列O出現(xiàn)的概率P(O|)。2.學(xué)習(xí)問(wèn)題:給定一個(gè)觀測(cè)序列()12TO=o,o,...,o,估計(jì)隱馬爾科夫模型=(A,B,)的參數(shù),使得在該模型下觀測(cè)序列概率P(O|)最大。即,用極大似然估計(jì)的方法估計(jì)參數(shù)[16]。3.解碼問(wèn)題
上海交通大學(xué)碩士學(xué)位論文-11-已知模型=(A,B,)和觀測(cè)序列()12TO=o,o,...,o,求使觀測(cè)序列條件概率P(Q|O)最大的狀態(tài)序列12(,,...,)TQ=qqq,即給定觀測(cè)序列,求最有可能生成此觀測(cè)序列的狀態(tài)序列[17]。維特比算法維特比算法是一種利用動(dòng)態(tài)規(guī)劃思想的動(dòng)態(tài)規(guī)劃算法,該算法可以在給定模型=(A,B,)和觀察序列()12TO=o,o,...,o的情況下求得使觀測(cè)序列條件概率P(Q|O)最大的一組狀態(tài)序列12(,,...,)TQ=qqq。例如在上述預(yù)測(cè)天氣的任務(wù)中,給定觀測(cè)序列(3,1,3)和一個(gè)HMM,該算法的任務(wù)就是找到與該觀測(cè)序列最相符的隱狀態(tài)序列。圖2-4Viterbi算法計(jì)算最佳路徑Fig.2-4TheViterbialgorithmforcomputingthebestpath圖2-4是一個(gè)利用Viterbi算法計(jì)算觀察序列3,1,3的最佳隱狀態(tài)序列的一個(gè)實(shí)例,圓圈表示隱狀態(tài),方塊表示觀測(cè)值,白色(未填充)圓圈表示非法轉(zhuǎn)移。這一過(guò)程的思路是從左到右處理觀測(cè)序列,圖中()tvj表示第t個(gè)觀測(cè)值是由第j個(gè)隱狀態(tài)產(chǎn)生的概率,該值通過(guò)遞歸產(chǎn)生,形式如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于模型驅(qū)動(dòng)的嵌入式軟件需求驗(yàn)證研究[J]. 杜澤民,陳宜成. 電子世界. 2018(08)
[2]基于需求的形式化建模與驗(yàn)證方法研究[J]. 李勇,曹子寧. 計(jì)算機(jī)技術(shù)與發(fā)展. 2017(06)
[3]核電廠DCS軟件驗(yàn)證與確認(rèn)標(biāo)準(zhǔn)體系分析[J]. 鄭駢垚,鐘柏,馬象睿. 自動(dòng)化儀表. 2017(03)
[4]淺析核安全級(jí)數(shù)字化儀控系統(tǒng)軟件V&V的方法[J]. 葉王平,唐建中,陳衛(wèi)華,谷鵬飛,王升超. 原子能科學(xué)技術(shù). 2015(S1)
[5]現(xiàn)有軟件驗(yàn)證和確認(rèn)有關(guān)標(biāo)準(zhǔn)的綜述[J]. 熊正隆. 核標(biāo)準(zhǔn)計(jì)量與質(zhì)量. 2011(03)
[6]錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)在未登錄詞詞性標(biāo)注中的應(yīng)用[J]. 梁妍,朱耀庭. 計(jì)算機(jī)工程與設(shè)計(jì). 2008(06)
[7]詞性標(biāo)注中生詞處理算法研究[J]. 張孝飛,陳肇雄,黃河燕,蔡智. 中文信息學(xué)報(bào). 2003(05)
[8]基于語(yǔ)義計(jì)算的語(yǔ)句相關(guān)度研究[J]. 李素建. 計(jì)算機(jī)工程與應(yīng)用. 2002(07)
本文編號(hào):3213741
【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
天氣的馬爾可夫鏈(a)和單詞的馬爾可夫鏈(b)
上海交通大學(xué)碩士學(xué)位論文-10-圖2-2每天吃冰淇淋的數(shù)量和天氣狀態(tài)之間關(guān)系的隱馬爾科夫模型Fig.2-2AhiddenMarkovmodelforrelatingnumbersoficecreamstotheweather.注意,在圖2-2的HMM中,任意兩種狀態(tài)之間有一個(gè)(非零)過(guò)渡的概率。這樣的HMM稱為全連通HMM或遍歷的HMM。然而,在有的HMMs中,許多狀態(tài)間的轉(zhuǎn)移概率為零。例如,在從左到右(也稱為Bakis)的HMMs中,狀態(tài)轉(zhuǎn)換從左到右進(jìn)行,如圖2-3所示。在BakisHMM中,沒(méi)有從編號(hào)較高的狀態(tài)到編號(hào)較低的狀態(tài)的轉(zhuǎn)換(或者,更準(zhǔn)確地說(shuō),任何從編號(hào)較高的狀態(tài)到編號(hào)較低的狀態(tài)的轉(zhuǎn)移概率為零)。BakisHMMs通常用于模擬像語(yǔ)音這樣的時(shí)間過(guò)程。圖2-3兩種隱馬爾可夫模型Fig.2-3TwohiddenMarkovmodels如圖2-3左邊是一個(gè)從左到右(Bakis)的HMM,右邊是一個(gè)全連通(遍歷的)HMM。在Bakis模型中,所有未表示出的轉(zhuǎn)移概率均為零。Rabiner(1989)在上世紀(jì)60年代JackFerguson所做教程的基礎(chǔ)上提出隱馬爾可夫模型由三個(gè)基本問(wèn)題構(gòu)成:1.概率估計(jì)問(wèn)題:給定模型=(A,B,)和觀測(cè)序列()12TO=o,o,...,o,計(jì)算模型λ下觀測(cè)序列O出現(xiàn)的概率P(O|)。2.學(xué)習(xí)問(wèn)題:給定一個(gè)觀測(cè)序列()12TO=o,o,...,o,估計(jì)隱馬爾科夫模型=(A,B,)的參數(shù),使得在該模型下觀測(cè)序列概率P(O|)最大。即,用極大似然估計(jì)的方法估計(jì)參數(shù)[16]。3.解碼問(wèn)題
上海交通大學(xué)碩士學(xué)位論文-11-已知模型=(A,B,)和觀測(cè)序列()12TO=o,o,...,o,求使觀測(cè)序列條件概率P(Q|O)最大的狀態(tài)序列12(,,...,)TQ=qqq,即給定觀測(cè)序列,求最有可能生成此觀測(cè)序列的狀態(tài)序列[17]。維特比算法維特比算法是一種利用動(dòng)態(tài)規(guī)劃思想的動(dòng)態(tài)規(guī)劃算法,該算法可以在給定模型=(A,B,)和觀察序列()12TO=o,o,...,o的情況下求得使觀測(cè)序列條件概率P(Q|O)最大的一組狀態(tài)序列12(,,...,)TQ=qqq。例如在上述預(yù)測(cè)天氣的任務(wù)中,給定觀測(cè)序列(3,1,3)和一個(gè)HMM,該算法的任務(wù)就是找到與該觀測(cè)序列最相符的隱狀態(tài)序列。圖2-4Viterbi算法計(jì)算最佳路徑Fig.2-4TheViterbialgorithmforcomputingthebestpath圖2-4是一個(gè)利用Viterbi算法計(jì)算觀察序列3,1,3的最佳隱狀態(tài)序列的一個(gè)實(shí)例,圓圈表示隱狀態(tài),方塊表示觀測(cè)值,白色(未填充)圓圈表示非法轉(zhuǎn)移。這一過(guò)程的思路是從左到右處理觀測(cè)序列,圖中()tvj表示第t個(gè)觀測(cè)值是由第j個(gè)隱狀態(tài)產(chǎn)生的概率,該值通過(guò)遞歸產(chǎn)生,形式如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于模型驅(qū)動(dòng)的嵌入式軟件需求驗(yàn)證研究[J]. 杜澤民,陳宜成. 電子世界. 2018(08)
[2]基于需求的形式化建模與驗(yàn)證方法研究[J]. 李勇,曹子寧. 計(jì)算機(jī)技術(shù)與發(fā)展. 2017(06)
[3]核電廠DCS軟件驗(yàn)證與確認(rèn)標(biāo)準(zhǔn)體系分析[J]. 鄭駢垚,鐘柏,馬象睿. 自動(dòng)化儀表. 2017(03)
[4]淺析核安全級(jí)數(shù)字化儀控系統(tǒng)軟件V&V的方法[J]. 葉王平,唐建中,陳衛(wèi)華,谷鵬飛,王升超. 原子能科學(xué)技術(shù). 2015(S1)
[5]現(xiàn)有軟件驗(yàn)證和確認(rèn)有關(guān)標(biāo)準(zhǔn)的綜述[J]. 熊正隆. 核標(biāo)準(zhǔn)計(jì)量與質(zhì)量. 2011(03)
[6]錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)在未登錄詞詞性標(biāo)注中的應(yīng)用[J]. 梁妍,朱耀庭. 計(jì)算機(jī)工程與設(shè)計(jì). 2008(06)
[7]詞性標(biāo)注中生詞處理算法研究[J]. 張孝飛,陳肇雄,黃河燕,蔡智. 中文信息學(xué)報(bào). 2003(05)
[8]基于語(yǔ)義計(jì)算的語(yǔ)句相關(guān)度研究[J]. 李素建. 計(jì)算機(jī)工程與應(yīng)用. 2002(07)
本文編號(hào):3213741
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3213741.html
最近更新
教材專著