基于深度學(xué)習(xí)的二句式非充盈態(tài)漢語復(fù)句的關(guān)系識別
發(fā)布時間:2021-09-28 02:51
漢語復(fù)句的關(guān)系識別是對分句間語義關(guān)系的甄別,是復(fù)句語義分析的關(guān)鍵,旨在從文本中識別句間的關(guān)系類型。對于復(fù)句關(guān)系類型識別的研究有助于推動機器翻譯、智能問答、自動生成文摘等領(lǐng)域的發(fā)展,進而提高其整體性能。由于漢語復(fù)句中非充盈態(tài)有標復(fù)句的關(guān)系標記不能夠顯性的表明復(fù)句所含的關(guān)系類型,所以,給此類復(fù)句的語義關(guān)系識別任務(wù)造成了困難。而本文將展開對非充盈態(tài)復(fù)句關(guān)系類別識別的研究,F(xiàn)有的較為主流的復(fù)句關(guān)系識別方法主要有兩種,一種是基于語言學(xué)規(guī)則的,該方法主要是由語言學(xué)家針對大量的語料文本歸納總結(jié)的約束條件,并且建立的相應(yīng)規(guī)則庫。而另一種則是利用統(tǒng)計學(xué)方法,在大規(guī)模語料庫中提取出復(fù)句的詞面、字面上的特征,從而構(gòu)建基于語料文本的特征工程。然而,這些方法所得到的特征集泛化性能較差,以至于識別的正確率不高。另外,特征的工程量較大,需耗費大量的人工和時間。為了能夠深度地挖掘復(fù)句的特征集和復(fù)句蘊含的語義信息特征以及捕獲到復(fù)句內(nèi)分句間相互作用的語義關(guān)聯(lián)信息,本文首次將深度學(xué)習(xí)方法應(yīng)用到漢語復(fù)句語義關(guān)系處理中,并引入詞嵌入模型對復(fù)句進行單詞建模。本文所做的工作有:首先,本文采用從《長江日報》和《人民日報》以及部分當(dāng)代...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.4基于深度學(xué)習(xí)的復(fù)句關(guān)系識別方法的模型流程圖??如上圖所示,利用深度學(xué)習(xí)的方法對句子建模,首先將輸入的句子進行分詞,??,
關(guān)系標記庫主要是由關(guān)系標記以及關(guān)系標記之間所存在的搭配關(guān)系所構(gòu)成??的語料數(shù)據(jù)庫。關(guān)系標記即為關(guān)系詞,關(guān)系詞在整個復(fù)句中扮演著重要的角色,??其起著連接復(fù)句分句的作用,對復(fù)句的語義關(guān)系有著顯性和隱性的標識作用。因??此,關(guān)系詞在復(fù)句關(guān)系類別識別任務(wù)中是不可忽視的重要特征。復(fù)句的關(guān)系標記??和關(guān)系類別往往不是一對一的關(guān)系,其存在著“一對多”和“多對一”的關(guān)系映??射,一種關(guān)系標記可以標識多種關(guān)系類別,即在不同語境下呈現(xiàn)不同的關(guān)系類別。??同樣,一種關(guān)系類別可以由多個關(guān)系標記進行標識。如圖2.1所示,針對大規(guī)模??語料的篩選和統(tǒng)計,得到關(guān)系標記以及所屬關(guān)系類別的范疇,并且包含關(guān)系標記、??詞類、單用或是搭配組合等屬性特征,構(gòu)建了所有關(guān)系標記包含的屬性字段特征,??具體如圖2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可衛(wèi)?3二哽=?0?舌杲??□?225?瑢受?B之萣與?0?、11??□?226?@乎?5今立使馬?〇?區(qū)杲?11??□^227?不籜?樁立使司?〇?轉(zhuǎn)折?12??□?228?有鑒子迸?錢立度月?〇?區(qū)哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知運?獨立使弔?0?轉(zhuǎn)折?12??□?231?唯猝?獨立使葙?〇?轉(zhuǎn)折?12??□?232?惟狨?狨之使與?〇?轉(zhuǎn)折?12??□?233?無奈?獨立便司?〇?轉(zhuǎn)折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?獨之便.司?〇?轉(zhuǎn)折?12??□?236?只可節(jié)?
士學(xué)位論文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?遞?目?因?連?轉(zhuǎn)假讓?假條推?a??列?進?的?果?貨?折轉(zhuǎn)步?設(shè)件斷?》??圖2.4?12類關(guān)系標記出現(xiàn)頻次??根據(jù)上圖顯示,并列關(guān)系、轉(zhuǎn)折關(guān)系出現(xiàn)的頻率最多,之后便是遞進和因果??關(guān)系,由于遞進關(guān)系隸屬于并列關(guān)系,因此可得出現(xiàn)頻次最多的關(guān)系類別為并列、??因果、轉(zhuǎn)折關(guān)系類型。這也恰恰印證了由邢福義先生所提出復(fù)句的三分系統(tǒng)即復(fù)??句關(guān)系類別的三分法:并列類別、轉(zhuǎn)折類別、因果類別。因此,這也是本文使用??該三大類作為分類結(jié)果的原因所在。本文中MNCST語料庫幾種關(guān)系類別的分布??情況如表2.2所示:??表2.2三大關(guān)系類別分布??關(guān)系類型?|總計? ̄ ̄比例??因果大類?3224?24.40%??并列大類?7960?60.24%??轉(zhuǎn)折大類?2031?15.37%??2.4相關(guān)研究方法和實現(xiàn)技術(shù)??2.?4.?1?CNN?和?BI-LSTM??卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世紀60年代提出,經(jīng)過幾十年的發(fā)展目前CNN已經(jīng)被廣泛應(yīng)用于多個領(lǐng)??域中,其最初被應(yīng)用于圖像處理145],目標檢測甚至醫(yī)藥發(fā)現(xiàn)等相關(guān)領(lǐng)域。??近年來,在自然語言處理領(lǐng)域中己得到了部分應(yīng)用,并且取得了較
【參考文獻】:
期刊論文
[1]基于多任務(wù)雙向長短時記憶網(wǎng)絡(luò)的隱式句間關(guān)系分析[J]. 田文洪,高印權(quán),黃厚文,黎在萬,張朝陽. 中文信息學(xué)報. 2019(05)
[2]二句式非充盈態(tài)有標復(fù)句關(guān)系類別的自動標志[J]. 楊進才,陳忠忠,沈顯君,胡金柱. 計算機應(yīng)用研究. 2017(10)
[3]漢語復(fù)句信息處理研究二十年[J]. 吳鋒文. 中文信息學(xué)報. 2015(01)
[4]《語法修辭講話》[J]. 呂叔湘,朱德熙. 中國科技術(shù)語. 2014(05)
[5]基于清華漢語樹庫的復(fù)句關(guān)系詞識別與分類研究[J]. 李艷翠,孫靜,周國棟,馮文賀. 北京大學(xué)學(xué)報(自然科學(xué)版). 2014(01)
[6]基于規(guī)則的連用關(guān)系標記的自動標識研究[J]. 胡金柱,陳江曼,楊進才,舒江波,雷利利. 計算機科學(xué). 2012(07)
[7]基于關(guān)系標記的漢語復(fù)句分類研究[J]. 吳鋒文. 漢語學(xué)報. 2011(03)
[8]基于詞性信息自動識別和標注非分句[J]. 李瓊,李志. 長春工程學(xué)院學(xué)報(社會科學(xué)版). 2011(01)
[9]漢語復(fù)句關(guān)系詞庫的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語言科學(xué). 2010(02)
[10]面向中文信息處理的復(fù)句關(guān)系詞提取算法研究[J]. 胡金柱,舒江波,姚雙云,周星,吳鋒文,肖升. 計算機工程與科學(xué). 2009(10)
碩士論文
[1]漢語復(fù)句關(guān)系自動判定研究[D]. 洪鹿平.南京師范大學(xué) 2008
本文編號:3411101
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.4基于深度學(xué)習(xí)的復(fù)句關(guān)系識別方法的模型流程圖??如上圖所示,利用深度學(xué)習(xí)的方法對句子建模,首先將輸入的句子進行分詞,??,
關(guān)系標記庫主要是由關(guān)系標記以及關(guān)系標記之間所存在的搭配關(guān)系所構(gòu)成??的語料數(shù)據(jù)庫。關(guān)系標記即為關(guān)系詞,關(guān)系詞在整個復(fù)句中扮演著重要的角色,??其起著連接復(fù)句分句的作用,對復(fù)句的語義關(guān)系有著顯性和隱性的標識作用。因??此,關(guān)系詞在復(fù)句關(guān)系類別識別任務(wù)中是不可忽視的重要特征。復(fù)句的關(guān)系標記??和關(guān)系類別往往不是一對一的關(guān)系,其存在著“一對多”和“多對一”的關(guān)系映??射,一種關(guān)系標記可以標識多種關(guān)系類別,即在不同語境下呈現(xiàn)不同的關(guān)系類別。??同樣,一種關(guān)系類別可以由多個關(guān)系標記進行標識。如圖2.1所示,針對大規(guī)模??語料的篩選和統(tǒng)計,得到關(guān)系標記以及所屬關(guān)系類別的范疇,并且包含關(guān)系標記、??詞類、單用或是搭配組合等屬性特征,構(gòu)建了所有關(guān)系標記包含的屬性字段特征,??具體如圖2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可衛(wèi)?3二哽=?0?舌杲??□?225?瑢受?B之萣與?0?、11??□?226?@乎?5今立使馬?〇?區(qū)杲?11??□^227?不籜?樁立使司?〇?轉(zhuǎn)折?12??□?228?有鑒子迸?錢立度月?〇?區(qū)哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知運?獨立使弔?0?轉(zhuǎn)折?12??□?231?唯猝?獨立使葙?〇?轉(zhuǎn)折?12??□?232?惟狨?狨之使與?〇?轉(zhuǎn)折?12??□?233?無奈?獨立便司?〇?轉(zhuǎn)折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?獨之便.司?〇?轉(zhuǎn)折?12??□?236?只可節(jié)?
士學(xué)位論文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?遞?目?因?連?轉(zhuǎn)假讓?假條推?a??列?進?的?果?貨?折轉(zhuǎn)步?設(shè)件斷?》??圖2.4?12類關(guān)系標記出現(xiàn)頻次??根據(jù)上圖顯示,并列關(guān)系、轉(zhuǎn)折關(guān)系出現(xiàn)的頻率最多,之后便是遞進和因果??關(guān)系,由于遞進關(guān)系隸屬于并列關(guān)系,因此可得出現(xiàn)頻次最多的關(guān)系類別為并列、??因果、轉(zhuǎn)折關(guān)系類型。這也恰恰印證了由邢福義先生所提出復(fù)句的三分系統(tǒng)即復(fù)??句關(guān)系類別的三分法:并列類別、轉(zhuǎn)折類別、因果類別。因此,這也是本文使用??該三大類作為分類結(jié)果的原因所在。本文中MNCST語料庫幾種關(guān)系類別的分布??情況如表2.2所示:??表2.2三大關(guān)系類別分布??關(guān)系類型?|總計? ̄ ̄比例??因果大類?3224?24.40%??并列大類?7960?60.24%??轉(zhuǎn)折大類?2031?15.37%??2.4相關(guān)研究方法和實現(xiàn)技術(shù)??2.?4.?1?CNN?和?BI-LSTM??卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世紀60年代提出,經(jīng)過幾十年的發(fā)展目前CNN已經(jīng)被廣泛應(yīng)用于多個領(lǐng)??域中,其最初被應(yīng)用于圖像處理145],目標檢測甚至醫(yī)藥發(fā)現(xiàn)等相關(guān)領(lǐng)域。??近年來,在自然語言處理領(lǐng)域中己得到了部分應(yīng)用,并且取得了較
【參考文獻】:
期刊論文
[1]基于多任務(wù)雙向長短時記憶網(wǎng)絡(luò)的隱式句間關(guān)系分析[J]. 田文洪,高印權(quán),黃厚文,黎在萬,張朝陽. 中文信息學(xué)報. 2019(05)
[2]二句式非充盈態(tài)有標復(fù)句關(guān)系類別的自動標志[J]. 楊進才,陳忠忠,沈顯君,胡金柱. 計算機應(yīng)用研究. 2017(10)
[3]漢語復(fù)句信息處理研究二十年[J]. 吳鋒文. 中文信息學(xué)報. 2015(01)
[4]《語法修辭講話》[J]. 呂叔湘,朱德熙. 中國科技術(shù)語. 2014(05)
[5]基于清華漢語樹庫的復(fù)句關(guān)系詞識別與分類研究[J]. 李艷翠,孫靜,周國棟,馮文賀. 北京大學(xué)學(xué)報(自然科學(xué)版). 2014(01)
[6]基于規(guī)則的連用關(guān)系標記的自動標識研究[J]. 胡金柱,陳江曼,楊進才,舒江波,雷利利. 計算機科學(xué). 2012(07)
[7]基于關(guān)系標記的漢語復(fù)句分類研究[J]. 吳鋒文. 漢語學(xué)報. 2011(03)
[8]基于詞性信息自動識別和標注非分句[J]. 李瓊,李志. 長春工程學(xué)院學(xué)報(社會科學(xué)版). 2011(01)
[9]漢語復(fù)句關(guān)系詞庫的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語言科學(xué). 2010(02)
[10]面向中文信息處理的復(fù)句關(guān)系詞提取算法研究[J]. 胡金柱,舒江波,姚雙云,周星,吳鋒文,肖升. 計算機工程與科學(xué). 2009(10)
碩士論文
[1]漢語復(fù)句關(guān)系自動判定研究[D]. 洪鹿平.南京師范大學(xué) 2008
本文編號:3411101
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3411101.html
最近更新
教材專著