和元多媒體語料庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-08 14:19
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,不同國家、不同文化、不同語言的人之間越來越渴望能擁有一種新的語言形式來進(jìn)行更加方便快捷的交流溝通。西北大學(xué)小露珠團(tuán)隊(duì)提出了基于網(wǎng)絡(luò)的語言——“和”,旨在方便人們進(jìn)行跨文化、跨語種、跨地域的的交流。語料庫是語言研究的重要手段。但是現(xiàn)有的網(wǎng)絡(luò)語言研究多是針對文字或者單純的網(wǎng)絡(luò)表情,而現(xiàn)有的多媒體語料庫研究多是針對單個(gè)的多媒體語料,沒有把多媒體語料與聊天語言進(jìn)行有機(jī)的結(jié)合。因此,為了更好的推進(jìn)“和”語言的研究和使用,研究基于“和”語言的多媒體語料庫勢在必行。本文在對傳統(tǒng)多媒體語料庫以及網(wǎng)絡(luò)語言的研究現(xiàn)狀進(jìn)行總結(jié)和分析基礎(chǔ)上,首先根據(jù)“和”語言的特點(diǎn),提出了基于網(wǎng)絡(luò)聊天活動的語料概念模型,該語料模型對網(wǎng)絡(luò)聊天活動進(jìn)行抽象并劃分為活動者的角度、活動的角度以及系統(tǒng)的角度進(jìn)行研究;其次,為了解決基于網(wǎng)絡(luò)聊天的多媒體語料的處理問題,給出了多媒體語料分層處理模型,該模型從語料物理層、語料語義層以及整體語段、篇章處理層逐層說明了多媒體語料的處理過程;最后在多媒體語料庫模型的基礎(chǔ)上,提出相關(guān)需求,進(jìn)一步設(shè)計(jì)和實(shí)現(xiàn)了基于“和”語言的多媒體語料庫系統(tǒng)——和元(Harmony Multi...
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
“和”語言及其相關(guān)系統(tǒng)間的關(guān)系
西北大學(xué)碩士專業(yè)學(xué)位論文個(gè)語料添加一個(gè)或多個(gè)標(biāo)簽;第二階段為評審階段,由多位標(biāo)注者從標(biāo)注階段獲得的標(biāo)簽中選出最認(rèn)可的部分標(biāo)簽,這些標(biāo)注者分別從給定語料和其對應(yīng)的標(biāo)簽集合中選擇一個(gè)或多個(gè)自己認(rèn)為最滿意的標(biāo)簽,系統(tǒng)后臺會對用戶的投票計(jì)數(shù),并按投票數(shù)把所有標(biāo)簽從高到低排列,保留用戶認(rèn)可度最高的標(biāo)簽作為該語料的標(biāo)簽,將該標(biāo)簽作為語料的語義。荷棠在標(biāo)注完成后把標(biāo)注好的語義返回到語料庫中。圖 2 為荷棠的眾包標(biāo)注模型圖。
SpringBoot的配置
【參考文獻(xiàn)】:
期刊論文
[1]面向聊天記錄的語義分析研究[J]. 王媛媛,范潮欽,蘇玉海. 信息網(wǎng)絡(luò)安全. 2017(09)
[2]新媒體時(shí)代網(wǎng)絡(luò)語言的傳播研究[J]. 范娟華. 新媒體研究. 2017(07)
[3]面向海量高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng)[J]. 操順德,華宇,馮丹,孫園園,左鵬飛. 軟件學(xué)報(bào). 2017(08)
[4]談話節(jié)目語料庫的構(gòu)建與會話結(jié)構(gòu)分析[J]. 王珊,劉銳. 中文信息學(xué)報(bào). 2016(06)
[5]漢語網(wǎng)絡(luò)語言研究現(xiàn)狀分析——關(guān)于建立“漢語網(wǎng)絡(luò)語言語料庫”的設(shè)想[J]. 萇淑君. 現(xiàn)代語文(語言研究版). 2016(07)
[6]基于隱馬爾可夫模型的主觀句識別[J]. 劉培玉,荀靜,費(fèi)紹棟,朱振方. 中文信息學(xué)報(bào). 2016(04)
[7]漢語網(wǎng)絡(luò)語言語料庫:研制與應(yīng)用[J]. 曹進(jìn),趙鴻章,王灝. 蘭州文理學(xué)院學(xué)報(bào)(社會科學(xué)版). 2015(05)
[8]談漢語中介語語料庫的建設(shè)標(biāo)準(zhǔn)[J]. 張寶林,崔希亮. 語言文字應(yīng)用. 2015(02)
[9]中文分詞與詞性標(biāo)注研究[J]. 梁喜濤,顧磊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(02)
[10]關(guān)于《地書》[J]. 徐冰. 雪蓮. 2014(08)
碩士論文
[1]語料庫眾包工具—荷裳的設(shè)計(jì)與實(shí)現(xiàn)[D]. 阿宇.西北大學(xué) 2018
[2]和音即時(shí)通訊工具的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張國慶.西北大學(xué) 2017
本文編號:3071196
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
“和”語言及其相關(guān)系統(tǒng)間的關(guān)系
西北大學(xué)碩士專業(yè)學(xué)位論文個(gè)語料添加一個(gè)或多個(gè)標(biāo)簽;第二階段為評審階段,由多位標(biāo)注者從標(biāo)注階段獲得的標(biāo)簽中選出最認(rèn)可的部分標(biāo)簽,這些標(biāo)注者分別從給定語料和其對應(yīng)的標(biāo)簽集合中選擇一個(gè)或多個(gè)自己認(rèn)為最滿意的標(biāo)簽,系統(tǒng)后臺會對用戶的投票計(jì)數(shù),并按投票數(shù)把所有標(biāo)簽從高到低排列,保留用戶認(rèn)可度最高的標(biāo)簽作為該語料的標(biāo)簽,將該標(biāo)簽作為語料的語義。荷棠在標(biāo)注完成后把標(biāo)注好的語義返回到語料庫中。圖 2 為荷棠的眾包標(biāo)注模型圖。
SpringBoot的配置
【參考文獻(xiàn)】:
期刊論文
[1]面向聊天記錄的語義分析研究[J]. 王媛媛,范潮欽,蘇玉海. 信息網(wǎng)絡(luò)安全. 2017(09)
[2]新媒體時(shí)代網(wǎng)絡(luò)語言的傳播研究[J]. 范娟華. 新媒體研究. 2017(07)
[3]面向海量高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng)[J]. 操順德,華宇,馮丹,孫園園,左鵬飛. 軟件學(xué)報(bào). 2017(08)
[4]談話節(jié)目語料庫的構(gòu)建與會話結(jié)構(gòu)分析[J]. 王珊,劉銳. 中文信息學(xué)報(bào). 2016(06)
[5]漢語網(wǎng)絡(luò)語言研究現(xiàn)狀分析——關(guān)于建立“漢語網(wǎng)絡(luò)語言語料庫”的設(shè)想[J]. 萇淑君. 現(xiàn)代語文(語言研究版). 2016(07)
[6]基于隱馬爾可夫模型的主觀句識別[J]. 劉培玉,荀靜,費(fèi)紹棟,朱振方. 中文信息學(xué)報(bào). 2016(04)
[7]漢語網(wǎng)絡(luò)語言語料庫:研制與應(yīng)用[J]. 曹進(jìn),趙鴻章,王灝. 蘭州文理學(xué)院學(xué)報(bào)(社會科學(xué)版). 2015(05)
[8]談漢語中介語語料庫的建設(shè)標(biāo)準(zhǔn)[J]. 張寶林,崔希亮. 語言文字應(yīng)用. 2015(02)
[9]中文分詞與詞性標(biāo)注研究[J]. 梁喜濤,顧磊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(02)
[10]關(guān)于《地書》[J]. 徐冰. 雪蓮. 2014(08)
碩士論文
[1]語料庫眾包工具—荷裳的設(shè)計(jì)與實(shí)現(xiàn)[D]. 阿宇.西北大學(xué) 2018
[2]和音即時(shí)通訊工具的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張國慶.西北大學(xué) 2017
本文編號:3071196
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3071196.html
最近更新
教材專著