基于深度學(xué)習(xí)的教學(xué)場景語言模型研究
發(fā)布時間:2021-12-28 05:15
隨著大數(shù)據(jù)、深度學(xué)習(xí)的快速發(fā)展,作為語言的兩個基本屬性,語音和文本的研究有了突破性進(jìn)展。語言是教學(xué)場景中最主要的信息交流方式,因此文本和語音的研究對于教育+AI有著重要的意義。作為文本和語音研究中的一項基石工作,語言模型(Language Model,LM)主要應(yīng)用于語音識別、拍照搜題、機(jī)器翻譯、智能語音對話等教育+AI領(lǐng)域。目前,語言模型在訓(xùn)練語料相對充足的智能客服等垂直領(lǐng)域已經(jīng)取得了比較理想的效果。然而,對于語言模型在教學(xué)場景中的研究和應(yīng)用學(xué)術(shù)界著墨不多,主要有兩個原因,一是數(shù)據(jù)壁壘,高質(zhì)量的面向教學(xué)場景的語料積累太少;二是教學(xué)場景的數(shù)據(jù)有其自身的特點:首先教學(xué)場景的語言具有獨特的話術(shù)性,如老師講課常用的話術(shù)、中英文數(shù)字結(jié)合等;第二,教學(xué)場景的語言具有知識點名詞專業(yè)性,如數(shù)學(xué)、物理、化學(xué)等學(xué)科的專有名詞;第三,教學(xué)場景中老師、學(xué)生的語言通常具有口語化的特點;第四,教學(xué)場景具有領(lǐng)域綜合性,老師講課會涉及到其他領(lǐng)域的知識,其目的是把知識點更好地傳達(dá)給學(xué)生。因此,專門針對教學(xué)場景訓(xùn)練一個高性能的語言模型勢在必行。本論文主要針對教學(xué)場景的數(shù)據(jù)設(shè)計并實現(xiàn)了基于深度學(xué)習(xí)的教學(xué)場景語言模型,并完...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
語言模型在教學(xué)場景中主要應(yīng)用示意圖
于基礎(chǔ)和核心的研究地位。但是面向教學(xué)場景的語言模型由于教學(xué)場景數(shù)據(jù)的缺、教學(xué)場景話術(shù)的獨特性、教學(xué)場景知識點的名詞專業(yè)性、教學(xué)場景語言口化和教學(xué)場景領(lǐng)域綜合性等原因,業(yè)界暫未出現(xiàn)一個高性能的語言模型。所以門針對教學(xué)場景進(jìn)行語言模型研究具有重要的意義。.2 語言模型及研究現(xiàn)狀語言模型其主旨是描述自然語言內(nèi)在固有規(guī)律的數(shù)學(xué)模型,應(yīng)用在各個需要句子序列進(jìn)行概率評估的任務(wù)中,是文本處理和語音信號處理的重點和基石。言模型的功能就是用來計算不同詞語組成一個句子的概率,利用語言模型可以斷哪個單詞序列出現(xiàn)的可能性更大、更加符合人說話的可能性。此外,語言模也可以通過給定若干個單詞序列,預(yù)測下一個最可能出現(xiàn)的單詞。聲學(xué)模型、言模型和解碼器構(gòu)成了一個完整的語音識別引擎,語言模型就是對解碼器解碼的眾多可能結(jié)果進(jìn)行概率評估,概率最大的那個單詞序列即為識別出的文本。言模型功能圖如圖 1-2 所示。
語言模型發(fā)展歷程圖
本文編號:3553472
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
語言模型在教學(xué)場景中主要應(yīng)用示意圖
于基礎(chǔ)和核心的研究地位。但是面向教學(xué)場景的語言模型由于教學(xué)場景數(shù)據(jù)的缺、教學(xué)場景話術(shù)的獨特性、教學(xué)場景知識點的名詞專業(yè)性、教學(xué)場景語言口化和教學(xué)場景領(lǐng)域綜合性等原因,業(yè)界暫未出現(xiàn)一個高性能的語言模型。所以門針對教學(xué)場景進(jìn)行語言模型研究具有重要的意義。.2 語言模型及研究現(xiàn)狀語言模型其主旨是描述自然語言內(nèi)在固有規(guī)律的數(shù)學(xué)模型,應(yīng)用在各個需要句子序列進(jìn)行概率評估的任務(wù)中,是文本處理和語音信號處理的重點和基石。言模型的功能就是用來計算不同詞語組成一個句子的概率,利用語言模型可以斷哪個單詞序列出現(xiàn)的可能性更大、更加符合人說話的可能性。此外,語言模也可以通過給定若干個單詞序列,預(yù)測下一個最可能出現(xiàn)的單詞。聲學(xué)模型、言模型和解碼器構(gòu)成了一個完整的語音識別引擎,語言模型就是對解碼器解碼的眾多可能結(jié)果進(jìn)行概率評估,概率最大的那個單詞序列即為識別出的文本。言模型功能圖如圖 1-2 所示。
語言模型發(fā)展歷程圖
本文編號:3553472
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3553472.html
最近更新
教材專著