天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 教育論文 > 對外漢語論文 >

對外漢語閱讀材料的可讀性自動評估研究

發(fā)布時間:2020-05-06 12:01
【摘要】:對外漢語教學和個性化學習熱潮的到來引起對外漢語閱讀材料的需求量劇增,閱讀材料越發(fā)豐富,編排難度設(shè)置合理的高質(zhì)量對外漢語閱讀材料能夠為閱讀理,解能力和水平不同的學習者提供更快速掌握一門語言的便利。因此本論文開展對外漢語閱讀材料可讀性自動評估研究。本文在借鑒已有的可讀性評估研究基礎(chǔ)上,從漢語本體角度綜合考慮影響閱讀材料難度的因素,應用自然語言處理技術(shù)和數(shù)據(jù)庫管理技術(shù)提取對外漢語閱讀材料的特征,結(jié)合統(tǒng)計機器學習方法對文本進行可讀性評估。主要通過計算機文本分析工具對甄選有代表性的六套對外漢語中高級上下冊教材文章和閱讀材料進行自然語言處理,提取影響文本可讀性的詞語、語義、篇章等多個不同維度特征數(shù)據(jù),構(gòu)建可讀性評估模型。本文的主要創(chuàng)新點如下:(1)從漢語本體角度考慮教材文本的可讀性影響因素,主要甄選并提取詞語、語義、篇章等多個大維度上的特征。在詞語等級特征提取中,考慮到“同形多等級字”因素的影響處理重復數(shù)據(jù)并且結(jié)合《HSK詞匯等級標準大綱》來確定詞頻。特征總數(shù)目達到48個,較為全面地提取專家編排教材的可讀性設(shè)置漸變規(guī)律。另外分別從詞語、語義、篇章和整體四大維度構(gòu)建可讀性評估模型,從具體維度進行具體分析,多層面評估閱讀材料可讀性。(2)利用SVM算法分別進行分類和回歸建模,在回歸模型中,通過均勻分割的方法解決設(shè)置可讀性取值標簽的問題,相比較專家評估方法成本更低,也能有效避免模型過擬合問卷樣本中存在的局部性特征。在目前構(gòu)建的模型中,在獨立的測試集上實驗結(jié)果顯示,分類算法結(jié)果優(yōu)于均勻標簽后的回歸方法。然而回歸方法中均勻分配難度值對文章可讀性設(shè)置更加細致且精度更高,在今后教材的不斷改編和發(fā)展下,仍將作為一種適用于可讀性評估的可行性方法。
【圖文】:

組織結(jié)構(gòu)圖,對外漢語,自動評估,可讀性


1.2.3研究內(nèi)容逡逑對外漢語閱讀材料可讀性自動評估涉及的研究內(nèi)容主要包括漢語本體研宄和逡逑評估方法研究,見圖1.邋1對外漢語閱讀材料可讀性自動評估研宄架構(gòu)圖。逡逑首先從漢語本體出發(fā),探討詞語、語義、篇章等多個維度上的可讀性影響因素;逡逑其次是評估方法的研宄包括自然語言處理技術(shù)和數(shù)據(jù)庫管理技術(shù)對文本進行特征逡逑提取,選用合適的機器學習方法和評估指標進行可讀性評估;最后通過可讀性評估逡逑結(jié)果對應到漢語本體,具體分析哪些特征與文本可讀性相關(guān)性強?文章可讀性設(shè)置逡逑合理程度的區(qū)域范圍以及存在的問題?從多角度對可讀性評估結(jié)果進行分析和數(shù)逡逑據(jù)挖掘。最后將本研宄內(nèi)容在現(xiàn)實中得到應用,構(gòu)建對外漢語閱讀材料的的智能專逡逑家評估系統(tǒng)。逡逑可讀性評估(數(shù)據(jù)挖掘)逡逑A邐i\逡逑u.—邐——邋iL…逡逑機器學習模型逡逑對外漢語閱>邐訓練與優(yōu)化逡逑讀材料和特邐!\}犲危鈴?辶x險魘菔占危掊澹櫻渝義險繆″澹擼咤澹危蹋屑際酰櫻危停儒義鮮菘忮危櫻鄭擼ゅ義蝦河銼咎逖芯垮紋攔婪椒ㄑ芯垮義賢跡保倍醞夂河鐫畝斂牧峽啥列宰遠攔姥芯考芄雇煎義希保陳畚淖櫓峁瑰義媳疚牡淖櫓峁谷縵攏哄義系諞徽攏紫冉檣芰碩醞夂河鐫畝斂牧峽啥列云攔賴難芯勘塵昂脫繡騁庖澹,说辶x廈鞔搜繡車鬧匾院捅匾浴=幼挪雋搜芯磕勘輟⒛飩餼齙墓丶侍夂橢饕繡沖義夏諶藎嵌哉畚難繡陳雎緄母攀。最后列举了本文的讬┋结构,奠定本研究的伭x險逖芯克悸貳e義希沖義

本文編號:2651225

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jiaoyulunwen/duiwaihanyulunwen/2651225.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶83041***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com