一種基于語(yǔ)義向量空間模型的作業(yè)查重算法
發(fā)布時(shí)間:2017-08-13 01:23
本文關(guān)鍵詞:一種基于語(yǔ)義向量空間模型的作業(yè)查重算法
更多相關(guān)文章: 向量空間模型 文本相似度 語(yǔ)義分析
【摘要】:甄別作業(yè)重復(fù)和減少學(xué)術(shù)抄襲是教學(xué)實(shí)踐中的難點(diǎn)之一,近年來(lái)出現(xiàn)了許多基于文本相似度計(jì)算的作業(yè)查重算法,而文本相似度計(jì)算的精確性是此類算法的核心。傳統(tǒng)的基于向量空間模型的文本相似度算法只考慮文本中出現(xiàn)的詞項(xiàng),而沒(méi)有利用詞項(xiàng)的語(yǔ)義信息,針對(duì)上述不足,本文采用"刪除去除詞"、"合并近義詞"、"以語(yǔ)義主題作為向量空間的維度"3種策略對(duì)該算法進(jìn)行了改進(jìn)。通過(guò)設(shè)計(jì)中文文本相似度計(jì)算組件將算法運(yùn)用到作業(yè)查重中,并在真實(shí)數(shù)據(jù)中進(jìn)行測(cè)試。測(cè)試結(jié)果表明,本文提出的算法相比傳統(tǒng)的向量空間模型算法,其精確性有了進(jìn)一步的提高。
【作者單位】: 南通科技職業(yè)學(xué)院;
【關(guān)鍵詞】: 向量空間模型 文本相似度 語(yǔ)義分析
【基金】:江蘇省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“微課移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)”(201612684012Y)
【分類號(hào)】:TP391.1
【正文快照】: 引言 信息化時(shí)代各類學(xué)習(xí)網(wǎng)站、作業(yè)平臺(tái)的大量涌現(xiàn),在給教學(xué)帶來(lái)方便的同時(shí),也出現(xiàn)了一些問(wèn)題。部分學(xué)生在提交電子作業(yè)時(shí)存在僥幸心理,抄襲或只對(duì)同學(xué)作業(yè)稍做修改,甚至出現(xiàn)抄襲往屆學(xué)生作業(yè)的現(xiàn)象時(shí)有發(fā)生,完全靠教師人工檢測(cè)難度較大。如何甄別作業(yè)重復(fù)和減少學(xué)術(shù)抄襲是,
本文編號(hào):664681
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/664681.html
最近更新
教材專著