基于文本結(jié)構樹的論文復制檢測算法
本文關鍵詞:基于文本結(jié)構樹的論文復制檢測算法,由筆耕文化傳播整理發(fā)布。
【摘要】:針對目前學術界抄襲現(xiàn)象日趨嚴重的問題,提出基于文本結(jié)構樹的論文復制檢測算法。將一篇論文分為三層的結(jié)構樹:最上層的根節(jié)點表示整篇論文,分支節(jié)點表示句子包,葉節(jié)點表示句子。根據(jù)一個函數(shù)和句子的綜合相似度計算句子相似度,以最大句子相似度計算葉節(jié)點相似度,上層節(jié)點的相似度由相鄰的下層節(jié)點相似度計算得到。選用中國期刊全文數(shù)據(jù)庫中的論文進行測試,實驗結(jié)果證明該算法是可行的、高效的。
【作者單位】: 大連理工大學管理學院;
【關鍵詞】: 復制檢測 句子相似度 句子包 結(jié)構樹
【分類號】:TP391.1
【正文快照】: 1引言進入21世紀,知識已經(jīng)成為主要的經(jīng)濟資源和占支配地位的、甚至可能是唯一的競爭優(yōu)勢的源泉。計算機、網(wǎng)絡和通信技術的高速發(fā)展,給人們提供了大量的文檔、圖像、音頻、視頻等數(shù)字化信息。人們很容易訪問這些資源,尤其是學生和學術研究人員能夠輕松地找到課題研究的相關
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 呂學強,任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學學報(自然科學版);2003年06期
2 史彥軍,滕弘飛,金博;抄襲論文識別研究與進展[J];大連理工大學學報;2005年01期
3 鮑軍鵬,沈鈞毅,劉曉東,宋擒豹;自然語言文檔復制檢測研究綜述[J];軟件學報;2003年10期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 林鴻飛,戰(zhàn)學剛,姚天順;中文文本挖掘的特征導航機制[J];東北大學學報(自然科學版);2000年03期
2 楊思春;;一種改進的句子相似度計算模型[J];電子科技大學學報;2006年06期
3 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計的問答系統(tǒng)實現(xiàn)機制[J];大連理工大學學報;2006年02期
4 金博;史彥軍;滕弘飛;;基于篇章結(jié)構相似度的復制檢測算法[J];大連理工大學學報;2007年01期
5 譚建龍,莊超,白碩;一種實用Internet內(nèi)容版權保護系統(tǒng)的設計與實現(xiàn)[J];計算機研究與發(fā)展;2001年10期
6 王劍,周之英,肖慧勇;應用于結(jié)構化文本的檢索系統(tǒng)的設計和實現(xiàn)[J];計算機工程與應用;2003年19期
7 王萌,何婷婷,張偉;基于概念向量空間模型的中文自動文摘系統(tǒng)[J];計算機工程與應用;2005年01期
8 馬兆豐,馮博琴,宋擒豹,劉丹瑩;面向認證的傳統(tǒng)商品數(shù)字化防偽機制研究[J];計算機工程;2003年01期
9 李軍懷,張景,呂林濤,張志強;基于Internet的傳統(tǒng)商品防偽系統(tǒng)[J];計算機工程;2004年19期
10 金博,史彥軍,滕弘飛;中文文檔復制檢測系統(tǒng)研究[J];計算機工程;2005年19期
中國博士學位論文全文數(shù)據(jù)庫 前5條
1 彭強;復雜系統(tǒng)遠程智能故障診斷技術研究[D];南京理工大學;2004年
2 劉清堂;標準化教育資源版權保護機制研究[D];華中科技大學;2005年
3 楊雨圖;支持雙語的協(xié)同CAPP系統(tǒng)若干關鍵技術研究[D];南京航空航天大學;2006年
4 周四清;數(shù)字水印理論及應用研究[D];華南理工大學;2002年
5 于寶琴;成套電器企業(yè)異構數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 章成志;基于文本層次模型的Web概念挖掘研究[D];南京農(nóng)業(yè)大學;2002年
2 姜楠;可行的完備數(shù)字水印系統(tǒng)研究[D];山東師范大學;2003年
3 武瓊;基于元數(shù)據(jù)的web信息提取方法研究[D];山西大學;2003年
4 趙倩;數(shù)字水印版權保護系統(tǒng)[D];首都經(jīng)濟貿(mào)易大學;2004年
5 蔣超;軌道交通自動門遠程監(jiān)控系統(tǒng)中的智能故障診斷技術研究[D];南京理工大學;2004年
6 楊聰;基于口語對話的電話自動轉(zhuǎn)接與信息查詢技術研究[D];國防科學技術大學;2004年
7 李劍;英漢機器翻譯中的句型轉(zhuǎn)換和譯文生成[D];中國人民解放軍信息工程大學;2005年
8 李旭;基于串匹配方法的文檔復制檢測系統(tǒng)研究[D];燕山大學;2006年
9 張艷;面向高校師生的應用文機輔寫作關鍵技術研究[D];大連理工大學;2006年
10 連浩;基于布爾模型的網(wǎng)頁查重算法研究[D];中國科學院研究生院(計算技術研究所);2006年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 呂學強,任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學學報(自然科學版);2003年06期
2 朱靖波,王寶庫,姚天順;一種規(guī)則描述語言NPRDL語言[J];東北大學學報(自然科學版);1996年06期
3 史彥軍,滕弘飛,金博;抄襲論文識別研究與進展[J];大連理工大學學報;2005年01期
4 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學學報;2005年02期
5 鄭逢斌,陳志國,姜保慶,喬保軍;語義校對系統(tǒng)中的句子語義骨架模糊匹配算法[J];電子學報;2003年08期
6 何明;胡彩霞;;一種文本相似性的度量方法和計算方法[J];黃山學院學報;2005年06期
7 馬穎華,王永成,蘇貴洋,張宇萌;一種基于字同現(xiàn)頻率的漢語文本主題抽取方法[J];計算機研究與發(fā)展;2003年06期
8 林賢明,李堂秋,陳毅東;句子相似度的動態(tài)規(guī)劃求解及改進[J];計算機工程與應用;2004年35期
9 王榮波,池哲儒,常寶寶,柏曉靜;基于詞串粒度及權值的漢語句子相似度衡量[J];計算機工程;2005年13期
10 宋擒豹,楊向榮,沈鈞毅,齊勇;數(shù)字商品非法復制的檢測算法[J];計算機學報;2002年11期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 秦元巧;孫國強;;改進的句子相似度計算在問答系統(tǒng)中的應用[J];微計算機信息;2011年08期
2 安見才讓;;藏語句子相似度算法的研究[J];中文信息學報;2011年04期
3 王宏生;張敏;;一種基于語義網(wǎng)的相似度計算模型[J];微計算機信息;2011年07期
4 郭扉扉;尹文生;;改進型單向貼近度主觀題自動評分算法的研究[J];計算機工程與科學;2011年07期
5 王晉;孫涌;王璁瑋;;基于領域本體的文本相似度算法[J];蘇州大學學報(工科版);2011年03期
6 趙文娟;閆紅梅;王蔚林;;基于漢語框架網(wǎng)的語義角色標注算法[J];圖書情報工作;2011年06期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 宋彥;張桂平;蔡東風;;基于N-gram的句子相似度計算技術[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
2 張宇;劉挺;高立琦;車萬翔;朱傳靖;;基于常問問題集的在線客服實驗研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
3 菅小艷;鄭家恒;;一種改進的句子相似度計算方法[A];第二屆全國信息檢索與內(nèi)容安全學術會議(NCIRCS-2005)論文集[C];2005年
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 李旭;基于指紋和語義知識表示的中文文檔復制檢測方法[D];燕山大學;2010年
2 侯鋒;中文報業(yè)出版的文字質(zhì)量智能輔助控制技術研究[D];國防科學技術大學;2010年
3 宋玲;語義相似度計算及其應用研究[D];山東大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孫偉;基于文檔復制檢測技術的研究與實現(xiàn)[D];遼寧工程技術大學;2010年
2 李婷婷;基于語義結(jié)構的學術論文復制檢測技術研究與實現(xiàn)[D];北京郵電大學;2010年
3 劉雙明;文檔復制檢測的應用研究[D];太原理工大學;2010年
4 王森;基于主題樹的自上而下文本復制檢測研究[D];大連理工大學;2010年
5 盧小康;中文文本復制檢測技術研究[D];杭州電子科技大學;2009年
6 薛慧芳;句子相似度計算理論及應用研究[D];西北大學;2011年
7 楊茂;基于句子相似度的文本比對算法研究[D];電子科技大學;2010年
8 張振幸;基于知網(wǎng)的模塊化的中文句子相似度計算研究[D];安徽工業(yè)大學;2010年
9 劉青磊;漢語詞語及句子相似度算法研究與應用[D];電子科技大學;2011年
10 黃妮;網(wǎng)絡學習平臺中的分詞與句子相似度算法研究[D];陜西師范大學;2012年
本文關鍵詞:基于文本結(jié)構樹的論文復制檢測算法,由筆耕文化傳播整理發(fā)布。
,本文編號:403757
本文鏈接:http://www.sikaile.net/wenshubaike/gzzj/403757.html