論文抄襲檢測(cè)中特征選擇
本文關(guān)鍵詞:論文抄襲檢測(cè)中特征選擇,,由筆耕文化傳播整理發(fā)布。
【摘要】:選取多少個(gè)最佳特征以及采用什么評(píng)估函數(shù),針對(duì)不同的問(wèn)題選取策略也有所不同。針對(duì)論文抄襲檢測(cè)問(wèn)題,如何確定特征選擇數(shù)量和選擇評(píng)估函數(shù)是文章研究的目的。在分析論文抄襲的主要形式和手段基礎(chǔ)上,針對(duì)文本內(nèi)容抄襲,闡述了文本特征表示的主要方法和特征選擇常用策略,最后對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,得出基本結(jié)論。
【作者單位】: 安徽財(cái)經(jīng)大學(xué)成人教育學(xué)院;
【關(guān)鍵詞】: 抄襲檢測(cè) 特征選擇 文本表示 向量空間模型
【基金】:教育部社科研究基金青年項(xiàng)目(07JC870006) 安徽財(cái)經(jīng)大學(xué)教研重點(diǎn)項(xiàng)目(ACJYZD200914)
【分類(lèi)號(hào)】:TP391.43
【正文快照】: 1引言論文抄襲的形式和手段多種多樣,具體包括抄襲觀點(diǎn)、文字、圖像、表格、數(shù)據(jù)、模型與公式等。在所曝光的案例中,文本抄襲的情況占大多數(shù),因此本文主要研究論文抄襲中文本內(nèi)容抄襲的檢測(cè)問(wèn)題。從一篇文檔的語(yǔ)法層次來(lái)看,它是由詞、短語(yǔ)、句子和段落所構(gòu)成的。所以,這
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 程澤凱,陸小藝;文本分類(lèi)中的特征選擇方法[J];安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
2 劉麗珍,宋瀚濤;文本分類(lèi)中的特征選取[J];計(jì)算機(jī)工程;2004年04期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 谷峰;吳揚(yáng)揚(yáng);;文本分類(lèi)關(guān)鍵技術(shù)[J];福建電腦;2006年09期
2 張脂平,林世平;Web文本挖掘中特征提取算法的分析及改進(jìn)[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 謝科;張輝;陳鵬;龐斌;;文本分類(lèi)系統(tǒng)關(guān)鍵技術(shù)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
4 鐘茂生;WEB頁(yè)面的模糊聚類(lèi)[J];華東交通大學(xué)學(xué)報(bào);2004年05期
5 程澤凱,陸小藝;文本分類(lèi)中的特征選擇方法[J];安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
6 張玉葉;李連;劉海見(jiàn);王春歆;;文本過(guò)濾中的特征抽取應(yīng)用研究[J];海軍航空工程學(xué)院學(xué)報(bào);2005年01期
7 石敏;康耀紅;;一種聯(lián)合的文本分類(lèi)特征抽取函數(shù)[J];海南大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年04期
8 萬(wàn)樂(lè);劉萬(wàn)春;;類(lèi)別特征詞權(quán)重加權(quán)文本分類(lèi)方法[J];軍民兩用技術(shù)與產(chǎn)品;2006年03期
9 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計(jì)算機(jī)研究與發(fā)展;2002年10期
10 唐煥玲,孫建濤,陸玉昌;文本分類(lèi)中結(jié)合評(píng)估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 魯明羽;孫建濤;陸玉昌;;一種基于聯(lián)想的網(wǎng)頁(yè)推薦方法[A];第五屆全球智能控制與自動(dòng)化大會(huì)會(huì)議論文集(4)[C];2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 徐建鎖;知識(shí)管理和文本挖掘的若干問(wèn)題研究[D];天津大學(xué);2004年
2 張友華;面向智能服務(wù)的Web內(nèi)容計(jì)算研究與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
3 王秀娟;文本檢索中若干問(wèn)題研究[D];北京郵電大學(xué);2006年
4 謝學(xué)敏;基于動(dòng)態(tài)流通語(yǔ)料庫(kù)(DCC)的流行語(yǔ)釋義信息自動(dòng)提取研究[D];北京語(yǔ)言大學(xué);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 何堯;基于半監(jiān)督學(xué)習(xí)的中文文檔分類(lèi)技術(shù)研究[D];中南大學(xué);2005年
2 范彥彬;基礎(chǔ)教育資源搜索引擎中自動(dòng)文摘技術(shù)研究[D];南京師范大學(xué);2006年
3 廖海波;基于投影尋蹤回歸的文本分類(lèi)研究[D];江西師范大學(xué);2005年
4 付雪峰;基于模糊—粗糙集的文本分類(lèi)模型[D];江西師范大學(xué);2005年
5 朱瑋;IRT和規(guī)則空間在文本分類(lèi)中的應(yīng)用研究[D];江西師范大學(xué);2005年
6 劉建波;基于Agent的用戶(hù)興趣模型的研究[D];沈陽(yáng)工業(yè)大學(xué);2005年
7 王曉慶;基于RBF網(wǎng)絡(luò)的文本自動(dòng)分類(lèi)的研究[D];江西師范大學(xué);2003年
8 鐘茂生;基于智能Agent的個(gè)性化Web瀏覽器研究與實(shí)現(xiàn)[D];江西師范大學(xué);2003年
9 王漢萍;粗糙集理論在文本挖掘的分類(lèi)算法中的應(yīng)用研究[D];中國(guó)海洋大學(xué);2003年
10 劉鋼;基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)系統(tǒng)NNTCS的設(shè)計(jì)和實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(軟件研究所);2003年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 范勁松,方廷健;特征選擇和提取要素的分析及其評(píng)價(jià)[J];計(jì)算機(jī)工程與應(yīng)用;2001年13期
2 張寧,賈自艷,史忠植;使用KNN算法的文本分類(lèi)[J];計(jì)算機(jī)工程;2005年08期
3 秦進(jìn),陳笑蓉,汪維家,陸汝占;文本分類(lèi)中的特征抽取[J];計(jì)算機(jī)應(yīng)用;2003年02期
4 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動(dòng)分類(lèi)系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2001年09期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李正;倪遠(yuǎn)平;劉迪;王海鵬;;實(shí)蠅圖像識(shí)別中的形態(tài)特征提取研究[J];機(jī)械與電子;2010年S1期
2 馮霞;劉志輝;田繼存;;基于假設(shè)檢驗(yàn)的文本分類(lèi)特征選擇[J];信息與控制;2011年03期
3 張國(guó)梁;肖超鋒;;基于SVM新聞文本分類(lèi)的研究[J];電子技術(shù);2011年08期
4 鄭婭峰;張巧榮;肖會(huì)敏;;自動(dòng)特征選擇和加權(quán)的圖像顯著區(qū)域檢測(cè)[J];計(jì)算機(jī)工程與應(yīng)用;2011年24期
5 冷強(qiáng)奎;秦玉平;王春立;;基于句子相似度的論文抄襲檢測(cè)模型研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年24期
6 王桂娟;印鑒;詹衛(wèi)許;;基于類(lèi)別信息的特征子圖選擇策略[J];計(jì)算機(jī)科學(xué);2011年08期
7 楊經(jīng);林世平;;基于SVM的文本詞句情感分析[J];計(jì)算機(jī)應(yīng)用與軟件;2011年09期
8 奉國(guó)和;鄭偉;;文本分類(lèi)特征降維研究綜述[J];圖書(shū)情報(bào)工作;2011年09期
9 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻(xiàn)度的特征選擇方法在文本分類(lèi)中應(yīng)用[J];大連理工大學(xué)學(xué)報(bào);2011年04期
10 計(jì)智偉;胡珉;;一種雙重過(guò)濾式特征選擇算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年19期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李娜;曾向陽(yáng);;目標(biāo)識(shí)別中的樣本選擇和特征選擇聯(lián)合算法研究[A];2009年西安-上海聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2009年
2 張永;陳思睿;楊志勇;;一種改進(jìn)的文本分類(lèi)方法的研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
4 靖紅芳;王斌;楊雅輝;;基于類(lèi)別分布的特征選擇框架[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 劉怡;高s
本文編號(hào):440803
本文鏈接:http://www.sikaile.net/wenshubaike/gzzj/440803.html