天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

excel復(fù)制成文本_手機(jī)復(fù)制軟件內(nèi)文本_中文文本復(fù)制檢測技術(shù)研究.pdf 全文 文檔投稿網(wǎng)

發(fā)布時間:2016-08-15 14:02

  本文關(guān)鍵詞:中文文本復(fù)制檢測技術(shù)研究,由筆耕文化傳播整理發(fā)布。


杭州電子科技大學(xué) 碩士學(xué)位論文 中文文本復(fù)制檢測技術(shù)研究 姓名:盧小康 申請學(xué)位級別:碩士 專業(yè):計(jì)算機(jī)軟件與理論 指導(dǎo)教師:王小華 20091101 杭州電子科技大學(xué)碩士學(xué)位論文 摘 要 在信息社會中,隨著計(jì)算機(jī)技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)已成 為人們獲取信息的一個重要途徑。人們預(yù)測,在不久的將來網(wǎng)絡(luò)媒體將會取代平 面媒體成為人們獲取信息的主要渠道。面對因特網(wǎng)上信息持續(xù)爆炸式地增長,如 何從中快速找到用戶所需要的信息成為一個難題。 為解決這個難題,搜索引擎技術(shù)應(yīng)運(yùn)而生。然而,現(xiàn)在的搜索引擎技術(shù)并非 十分完善,返回結(jié)果集合中存在大量重復(fù)網(wǎng)頁。這些重復(fù)網(wǎng)頁主要是因?yàn)榫W(wǎng)站間 的轉(zhuǎn)載引起的,它不但加大了用戶檢索到所需信息的難度,也浪費(fèi)了存儲空間。 因此,,檢測出大量重復(fù)網(wǎng)頁,避免重復(fù)存儲,使信息檢索做到快速、準(zhǔn)確是一項(xiàng) 有意義的工作。另一方面,在因特網(wǎng)電子商務(wù)環(huán)境下,數(shù)字商品很容易被非法復(fù) 制和擴(kuò)散,這無疑會妨礙電子商務(wù)的健康發(fā)展。復(fù)制檢測技術(shù)一定程度上能輔助 解決上述問題。目前國內(nèi)中文文本復(fù)制檢測研究還不成熟,沒有一個完善的解決 方案,許多問題需要解決。 本文首先對文本復(fù)制檢測技術(shù)的現(xiàn)狀和發(fā)展進(jìn)行了簡要的回顧,對文本復(fù)制 檢測技術(shù)的相關(guān)技術(shù)作了研究,并對中文文本預(yù)處理過程、文本分塊和特征提取 策略、文本相似度的度量方法、文本復(fù)制檢測算法等問題進(jìn)行了詳細(xì)論述。分析 了常用的復(fù)制檢測算法,并對


  本文關(guān)鍵詞:中文文本復(fù)制檢測技術(shù)研究,由筆耕文化傳播整理發(fā)布。



本文編號:94637

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/94637.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d5a14***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com