基于元信息的云盤資源檢索結(jié)果去重
本文關(guān)鍵詞:基于元信息的云盤資源檢索結(jié)果去重 出處:《山東大學(xué)學(xué)報(bào)(理學(xué)版)》2016年07期 論文類型:期刊論文
更多相關(guān)文章: 搜索引擎 去重 云盤資源 元信息
【摘要】:區(qū)別于傳統(tǒng)計(jì)算網(wǎng)頁(yè)文本相似度的去重方法,以多媒體數(shù)據(jù)文件為主的云盤資源僅可利用相當(dāng)有限的元信息進(jìn)行檢索結(jié)果去重。針對(duì)這一問(wèn)題,以搭建的面向云盤資源數(shù)據(jù)的搜索引擎系統(tǒng)為基礎(chǔ),通過(guò)對(duì)云盤資源元信息特性的分析,發(fā)現(xiàn)除名稱之外,資源文件后綴名、占用空間大小、資源的用戶歸屬是判定重復(fù)記錄的有效特征。在此基礎(chǔ)上,給出了處理上述特征的歸一化方法,進(jìn)而使用無(wú)監(jiān)督方法進(jìn)行去重。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效對(duì)云盤資源檢索結(jié)果去重。
[Abstract]:Different from the traditional method to calculate the page text similarity, using meta information of search results is limited to only by the multimedia data file based cloud resources. To solve this problem, the search engine system resources to build the cloud oriented data as the foundation, through the analysis of cloud disk resource meta information characteristics the discovery, in addition to the name, the resource file suffix, space size, resource users belonging is effective in identifying the character of duplicate records. On this basis, given the normalization methods for the treatment of the above characteristics, and then use unsupervised method to weight. The experimental results show that this method can effectively for cloud resource retrieval the results of weight.
【作者單位】: 北京大學(xué)網(wǎng)絡(luò)與信息系統(tǒng)研究所;
【基金】:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)項(xiàng)目(2014CB340400) 國(guó)家自然科學(xué)基金資助項(xiàng)目(61272340,61472013)
【分類號(hào)】:TP333
【正文快照】:
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 閆俊伢;;基于MD5的網(wǎng)頁(yè)去重算法的設(shè)計(jì)與研究[J];實(shí)驗(yàn)室研究與探索;2013年12期
2 徐朝輝;趙淑梅;閆付亮;秦杰;;一種基于特征向量的改進(jìn)DSC網(wǎng)頁(yè)去重算法[J];科學(xué)技術(shù)與工程;2013年08期
3 熊忠陽(yáng);牙漫;張玉芳;;基于網(wǎng)頁(yè)正文結(jié)構(gòu)和特征串的相似網(wǎng)頁(yè)去重算法[J];計(jì)算機(jī)應(yīng)用;2013年02期
4 葛曉玢;劉杰;崔健;;基于版權(quán)信息的新聞網(wǎng)頁(yè)去重策略研究[J];電腦知識(shí)與技術(shù);2012年26期
5 曹玉娟;牛振東;趙X;彭學(xué)平;;基于概念和語(yǔ)義網(wǎng)絡(luò)的近似網(wǎng)頁(yè)檢測(cè)算法[J];軟件學(xué)報(bào);2011年08期
6 張玉連;王莎莎;宋桂江;;基于元搜索的網(wǎng)頁(yè)去重算法[J];燕山大學(xué)學(xué)報(bào);2011年02期
7 黃仁;馮勝;楊吉云;劉宇;敖民;;基于正文結(jié)構(gòu)和長(zhǎng)句提取的網(wǎng)頁(yè)去重算法[J];計(jì)算機(jī)應(yīng)用研究;2010年07期
8 王開軍;李健;張軍英;過(guò)立新;;聚類分析中類數(shù)估計(jì)方法的實(shí)驗(yàn)比較[J];計(jì)算機(jī)工程;2008年09期
9 陳基漓;牛秦洲;;基于特征碼的網(wǎng)頁(yè)去重[J];微計(jì)算機(jī)信息;2006年09期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁少倩;林濤;翟學(xué);徐遐齡;畢如玉;秦曉菁;;基于短路容量的含大規(guī)模新能源接入的電網(wǎng)狀態(tài)脆弱性評(píng)估方法研究[J];電力系統(tǒng)保護(hù)與控制;2016年13期
2 薛劍;呂立;孫詠;王丹妮;;應(yīng)用語(yǔ)義相似的海量網(wǎng)頁(yè)文本去重策略研究[J];小型微型計(jì)算機(jī)系統(tǒng);2016年06期
3 劉馳;閆宏飛;;基于元信息的云盤資源檢索結(jié)果去重[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2016年07期
4 楊永俠;施彥如;孫婷;孟丹;卜春燕;王旭;;基于空間聚類的西藏耕地后備資源開發(fā)組合模型[J];農(nóng)業(yè)機(jī)械學(xué)報(bào);2016年04期
5 于鵬;楊仁剛;;基于歐氏距離最佳K均值聚類的超級(jí)電容組故障在線鑒別方法[J];農(nóng)業(yè)工程學(xué)報(bào);2016年02期
6 孫宏;景崇毅;黃趕祥;王曉東;;基于機(jī)型等級(jí)的航線市場(chǎng)細(xì)分方法研究[J];中國(guó)民航飛行學(xué)院學(xué)報(bào);2016年01期
7 郭艷卿;趙銳;孔祥維;付海燕;蔣金平;;基于事件要素加權(quán)的新聞?wù)崛》椒╗J];計(jì)算機(jī)科學(xué);2016年01期
8 賁興龍;賈大文;袁林;;一種面向大規(guī)模網(wǎng)頁(yè)去重的三層分布式架構(gòu)[J];計(jì)算機(jī)與數(shù)字工程;2015年10期
9 吳林靜;劉清堂;黃景修;劉?;毛剛;;面向e-Learning的概念知識(shí)元表征模型研究[J];電化教育研究;2015年04期
10 陳婧;;基于語(yǔ)義網(wǎng)的軟件工程數(shù)據(jù)查詢處理技術(shù)[J];電子技術(shù)與軟件工程;2015年04期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張小娣;宋余慶;;基于網(wǎng)頁(yè)正文邏輯段落和長(zhǎng)句提取的網(wǎng)頁(yè)去重算法[J];圖書情報(bào)研究;2012年02期
2 秦杰;謝蕙;王春云;;基于SLCS的元搜索去重技術(shù)研究[J];圖書情報(bào)工作;2010年15期
3 黃仁;馮勝;楊吉云;劉宇;敖民;;基于正文結(jié)構(gòu)和長(zhǎng)句提取的網(wǎng)頁(yè)去重算法[J];計(jì)算機(jī)應(yīng)用研究;2010年07期
4 梁葉;梁京章;陽(yáng)紅;葉云;;近似鏡像檢測(cè)算法在文本消重中的應(yīng)用研究[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
5 張素智;樊得強(qiáng);;網(wǎng)頁(yè)去重方法研究及算法設(shè)計(jì)[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年02期
6 王祖析;;基于網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)消重高效檢測(cè)算法研究[J];佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
7 周小平;黃家裕;劉連芳;梁一平;申文明;;基于網(wǎng)頁(yè)正文主題和摘要的網(wǎng)頁(yè)去重算法[J];廣西科學(xué)院學(xué)報(bào);2009年04期
8 劉四維;章軼;夏勇明;錢松榮;;基于HTML標(biāo)記和長(zhǎng)句提取的網(wǎng)頁(yè)去重算法[J];微型電腦應(yīng)用;2009年08期
9 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計(jì)算機(jī)應(yīng)用;2009年S1期
10 樊勇;鄭家恒;;網(wǎng)頁(yè)去重方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年12期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 亦云;;我的云盤 資料丟失為哪般[J];電腦愛好者;2014年05期
2 王昌紅;;網(wǎng)絡(luò)云盤升級(jí)免費(fèi)進(jìn)行時(shí)[J];電腦知識(shí)與技術(shù)(經(jīng)驗(yàn)技巧);2014年07期
3 ;資訊[J];青年記者;2012年09期
4 白璐;;云盤大戰(zhàn) 你該投靠誰(shuí)[J];電腦愛好者;2013年18期
5 ;360隨身wifi將添"云U盤"功能[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年16期
6 曹春華;;為云盤加鎖 各有各招[J];電腦愛好者;2013年21期
7 劉英;;“好”網(wǎng)相伴 用好云盤學(xué)問(wèn)大[J];電腦愛好者;2013年22期
8 李新宇;;網(wǎng)絡(luò)云盤介紹——以360云盤和百度云為例[J];無(wú)線互聯(lián)科技;2014年01期
9 李軍;勞鳳丹;鄒仁明;;校園網(wǎng)云盤系統(tǒng)構(gòu)建研究[J];通信學(xué)報(bào);2013年S2期
10 張文雯;;360云盤三招妙用[J];電腦愛好者;2014年04期
相關(guān)重要報(bào)紙文章 前7條
1 陳平 本報(bào)記者 袁天志;六枝云盤工商所“三結(jié)合”助推個(gè)私經(jīng)濟(jì)發(fā)展[N];貴州日?qǐng)?bào);2011年
2 鄒蘭邋冷文浩 鐘源;云盤山上的希望[N];涼山日?qǐng)?bào)(漢);2008年
3 本報(bào)記者 葉菁;國(guó)內(nèi)云盤上演“搶客”大戰(zhàn) 免費(fèi)離線下載成殺手锏[N];通信信息報(bào);2013年
4 陳萍;云盤工商所 “四個(gè)到位”促“質(zhì)量興區(qū)”[N];六盤水日?qǐng)?bào);2010年
5 記者 史俊穎;利用優(yōu)勢(shì)發(fā)展特色農(nóng)業(yè) 增加農(nóng)民收入[N];四平日?qǐng)?bào);2014年
6 本報(bào)記者 王春波 李浩然 通訊員 張穎;云盤山養(yǎng)豬大戶的“致富經(jīng)”[N];楚雄日?qǐng)?bào)(漢);2011年
7 陳萍;云盤工商所 凈化社會(huì)文化市場(chǎng)[N];六盤水日?qǐng)?bào);2009年
相關(guān)碩士學(xué)位論文 前2條
1 王帥;面向多云盤的終端透明加密存儲(chǔ)系統(tǒng)研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2015年
2 李慧;基于MooseFS的移動(dòng)云盤系統(tǒng)的研究與設(shè)計(jì)[D];大連理工大學(xué);2014年
,本文編號(hào):1418267
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1418267.html