微博中基于增強型倒排索引的特定文檔影響力估計算法
本文關鍵詞:微博中基于增強型倒排索引的特定文檔影響力估計算法
更多相關文章: 信息獲取 倒排索引 TFIDF指標 索引標記
【摘要】:微博搜索系統(tǒng)中,將微博帖子根據(jù)搜索相關性和重要性進行排序,并通過列表的方式返回結果,是目前信息內(nèi)容的主要展示手段。基于向量空間模型的打分函數(shù)被廣泛地應用于該類系統(tǒng)中。事實上,微博系統(tǒng)中的帖子重要性打分函數(shù)實際取值并不為用戶所見,文檔的影響力通過排名的方式表現(xiàn)出來。對于一個檢索外的文檔,如何衡量其在信息檢索系統(tǒng)文庫中的影響力?一般搜索引擎或信息檢索系統(tǒng)并不能很好地回答該問題。在微博短文本的基礎上引入了社交影響力這一概念,并通過在文本倒排索引基礎上設置反向位置標記,給出了一種全新的影響力度量指標,有效地回答了前述問題。理論分析和數(shù)據(jù)實驗驗證了算法的有效性和效率。
【作者單位】: 國防科學技術大學計算機學院;
【關鍵詞】: 信息獲取 倒排索引 TFIDF指標 索引標記
【基金】:國家863計劃資助項目(2011AA010702,2012AA01A402) 國家自然科學基金資助項目(91124002) 科技支撐計劃課題(2012BAH38B06)
【分類號】:TP391.3
【正文快照】: 1引言隨著信息技術的快速發(fā)展和互聯(lián)網(wǎng)應用的普及,社會各行業(yè)對信息化需求不斷增加,產(chǎn)生了大量的信息內(nèi)容,極大促進了信息檢索系統(tǒng)的發(fā)展。特別是近年來,以微博為代表的社交網(wǎng)絡獲得了快速的發(fā)展,受社交網(wǎng)絡的推動,信息傳播模式快速朝著去中心化的方向發(fā)展,人類使用互聯(lián)網(wǎng)的方
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 鄭煒;梁戰(zhàn)平;梁建;;基于個性化數(shù)據(jù)的搜索引擎技術研究[J];情報理論與實踐;2013年10期
2 劉海峰;于利軍;劉守生;;一種基于類別分布信息的文本特征選擇模型[J];圖書情報工作;2013年15期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 張乃靜;基于林業(yè)科學數(shù)據(jù)的語義檢索研究[D];中國林業(yè)科學研究院;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前6條
1 苑琳琳;中醫(yī)脾胃系疾病辨證診斷若干關鍵技術研究[D];浙江理工大學;2013年
2 王衛(wèi)芳;web服務組合的可信評估方法研究[D];中南大學;2012年
3 黃繼超;k-means算法若干改進和應用[D];中南大學;2013年
4 萬猛;基于貝葉斯網(wǎng)的軸承失效分析應用研究[D];河南科技大學;2013年
5 董金威;基于高斯核函數(shù)的帶鋼邊緣缺陷檢測系統(tǒng)的設計與實現(xiàn)[D];華中科技大學;2013年
6 徐濤;基于多特征的足球視頻索引算法研究[D];華中科技大學;2013年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王智強,劉建毅;一種實時更新索引結構的設計與實現(xiàn)[J];計算機系統(tǒng)應用;2005年10期
2 王宏宇;;基于Native-XML數(shù)據(jù)庫倒排索引算法研究[J];情報科學;2006年07期
3 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計算機工程;2007年23期
4 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設計與實現(xiàn)[J];現(xiàn)代情報;2009年07期
5 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計算機(專業(yè)版);2008年01期
6 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學學報(自然科學版);2009年06期
7 吐爾洪·吾司曼;維尼拉·木沙江;;維、哈、柯多語種搜索引擎中索引器的研究[J];新疆大學學報(自然科學版);2011年02期
8 余淼;楊丹;趙俊芹;;垂直搜索引擎的關鍵技術研究[J];軟件導刊;2007年23期
9 寧可為;;自動答疑系統(tǒng)知識庫文本的索引研究[J];電腦知識與技術;2009年35期
10 寧可為;王煒;;基于倒排索引的答疑系統(tǒng)知識庫文本研究[J];湖北廣播電視大學學報;2010年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機制研究[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2007年
2 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年
3 壽國礎;;公網(wǎng)接入技術在信息獲取中應用分析[A];第二屆全國信息獲取與處理學術會議論文集[C];2004年
4 張健;;空間信息獲取與傳輸中的無線電技術發(fā)展分析[A];第二屆全國信息與電子工程學術交流會暨第十三屆四川省電子學會曙光分會學術年會論文集[C];2006年
5 劉卉;張漫;;無線傳感器網(wǎng)絡技術在農(nóng)業(yè)中應用[A];2007年中國農(nóng)業(yè)工程學會學術年會論文摘要集[C];2007年
6 陳文平;毛寬榮;趙嚴杰;;在互聯(lián)網(wǎng)絡中獲取便秘相關信息[A];中華中醫(yī)藥學會肛腸分會換屆會議暨便秘專題研討會論文?痆C];2007年
7 董祥千;左志宏;劉強國;;Lucene倒排索引文件的實現(xiàn)與優(yōu)化[A];四川省通信學會2006年學術年會論文集(二)[C];2006年
8 徐秀芳;劉銀年;王建宇;;多譜段相機的信息獲取與處理技術[A];第二屆全國信息獲取與處理學術會議論文集[C];2004年
9 何銓;Hora W.Tjitra;馬劍虹;;群體復雜問題解決中策略使用和信息獲取的模擬研究[A];第十屆全國心理學學術大會論文摘要集[C];2005年
10 王紀華;趙春江;劉良云;鄭文剛;王秀;黃文江;;基于數(shù)字技術的農(nóng)田信息快速獲取與表達[A];中國數(shù)字農(nóng)業(yè)與農(nóng)村信息化學術研究研討會論文集[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 潘學俊;聚焦信息戰(zhàn)前沿:“信息獲取”[N];解放軍報;2003年
2 鐘文;信息獲取新模式推動互聯(lián)網(wǎng)搜索引擎“變臉”[N];國際商報;2003年
3 本報記者 王翌;“搜索”改變信息獲取方式[N];計算機世界;2004年
4 彭勃;信息獲取決勝未來[N];解放軍報;2002年
5 馬煒;格式差異不能限制信息獲取[N];中國計算機報;2004年
6 李兆平;北京:小面積基礎地理信息獲取有新法[N];中國測繪報;2008年
7 黃岳;Web2.0下一步怎么走?[N];電腦報;2006年
8 記者 常思哲;沈陽造出飛行機器人[N];沈陽日報;2009年
9 李杰;農(nóng)業(yè)生物—環(huán)境信息獲取無線傳感器網(wǎng)絡技術研究[N];科技日報;2007年
10 錢曉虎邋通訊員 譚依娜;東海艦隊某基地高山海島部隊架通信息“高速路”[N];解放軍報;2007年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 金鑫;數(shù)字化背景下的消費者信息獲。簩ι鐣畔①Y源的選擇和反思[D];復旦大學;2012年
2 張方華;知識型企業(yè)的社會資本與技術創(chuàng)新績效研究[D];浙江大學;2005年
3 胡良梅;基于信息融合的圖像理解方法研究[D];合肥工業(yè)大學;2006年
4 朱婕;網(wǎng)絡環(huán)境下個體信息獲取行為研究[D];吉林大學;2007年
5 陸再林;基于圖形理解的建筑工程量信息獲取原理、方法及其應用研究[D];浙江大學;2002年
6 馬靜華;基于運動信息獲取及智能處理的運動員訓練指導系統(tǒng)研究[D];中國科學技術大學;2006年
7 宋記鋒;信息獲取與應用的若干關鍵技術研究[D];中國科學技術大學;2008年
8 吳德會;基于質(zhì)量信息集成的智能質(zhì)量控制技術研究[D];合肥工業(yè)大學;2006年
9 喻友平;企業(yè)客戶服務中的客戶識別方法與支持平臺的研究[D];華中科技大學;2007年
10 岳小莉;基于多粒度的產(chǎn)品信息獲取技術研究[D];浙江大學;2002年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 張治平;Web信息精確獲取技術研究[D];國防科學技術大學;2004年
2 崔建曄;VTS的信息獲取與播發(fā)技術的研究[D];大連海事大學;2009年
3 董富強;網(wǎng)絡用戶行為分析研究及其應用[D];西安電子科技大學;2005年
4 劉紅雨;基于倒排索引的微博話題檢測[D];哈爾濱工業(yè)大學;2013年
5 董長春;基于Hadoop的倒排索引技術的研究[D];遼寧大學;2011年
6 代萬能;倒排索引技術在Hadoop平臺上的研究與實現(xiàn)[D];電子科技大學;2013年
7 汪紅敏;基于固態(tài)硬盤的倒排索引動態(tài)更新策略及其優(yōu)化研究[D];華中科技大學;2013年
8 張博;基于Lucene倒排索引性能的研究與優(yōu)化[D];昆明理工大學;2013年
9 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學;2009年
10 楊國營;基于MapReduce模型文本分類算法的研究[D];遼寧大學;2013年
,本文編號:1062083
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1062083.html