天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 經濟論文 > 信息經濟論文 >

基于關聯(lián)規(guī)則的微博主題搜索策略研究

發(fā)布時間:2020-03-08 08:12
【摘要】:在Web2.0時代,微博已成為一個有重要價值的信息平臺。為了利用微博平臺為用戶提供較好的搜索服務,論文應用關聯(lián)規(guī)則挖掘技術識別微博相關話題,利用相關話題擴充機制和話題語義相似度度量,構建微博搜索索引文件。實驗分析表明:相對于傳統(tǒng)的關鍵詞搜索策略,論文提出的搜索策略能從浩瀚的微博信息平臺中找到更加有效的搜索結果。
【圖文】:

設計圖,檢索策略,設計圖


向量余弦來度量搜索話題與文檔的相似度。2檢索策略設計選擇基于API數(shù)據(jù)采集方式收集微博中的信息。用ICTCLAS軟件對采集的博文進行分詞處理,結合VSM思想,實現(xiàn)文檔數(shù)據(jù)的結構化處理;利用微博平臺話題的用戶關注網絡,得到用戶影響力,繼而利用關聯(lián)規(guī)則將分詞數(shù)據(jù)與用戶影響力結合起來,得到關聯(lián)文本;對于短文本式搜索,查詢擴充機制是必不可少的工作,為了保證微博查詢擴充機制的實現(xiàn),構建了基于關聯(lián)文本的索引文件。在對搜索詞進行擴充后,便能通過之前搜集到的信息和索引文件快速準確的返回搜索結果。設計思路如圖1所示。圖1檢索策略設計圖2.1分詞處理國內分詞系統(tǒng)的主要思想是以詞典為基礎,進行字符串匹配,以少量詞法、句法以及語義規(guī)則進行輔助;贜-最短路徑方法的中科院的中文分詞系統(tǒng)ICTCLAS在中文分詞上有著比較廣泛的應用,同時它還提供了多種接口,,如C#、C等接口,可以通過接口,調用該軟件。提取微博的關鍵字,對句子含義造成噪音干擾的詞匯進行去除,僅保留具有能涵蓋句子意義的詞匯,也就是通過去除噪音,清洗文本信息。根據(jù)對微博熱點話題,如“汶川地震”、“喬布斯去世”等語句組成元素的分析,可以發(fā)現(xiàn),名詞性質的詞是占絕對分量。所以在提取微博關鍵詞時僅保留名詞,動名詞,專有名詞等詞性的詞,其它詞性的詞匯一律清洗掉。2.2關聯(lián)規(guī)則與用戶影響力截取相應時間段內的微博數(shù)據(jù),利用關聯(lián)規(guī)則挖掘技術識別相關話題。該技術的基本思想是將類Apriori的關聯(lián)規(guī)則算法應用到文本挖掘中。規(guī)則支持度表示規(guī)則出現(xiàn)的頻率,規(guī)則置信度表示規(guī)則的可靠性,可以根據(jù)自己的需要設置兩者合理的閾值。在進行關聯(lián)分析之前,需對話題中的用戶影響力進行評價。在微博中,用戶間的關注關系已構成了社區(qū),即用戶

【參考文獻】

相關期刊論文 前3條

1 郭煒;何丕廉;;面向領域的語義排序與自適應熱點算法[J];天津大學學報;2007年07期

2 霍華,馮博琴;一種基于微分流型的Web檢索算法[J];西安交通大學學報;2005年02期

3 崔爭艷;;基于語義的微博短信息分類[J];現(xiàn)代計算機(專業(yè)版);2010年08期

相關碩士學位論文 前1條

1 唐朝輝;潛在語義分析在互聯(lián)網數(shù)據(jù)挖掘中的應用研究[D];湖南大學;2009年

【共引文獻】

相關期刊論文 前8條

1 李龍;李芝棠;涂浩;史春永;;一種分布式微博數(shù)據(jù)采集平臺的設計與實現(xiàn)[J];廣西大學學報(自然科學版);2011年S1期

2 張東霞;;基于高校學生微博的輿情熱點分析與發(fā)現(xiàn)[J];東南傳播;2013年06期

3 王志曉;張大陸;王玉紅;王東;;P2P語義搜索研究進展[J];計算機科學;2010年04期

4 鄭斐然;苗奪謙;張志飛;高燦;;一種中文微博新聞話題檢測的方法[J];計算機科學;2012年01期

5 程亮;邱云飛;孫魯;;微博謠言檢測方法研究[J];計算機應用與軟件;2013年02期

6 周勝臣;瞿文婷;石英子;施詢之;孫韻辰;;中文微博情感分析研究綜述[J];計算機應用與軟件;2013年03期

7 陳正思;張建中;;分詞在行業(yè)知識檢索中的差異影響與改進對策[J];網絡財富;2010年22期

8 趙文兵;朱慶華;吳克文;黃奇;;微博客用戶特性及動機分析——以和訊財經微博為例[J];現(xiàn)代圖書情報技術;2011年02期

相關碩士學位論文 前9條

1 孫勝平;中文微博客熱點話題檢測與跟蹤技術研究[D];北京交通大學;2011年

2 張玉;基于社會化標簽的個性化推薦系統(tǒng)研究[D];合肥工業(yè)大學;2011年

3 高寶軍;Web結構挖掘中PageRank算法優(yōu)化研究[D];蘭州大學;2011年

4 劉義亮;基于元搜索調度算法的領域搜索模型研究[D];大連理工大學;2008年

5 黃波;基于向量空間模型和LDA模型相結合的微博客話題發(fā)現(xiàn)算法研究[D];西南交通大學;2012年

6 郭瑞;基于GPU和內容標簽的個性化推薦系統(tǒng)研究[D];武漢科技大學;2012年

7 時睿;面向短文本的網絡輿情分析[D];西安電子科技大學;2012年

8 李旭;移動微博應用管理系統(tǒng)的研究設計與實現(xiàn)[D];中山大學;2012年

9 方維;微博興趣識別與推送系統(tǒng)的研究與實現(xiàn)[D];華中科技大學;2012年

【二級參考文獻】

相關期刊論文 前10條

1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學學報(自然科學版);2002年05期

2 張俐,李晶皎,胡明涵,姚天順;中文WordNet的研究及實現(xiàn)[J];東北大學學報;2003年04期

3 劉麗清;;微博雖“微”足值道爾——微博特性之淺析[J];東南傳播;2009年11期

4 汪曉巖,胡慶生,李斌,莊鎮(zhèn)泉;面向Internet的個性化智能信息檢索[J];計算機研究與發(fā)展;1999年09期

5 邢春曉;高鳳榮;戰(zhàn)思南;周立柱;;適應用戶興趣變化的協(xié)同過濾推薦算法[J];計算機研究與發(fā)展;2007年02期

6 王永恒;賈焰;楊樹強;;大規(guī)模文本數(shù)據(jù)庫中的短文分類方法[J];計算機工程與應用;2006年22期

7 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[J];計算機科學;2004年10期

8 張丙奇;基于領域知識的個性化推薦算法研究[J];計算機工程;2005年21期

9 沈云斐;沈國強;蔣麗華;覃征;;基于時效性的Web頁面?zhèn)性化推薦模型的研究[J];計算機工程;2006年13期

10 夏天;;漢語詞語語義相似度計算研究[J];計算機工程;2007年06期

【相似文獻】

相關期刊論文 前10條

1 嚴仍榮;;數(shù)值型關聯(lián)規(guī)則挖掘在客戶關系管理中的應用[J];皖西學院學報;2007年05期

2 呂圣軍;郭偉青;;房地產CRM的挖掘算法應用[J];商場現(xiàn)代化;2008年06期

3 朱慧爽;;數(shù)據(jù)挖掘在紡織高?蒲泄芾硐到y(tǒng)中的應用[J];山東紡織經濟;2008年03期

4 孫景;田甜;;基于多層關聯(lián)規(guī)則的銀行產品交叉銷售策略[J];中國金融電腦;2008年10期

5 張志彥;李俊峰;;關聯(lián)規(guī)則挖掘在學生成績分析中的應用[J];科技和產業(yè);2009年05期

6 劉芳;晏志勇;;基于ART的電子商務推薦系統(tǒng)的研究與實現(xiàn)[J];中國商貿;2009年07期

7 甘振韜;;基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術在網絡教學中的應用探討[J];科學咨詢(決策管理);2010年01期

8 吳學民;;基于關聯(lián)規(guī)則的股票走勢關聯(lián)挖掘研究[J];科協(xié)論壇(下半月);2010年03期

9 郭卜銘;呂渭濟;;高校科研管理中的數(shù)據(jù)挖掘技術及應用[J];科技和產業(yè);2007年06期

10 何躍;郭輝;;應用關聯(lián)規(guī)則挖掘研究觀眾喜愛的電視節(jié)目[J];統(tǒng)計與決策;2007年11期

相關會議論文 前10條

1 谷姍姍;秦首科;胡大斌;周傲英;;面向關聯(lián)規(guī)則挖掘的敏感規(guī)則隱藏技術[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

2 陳曉云;李澤霞;劉幸輝;彭文靜;;關聯(lián)規(guī)則挖掘過程中的模糊化方法研究[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2002年

3 張宇鵬;王麗珍;周麗華;;基于氣象數(shù)據(jù)的關聯(lián)規(guī)則挖掘[A];第十七屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2000年

4 王盛;董黎剛;李群;;一種基于逆序編碼的關聯(lián)規(guī)則挖掘研究[A];浙江省電子學會2010學術年會論文集[C];2010年

5 方芳;李建中;潘海為;;腦部醫(yī)學圖像中的關聯(lián)規(guī)則挖掘[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年

6 張鵬;于波;童云海;唐世渭;;基于隨機響應的隱私保護關聯(lián)規(guī)則挖掘[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年

7 張仲楠;孫志揮;;關系數(shù)據(jù)庫中限制性關聯(lián)規(guī)則挖掘的優(yōu)化[A];第十七屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2000年

8 李貝貝;樂嘉錦;;分布式環(huán)境下的隱私保護關聯(lián)規(guī)則挖掘[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2005年

9 楊曉雪;衡紅軍;;一種對XML數(shù)據(jù)進行關聯(lián)規(guī)則挖掘的方法研究[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年

10 周愛廣;李玉忱;蔣志芳;曹璐;;基于HOLAP的關聯(lián)規(guī)則挖掘[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2001年

相關重要報紙文章 前1條

1 浙江省金華市煙草專賣局 滿在明 廖明景;談卷煙專賣案件信息的挖掘[N];東方煙草報;2011年

相關博士學位論文 前10條

1 劉智;關聯(lián)規(guī)則挖掘方法及其在冠心病中醫(yī)診療中的應用研究[D];大連海事大學;2012年

2 何月順;關聯(lián)規(guī)則挖掘技術的研究及應用[D];南京航空航天大學;2010年

3 劉亞波;關聯(lián)規(guī)則挖掘方法的研究及應用[D];吉林大學;2005年

4 毛宇星;關聯(lián)規(guī)則挖掘在分類數(shù)據(jù)領域的擴展性研究[D];復旦大學;2010年

5 周皓峰;關聯(lián)規(guī)則挖掘的拓展性研究[D];復旦大學;2003年

6 高飛;關聯(lián)規(guī)則挖掘算法研究[D];西安電子科技大學;2001年

7 王瑋;基于概念格的關聯(lián)規(guī)則挖掘及變化模式研究[D];山東大學;2012年

8 王德興;基于概念格模型關聯(lián)規(guī)則挖掘的關鍵問題研究[D];合肥工業(yè)大學;2007年

9 顏躍進;最大頻繁項集挖掘算法的研究[D];國防科學技術大學;2005年

10 宋余慶;醫(yī)學圖像數(shù)據(jù)挖掘若干技術研究[D];東南大學;2005年

相關碩士學位論文 前10條

1 譚義紅;關聯(lián)規(guī)則挖掘及其在概念檢索中的應用研究[D];湖南大學;2003年

2 鄒麗;分布式系統(tǒng)下關聯(lián)規(guī)則挖掘的研究與實現(xiàn)[D];大連交通大學;2005年

3 黃鵬鶴;關聯(lián)規(guī)則挖掘及其在教務管理中的應用[D];大連交通大學;2005年

4 徐勇;基于概念格模型的分布式關聯(lián)規(guī)則挖掘研究[D];合肥工業(yè)大學;2006年

5 李偉;基于關聯(lián)規(guī)則B2C圖書銷售網站個性化推薦系統(tǒng)研究[D];對外經濟貿易大學;2007年

6 梁碧珍;目標頻繁項集挖掘算法與應用研究[D];廣西大學;2007年

7 陳耀東;遺傳算法在關聯(lián)規(guī)則挖掘中的應用[D];華東師范大學;2008年

8 唐文志;蟻群算法在關聯(lián)規(guī)則學習中的研究與應用[D];北京工業(yè)大學;2009年

9 李宏運;關聯(lián)規(guī)則挖掘在圖書館管理中的應用[D];華東師范大學;2009年

10 陳斌;條件獨立性在關聯(lián)規(guī)則挖掘中的研究和應用[D];河海大學;2004年



本文編號:2585519

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/xxjj/2585519.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶2957b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com