基于節(jié)點內容及拓撲結構的引文網絡社團劃分
本文關鍵詞:基于節(jié)點內容及拓撲結構的引文網絡社團劃分?,,由筆耕文化傳播整理發(fā)布。
【摘要】:引文網絡的社團劃分是文本挖掘的一種重要方法,為提高引文網絡社團劃分的準確性,本文提出一種綜合考慮引文網絡的內容和拓撲結構屬性的社團劃分方法。該算法首先利用改進的余弦相似度方法計算節(jié)點相似度,然后綜合考慮節(jié)點結構與內容相似度對網絡進行重構,在此基礎上以相鄰節(jié)點對相似度作為邊權,運用Louvain社團劃分方法對加權引文網絡進行社團劃分,提出一種綜合考慮節(jié)點內容及結構屬性的社團劃分方法。通過在真實引文網絡數(shù)據(jù)集上的實驗表明,本文所提出的方法能改善引文網絡的劃分效果。
【作者單位】: 中國科學院大學;中國科學院成都文獻情報中心;
【關鍵詞】: 引文網絡 社團劃分 聚類 文本挖掘 文本相似度
【基金】:“國家高技術研究發(fā)展計劃(863計劃)——微生物數(shù)字資源知識管理系統(tǒng)構建及關鍵技術研究”(2014AA021503) 中國科學院2013年度“西部之光”人才培養(yǎng)計劃“引文耦合網絡演化分析及在科技評價與預測中的應用研究”(科發(fā)人字〔2013〕165號(3-6))的成果之一
【分類號】:G353.1
【正文快照】: 引文網絡是由文獻間引用和被引用的特有關系所構成的整體[1],其節(jié)點代表科技文獻,邊代表論文之間的引證關系。引文網絡中包含了大量的信息,如文本信息、鏈接信息等,通過對其進行分析和挖掘,可以發(fā)現(xiàn)大量有用或潛在的知識。研究表明,引文數(shù)據(jù)存在明顯的集中和離散趨勢,同一研究
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭煒冬;;試卷相似度自動評估技術的研究[J];智能計算機與應用;2011年06期
2 趙濤;肖建;;二型模糊相似度及其應用[J];計算機工程與應用;2013年08期
3 徐志明;李棟;劉挺;李生;王剛;袁樹侖;;微博用戶的相似性度量及其應用[J];計算機學報;2014年01期
4 李桂林,陳曉云;關于聚類分析中相似度的討論[J];計算機工程與應用;2004年31期
5 秦玉平;楊興凱;;基于案例推理的區(qū)間屬性相似度研究[J];遼寧師范大學學報(自然科學版);2006年04期
6 蔣鵬;;基于本體的應急案例相似度算法研究[J];南昌高專學報;2009年03期
7 何亞;;詞語相似度算法的分析與改進[J];硅谷;2011年24期
8 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期
9 焦鵬;唐見兵;查亞兵;;仿真可信度評估中相似度方法的改進及其應用[J];系統(tǒng)仿真學報;2007年12期
10 姜毅;樂慶玲;;一種基于興趣相似度的學習社區(qū)算法[J];電腦知識與技術(學術交流);2007年16期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 劉海波;鄭德權;趙鐵軍;;基于相似度線性加權方法的檢索結果聚類研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
2 陸勁挺;路強;劉曉平;;對比相似度計算方法及其在功能樹擴展中的應用[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
3 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
4 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計算機技術與應用學術會議(CACIS·2010)暨全國第2屆安全關鍵技術與應用學術會議論文集[C];2010年
5 王茜;張衛(wèi)星;;基于分類樹相似度加權的協(xié)同過濾算法[A];2008年計算機應用技術交流會論文集[C];2008年
6 洪文學;王金甲;常鳳香;宋佳霖;劉文遠;王立強;;基于圖形特征增強的相似度分類器的研究[A];中國生物醫(yī)學工程進展——2007中國生物醫(yī)學工程聯(lián)合學術年會論文集(上冊)[C];2007年
7 雷慶;吳揚揚;;一種基于語義信息計算XML文檔相似度的新方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
8 葉正;林鴻飛;楊志豪;;基于問句相似度的中文FAQ問答系統(tǒng)研究[A];第三屆學生計算語言學研討會論文集[C];2006年
9 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集A輯一[C];2010年
10 王健;劉衍珩;焦玉;;VANETs信任傳播建模[A];中國通信學會通信軟件技術委員會2009年學術會議論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 王伽 衛(wèi)江;出入境證件照片應及時更換[N];中國國門時報;2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 操震洲;矢量數(shù)據(jù)動態(tài)多尺度網絡傳輸研究[D];南京大學;2015年
2 程亮;基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D];哈爾濱工業(yè)大學;2014年
3 劉振宇;基于區(qū)域相似度和特征降維的極化SAR影像分類[D];武漢大學;2013年
4 張明西;信息網絡中的相似度搜索問題研究[D];復旦大學;2013年
5 武威;異質數(shù)據(jù)相似度學習及其在網絡搜索中的應用[D];北京大學;2012年
6 朱娜斐;基于RTT相似度的網絡延遲估測理論和方法[D];北京工業(yè)大學;2012年
7 錢鵬飛;基于模糊相似度的異構本體映射、合并及校驗方法的研究[D];上海交通大學;2008年
8 馬海平;基于概率生成模型的相似度建模技術研究及應用[D];中國科學技術大學;2013年
9 劉守群;海量網絡視頻快速檢索關鍵技術研究[D];中國科學技術大學;2010年
10 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機制(HATM)的設計與實現(xiàn)[D];中國科學院研究生院(計算技術研究所);2001年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 楊巧;基于改進相似度的社會網絡鏈接預測研究[D];華南理工大學;2015年
2 張寧;某于《知網》的詞語相似度優(yōu)化算法[D];昆明理工大學;2015年
3 沈迤淳;歌曲中相似片段的檢測及其應用[D];復旦大學;2014年
4 梁霄;社交網絡中的社區(qū)聚集研究[D];上海交通大學;2015年
5 王魁;在線社交中基于微博的好友推薦系統(tǒng)設計與實現(xiàn)[D];電子科技大學;2015年
6 洪耀停;基于共同作者圖的合作者推薦系統(tǒng)[D];浙江大學;2015年
7 褚立超;基于相似度評分模型的人員識別方法研究[D];廣西大學;2015年
8 蒲進興;基于動態(tài)相似度的錯誤定位優(yōu)先排序[D];北京化工大學;2015年
9 余超;基于Google Map的地理位置查詢系統(tǒng)[D];電子科技大學;2014年
10 烏蘭;基于動力學行為的復雜網絡社區(qū)檢測研究[D];內蒙古工業(yè)大學;2015年
本文關鍵詞:基于節(jié)點內容及拓撲結構的引文網絡社團劃分?,由筆耕文化傳播整理發(fā)布。
本文編號:393969
本文鏈接:http://www.sikaile.net/tushudanganlunwen/393969.html