基于內(nèi)容與引用關(guān)系的學(xué)術(shù)論文推薦
本文關(guān)鍵詞:基于內(nèi)容與引用關(guān)系的學(xué)術(shù)論文推薦
更多相關(guān)文章: 學(xué)術(shù)論文 引用關(guān)系圖 Steiner-tree 協(xié)同過濾
【摘要】:科研文獻(xiàn)是科研活動(dòng)的重要產(chǎn)物,這些科研文獻(xiàn)對(duì)于促進(jìn)科研人員間的思想溝通交流起著重要的作用?萍嫉倪M(jìn)步使得學(xué)術(shù)論文的數(shù)量與日俱增,即使在特定領(lǐng)域內(nèi),學(xué)術(shù)論文的數(shù)量也是相當(dāng)龐大的。如何快速找到相關(guān)論文是科研人員比較關(guān)心的問題之一。傳統(tǒng)的基于關(guān)鍵詞的檢索方式具有一定的局限性,關(guān)鍵詞的選擇直接影響最后的搜索結(jié)果。 學(xué)術(shù)論文作為一種比較嚴(yán)謹(jǐn)?shù)目萍碱愇墨I(xiàn),有其獨(dú)特的層次結(jié)構(gòu)。合理利用學(xué)術(shù)論文的結(jié)構(gòu)及內(nèi)容特征有助于學(xué)術(shù)論文相關(guān)研究的信息處理和歸納。學(xué)術(shù)論文的結(jié)構(gòu)特點(diǎn)之一是學(xué)術(shù)論文之間的引用關(guān)系。同一研究方向的文章往往引用和參考的也都是緊密相關(guān)的文獻(xiàn)。由此可見,論文之間的引用關(guān)系往往能夠體現(xiàn)出論文之間的相關(guān)性。 本文結(jié)合論文的內(nèi)容信息和引用關(guān)系本身的特性來研究學(xué)術(shù)論文的推薦問題。本文首先對(duì)學(xué)術(shù)論文進(jìn)行建模并抽取其內(nèi)容和結(jié)構(gòu)特征。為了更好的理解學(xué)術(shù)論文引用關(guān)系的基本特征,本文首先對(duì)一個(gè)較大規(guī)模的學(xué)術(shù)論文數(shù)據(jù)的引用關(guān)系進(jìn)行了分析和統(tǒng)計(jì)。然后本文將Steiner-tree問題與學(xué)術(shù)論文推薦結(jié)合起來,實(shí)現(xiàn)了引用關(guān)系圖上的論文推薦。同時(shí),本文在引用關(guān)系圖上使用協(xié)同過濾的推薦方法來推薦學(xué)術(shù)論文。針對(duì)兩種不同的解決方案,我們?cè)赗-tree相關(guān)和P2P相關(guān)的學(xué)術(shù)論文數(shù)據(jù)集上設(shè)計(jì)了不同的實(shí)驗(yàn)來驗(yàn)證算法的有效性和可行性。 本文的主要貢獻(xiàn)包括以下幾個(gè)部分: ●學(xué)術(shù)論文特征抽取:本文針對(duì)學(xué)術(shù)論文嚴(yán)謹(jǐn)?shù)慕Y(jié)構(gòu)特點(diǎn),將學(xué)術(shù)論文的結(jié)構(gòu)劃分為論文標(biāo)題、作者信息、主體內(nèi)容和參考文獻(xiàn)列表等部分,然后針對(duì)每一部分的特點(diǎn)進(jìn)行解析和信息抽取,其中論文的參考文獻(xiàn)信息是推薦相關(guān)論文的一個(gè)特別關(guān)鍵的信息。之后我們使用這些信息抽取學(xué)術(shù)論文的內(nèi)容和結(jié)構(gòu)特征。 ●基于Steiner-tree的學(xué)術(shù)論文推薦:本文提出了一種基于Steiner-tree的學(xué)術(shù)論文推薦方法。本文首先將論文間的引用關(guān)系轉(zhuǎn)化成一個(gè)帶權(quán)重的引用關(guān)系圖,然后將學(xué)術(shù)論文推薦問題轉(zhuǎn)化為在引用關(guān)系圖中找Steiner點(diǎn)的問題。 ●基于協(xié)同過濾的論文推薦:本文提出了結(jié)合協(xié)同過濾與論文引用關(guān)系的學(xué)術(shù)論文推薦方法。本文將學(xué)術(shù)論文間的引用關(guān)系轉(zhuǎn)化為協(xié)同過濾中的用戶-物品的打分矩陣,利用引用關(guān)系的特征作為打分的依據(jù)。通過找到與目標(biāo)論文有相近引用偏好的論文作為目標(biāo)論文的鄰居,共享這些鄰居論文的引用關(guān)系信息,然后將所有鄰居對(duì)于某篇論文的打分的綜合評(píng)分作為目標(biāo)論文對(duì)該論文的預(yù)測(cè)打分。最后按照預(yù)測(cè)的分值高低順序返回推薦列表。 ●多組實(shí)驗(yàn)驗(yàn)證:本文針對(duì)提出的兩種學(xué)術(shù)論文推薦方法,分別設(shè)計(jì)了詳細(xì)的實(shí)驗(yàn),驗(yàn)證算法的可行性和準(zhǔn)確度并考察了不同參數(shù)變化對(duì)實(shí)驗(yàn)結(jié)果的影響。本文使用一個(gè)較大規(guī)模的真實(shí)數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù)集,并且對(duì)此數(shù)據(jù)集進(jìn)行了相關(guān)統(tǒng)計(jì)和分析。針對(duì)基于Steiner-tree的推薦方法,本文設(shè)計(jì)實(shí)驗(yàn)分別考察了查詢點(diǎn)個(gè)數(shù)以及算法執(zhí)行次數(shù)對(duì)最終結(jié)果的影響。實(shí)驗(yàn)結(jié)果表明,基于Steiner-tree的推薦方法的結(jié)果具有一定的穩(wěn)定性且在查詢點(diǎn)的個(gè)數(shù)較少時(shí),實(shí)驗(yàn)的準(zhǔn)確率更高。針對(duì)基于協(xié)同過濾的推薦方法,本文設(shè)計(jì)實(shí)驗(yàn)考察鄰居數(shù)量、推薦列表長(zhǎng)度、以及不同的打分策略等參數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響。實(shí)驗(yàn)結(jié)果表明設(shè)置合理的鄰居個(gè)數(shù)時(shí),實(shí)驗(yàn)的準(zhǔn)確率、查全率均能達(dá)到一個(gè)比較好的取值范圍。 綜上所述,本文不僅對(duì)學(xué)術(shù)論文進(jìn)行建模,抽取其內(nèi)容和結(jié)構(gòu)特征,同時(shí)也提出了兩種基于引用關(guān)系的論文推薦方法,并且設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證算法的可行性。
【關(guān)鍵詞】:學(xué)術(shù)論文 引用關(guān)系圖 Steiner-tree 協(xié)同過濾
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 摘要6-8
- ABSTRACT8-12
- 第一章 緒論12-17
- 1.1 研究背景12-13
- 1.2 本文工作與貢獻(xiàn)13-16
- 1.3 本文結(jié)構(gòu)16-17
- 第二章 相關(guān)工作17-31
- 2.1 科學(xué)文獻(xiàn)管理與分析系統(tǒng)17-19
- 2.2 科學(xué)文獻(xiàn)研究推薦19-22
- 2.3 推薦方法22-27
- 2.4 Steiner-tree27-31
- 第三章 問題描述31-40
- 3.1 學(xué)術(shù)論文建模31-35
- 3.2 引用關(guān)系圖35-36
- 3.3 Steiner-tree與學(xué)術(shù)論文推薦36-37
- 3.4 協(xié)同過濾與學(xué)術(shù)論文推薦37-38
- 3.5 結(jié)果衡量標(biāo)準(zhǔn)38-39
- 3.6 本章小結(jié)39-40
- 第四章 學(xué)術(shù)論文推薦40-52
- 4.1 引用關(guān)系圖數(shù)據(jù)40-46
- 4.2 特征分析與選擇46-47
- 4.3 基于最小Steiner-tree的推薦47-49
- 4.4 基于協(xié)同過濾的推薦49-50
- 4.5 本章小結(jié)50-52
- 第五章 實(shí)驗(yàn)52-67
- 5.1 實(shí)驗(yàn)設(shè)定與準(zhǔn)備52-57
- 5.2 基于Steiner-tree的實(shí)驗(yàn)57-59
- 5.3 基于協(xié)同過濾的實(shí)驗(yàn)59-67
- 第六章 總結(jié)與展望67-70
- 參考文獻(xiàn)70-78
- 附錄A CiteSeerX數(shù)據(jù)示例78-79
- 附錄B OAI-PMH動(dòng)詞意義及其參數(shù)設(shè)置79-80
- 致謝80-82
- 攻讀碩士學(xué)位期間發(fā)表論文和科研情況82
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 冀俊忠,沙志強(qiáng),劉椿年,郎青;B2C電子商務(wù)站點(diǎn)中知識(shí)發(fā)現(xiàn)的研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2003年02期
2 高玲玲;李偉生;;一種新的動(dòng)態(tài)QoS多播路由啟發(fā)式算法[J];北京郵電大學(xué)學(xué)報(bào);2006年S1期
3 張帆;林建;;智能搜索引擎信息過濾機(jī)制研究[J];圖書與情報(bào);2007年04期
4 何興無(wú);;用戶興趣實(shí)例模型與K_means算法的改進(jìn)[J];重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年02期
5 曹毅;羅新星;;電子商務(wù)推薦系統(tǒng)關(guān)鍵技術(shù)研究[J];湘南學(xué)院學(xué)報(bào);2008年05期
6 王興偉;侯美佳;易秀雙;黃敏;;NGI中的一種禁忌-遞階遺傳QoS組播路由算法[J];東北大學(xué)學(xué)報(bào);2006年05期
7 岳承君;井元偉;李慶奎;;鏈路優(yōu)化時(shí)延約束組播路由的遺傳算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
8 莊昌文,范明鈺,李春輝,虞厥邦,黃勁;一種串?dāng)_和時(shí)延驅(qū)動(dòng)的總體布線算法[J];電子科技大學(xué)學(xué)報(bào);2000年03期
9 朱郁筱;呂琳媛;;推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J];電子科技大學(xué)學(xué)報(bào);2012年02期
10 余燕平,趙問道,孟利民,仇佩亮;基于關(guān)鍵節(jié)點(diǎn)和多播節(jié)點(diǎn)的多播路由算法[J];電路與系統(tǒng)學(xué)報(bào);2003年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條
1 高玲玲;李偉生;;一種新的動(dòng)態(tài)QoS多播路由啟發(fā)式算法[A];2006年全國(guó)通信軟件學(xué)術(shù)會(huì)議論文集[C];2006年
2 張曉瑜;張光昭;張琳;;一種overlay network的組播路由算法[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第15屆中國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT'06)論文集[C];2006年
3 ;Solving the Problem of the Link Optimizing and Delayconstrained Multicast Routing Based on GA[A];第25屆中國(guó)控制會(huì)議論文集(下冊(cè))[C];2006年
4 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國(guó)通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(下)[C];2009年
5 魏宏;胡明;孟洛明;;光傳送網(wǎng)絡(luò)中環(huán)路組播算法及實(shí)現(xiàn)[A];第六屆全國(guó)計(jì)算機(jī)應(yīng)用聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
6 岳承君;井元偉;;不確定信息QoS路由的概率遺傳算法的研究[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
7 孫曉飛;張強(qiáng);;物流配送中心選址的多目標(biāo)優(yōu)化模型[A];第十二屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2010年
8 曹宇;胡文敏;;組播路由技術(shù)綜述[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張寅;個(gè)性化技術(shù)及其在數(shù)字圖書館中應(yīng)用的研究[D];浙江大學(xué);2009年
2 劉卓;無(wú)線傳感器網(wǎng)絡(luò)拓?fù)浣⒎椒ㄅc應(yīng)用技術(shù)研究[D];華中科技大學(xué);2011年
3 靳延安;社會(huì)標(biāo)簽推薦技術(shù)與方法研究[D];華中科技大學(xué);2011年
4 胡慕海;面向動(dòng)態(tài)情境的信息推薦方法及系統(tǒng)研究[D];華中科技大學(xué);2011年
5 郭龍坤;基于不相交路徑技術(shù)的可靠網(wǎng)絡(luò)設(shè)計(jì)[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
6 劉毅捷;視頻社區(qū)中海量數(shù)據(jù)管理方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
7 趙衍才;圖的某些控制參數(shù)的計(jì)算[D];上海大學(xué);2011年
8 劉玉國(guó);基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
9 馬春山;移動(dòng)增值業(yè)務(wù)的個(gè)性化推薦研究[D];北京郵電大學(xué);2011年
10 夏培勇;個(gè)性化推薦技術(shù)中的協(xié)同過濾算法研究[D];中國(guó)海洋大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 吳則則;支持動(dòng)態(tài)演進(jìn)的用戶興趣模型挖掘方法研究[D];山東科技大學(xué);2010年
2 何瑩杰;個(gè)性化圖書信息服務(wù)技術(shù)研究[D];哈爾濱工程大學(xué);2010年
3 李媛;電子商務(wù)個(gè)性化推薦關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
4 楊寧;應(yīng)用層多播與Steiner算法的研究[D];大連理工大學(xué);2010年
5 李春;協(xié)同過濾推薦算法的研究[D];湘潭大學(xué);2010年
6 韓璐;針對(duì)推薦系統(tǒng)中信息共享需求下隱私保護(hù)機(jī)制的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2011年
7 宋健;基于主題挖掘和時(shí)間窗口劃分的興趣推薦技術(shù)研究[D];華東師范大學(xué);2011年
8 金亞亞;一種基于改進(jìn)信任度的協(xié)同過濾算法[D];華東理工大學(xué);2011年
9 夏超倫;基于社會(huì)計(jì)算的電子商務(wù)協(xié)同過濾推薦算法研究[D];浙江大學(xué);2011年
10 鄭佳佳;社交網(wǎng)絡(luò)中基于圖排序的好友推薦機(jī)制研究與實(shí)現(xiàn)[D];浙江大學(xué);2011年
,本文編號(hào):903529
本文鏈接:http://www.sikaile.net/wenshubaike/lwzy/903529.html