天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于引文的科技文獻主題抽取研究

發(fā)布時間:2018-01-02 12:05

  本文關(guān)鍵詞:基于引文的科技文獻主題抽取研究 出處:《情報理論與實踐》2017年06期  論文類型:期刊論文


  更多相關(guān)文章: 科技文獻 引文 主題抽取 關(guān)鍵詞


【摘要】:[目的/意義]主題抽取的效果對于信息檢索、自動標引、自然語言處理具有重要的價值,提高主題抽取的效果,既能改善檢索系統(tǒng)主題檢索準確性,又能夠幫助學者更加高效地了解文獻的主要思想。文章研究并探討了從引用內(nèi)容中抽取文獻主題的有效性。[方法/過程]選取自然語言處理領(lǐng)域文獻為研究對象,利用文獻之間的引用與被引用關(guān)系抽取引用內(nèi)容,進行分詞并計算權(quán)重;將引用內(nèi)容、全文抽取的候選詞進行專家打分評價效果并將其與關(guān)鍵詞對比,使用F值評價兩種語料庫抽取候選詞的優(yōu)劣。[結(jié)果/結(jié)論]通過專家打分及計算F值,發(fā)現(xiàn)引用內(nèi)容在抽取候選詞方面具有明顯優(yōu)勢。
[Abstract]:[Objective / meaning] the effect of topic extraction is of great value to information retrieval, automatic indexing and natural language processing. It can improve the accuracy of topic retrieval in retrieval system. It can also help scholars to understand the main ideas of literature more efficiently. [Methods: the natural language processing literature was chosen as the research object. The citation content was extracted from the citation and the citation relation between the references, and the word segmentation was carried out and the weight was calculated. The candidate words extracted in full text are evaluated by experts and compared with the key words, and the advantages and disadvantages of the two kinds of corpus extraction are evaluated by using F value. [Results / conclusion] by scoring and calculating F value of experts, it is found that citation has obvious advantages in extracting candidate words.
【作者單位】: 華中師范大學信息管理學院;
【基金】:國家社會科學基金項目“基于語義理解的多模態(tài)信息融合與集成服務(wù)研究”(項目編號:11CTQ017) 中央高校基本科研業(yè)務(wù)費專項資金項目“社交化問答平臺信息質(zhì)量感知模型及推薦算法研究”(項目編號:CCNU16A02035)的成果
【分類號】:G353.1
【正文快照】: 主題是對文獻中心思想的概括,有了主題就基本了解了文獻闡述的主要內(nèi)容。從檢索系統(tǒng)來看,篇名、關(guān)鍵詞、主題、摘要、全文都是文獻的檢索入口,但是這些入口對于文獻主題的反映準確性參差不齊,降低了檢索人員效率。引用內(nèi)容通常是學者對文獻觀點、主張高度凝練的概括,具有觀點

【參考文獻】

相關(guān)期刊論文 前10條

1 宋宇;羅準辰;真溱;;基于引用背景信息的關(guān)鍵詞自動抽取方法研究[J];情報理論與實踐;2016年11期

2 王曰芬;傅柱;陳必坤;;基于LDA主題模型的科學文獻主題識別:全局和學科兩個視角的對比分析[J];情報理論與實踐;2016年07期

3 黃魯成;張璐;吳菲菲;唐月強;;基于突現(xiàn)文獻和SAO相似度的新興主題識別研究[J];科學學研究;2016年06期

4 關(guān)鵬;王曰芬;傅柱;;不同語料下基于LDA主題模型的科學文獻主題抽取效果分析[J];圖書情報工作;2016年02期

5 關(guān)鵬;王曰芬;;基于LDA主題模型和生命周期理論的科學文獻主題挖掘[J];情報學報;2015年03期

6 張斯龍;程衛(wèi)萍;;基于共詞分析的2003-2012年全國核心期刊會議論文主題可視化[J];中國科技期刊研究;2014年07期

7 祝清松;冷伏海;;基于引文內(nèi)容分析的高被引論文主題識別研究[J];中國圖書館學報;2014年01期

8 陳,

本文編號:1369136


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/1369136.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f38e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com