天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

融合《知網(wǎng)》和搜索引擎的詞匯語(yǔ)義相似度計(jì)算

發(fā)布時(shí)間:2018-03-22 02:05

  本文選題:語(yǔ)義相似度 切入點(diǎn):知網(wǎng) 出處:《計(jì)算機(jī)應(yīng)用》2017年04期  論文類型:期刊論文


【摘要】:針對(duì)當(dāng)前《知網(wǎng)》的詞語(yǔ)語(yǔ)義描述與人們對(duì)詞匯的主觀認(rèn)知之間存在諸多不匹配的問題,在充分利用豐富的網(wǎng)絡(luò)知識(shí)的背景下,提出了一種融合《知網(wǎng)》和搜索引擎的詞匯語(yǔ)義相似度計(jì)算方法。首先,考慮了詞語(yǔ)與詞語(yǔ)義原之間的包含關(guān)系,利用改進(jìn)的概念相似度計(jì)算方法得到初步的詞語(yǔ)語(yǔ)義相似度結(jié)果;然后,利用基于搜索引擎的相關(guān)性雙重檢測(cè)算法和點(diǎn)互信息法得出進(jìn)一步的語(yǔ)義相似度結(jié)果;最后,設(shè)計(jì)了擬合函數(shù)并利用批量梯度下降法學(xué)習(xí)權(quán)值參數(shù),融合前兩步的相似度計(jì)算結(jié)果。實(shí)驗(yàn)結(jié)果表明,與單純的基于《知網(wǎng)》和基于搜索引擎的改進(jìn)方法相比,融合方法的斯皮爾曼系數(shù)和皮爾遜系數(shù)均提升了5%,同時(shí)提升了具體詞語(yǔ)義描述與人們對(duì)詞匯的主觀認(rèn)知之間的匹配度,驗(yàn)證了將網(wǎng)絡(luò)知識(shí)背景融入到概念相似度計(jì)算方法中能有效提高中文詞匯語(yǔ)義相似度的計(jì)算性能。
[Abstract]:In view of the mismatch between the semantic description of the words and the subjective cognition of the words in the current Web of knowledge, under the background of making full use of the abundant knowledge of the network, there are many mismatches between the semantic description of the words and the subjective cognition of the words. In this paper, a method for calculating semantic similarity of words is proposed. Firstly, the inclusion relationship between words and semantic elements is considered. The improved concept similarity calculation method is used to obtain the preliminary semantic similarity results. Then, the search engine based correlation double detection algorithm and the point mutual information method are used to obtain the further semantic similarity results. Finally, The fitting function is designed and the weight parameters are studied by the batch gradient descent method, and the results of similarity calculation of the first two steps are fused. The experimental results show that compared with the improved methods based on knowledge net and search engine, The Spelman coefficient and Pearson coefficient of the fusion method were increased by 5, and the matching degree between the semantic description of specific words and the subjective cognition of the words was improved. It is verified that the integration of the network knowledge background into the conceptual similarity calculation method can effectively improve the computational performance of semantic similarity of Chinese vocabulary.
【作者單位】: 南華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61402220,61502221) 湖南省教育廳科研項(xiàng)目(16C1378,14B153,15C1186) 湖南省哲學(xué)社會(huì)科學(xué)基金資助項(xiàng)目(14YBA335)~~
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王鈞;趙曰利;;浙大中藥指紋圖譜相似度計(jì)算軟件在煙用香精香料色譜分析中的引入應(yīng)用[J];現(xiàn)代儀器;2007年03期

2 單建芳;劉宗田;周文;;事件相似度計(jì)算[J];小型微型計(jì)算機(jī)系統(tǒng);2010年04期

3 劉文劍;郭寧;金天國(guó);;制造資源本體的相似度計(jì)算模型[J];計(jì)算機(jī)集成制造系統(tǒng);2010年11期

4 邸書靈;劉曉飛;李歡;;基于分詞的語(yǔ)句相似度計(jì)算的改進(jìn)[J];石家莊鐵道大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

5 秦學(xué)勇;張潤(rùn)梅;;兩級(jí)相似度計(jì)算在主觀題機(jī)器閱卷中的應(yīng)用[J];計(jì)算機(jī)工程;2012年11期

6 田衛(wèi)東;強(qiáng)繼朋;;基于問句類型的問句相似度計(jì)算[J];計(jì)算機(jī)應(yīng)用研究;2014年04期

7 周凱波,馮珊,李鋒;基于案例屬性特征的相似度計(jì)算模型研究[J];武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版);2003年01期

8 易麗萍,竹勇 ,雷小春;知網(wǎng)在詞語(yǔ)相似度計(jì)算方面的應(yīng)用[J];信息技術(shù)與信息化;2005年01期

9 廉站俊;呂學(xué)強(qiáng);張玉杰;施水才;;基于句子相似度計(jì)算的信息抽取[J];現(xiàn)代圖書情報(bào)技術(shù);2007年06期

10 李偉;;中文語(yǔ)句相似度計(jì)算的方法初探[J];蘭州工業(yè)高等?茖W(xué)校學(xué)報(bào);2009年04期

相關(guān)會(huì)議論文 前10條

1 劉磊;張桂平;蔡?hào)|風(fēng);季鐸;;基于語(yǔ)義預(yù)測(cè)的雙語(yǔ)術(shù)語(yǔ)相似度計(jì)算[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

2 郭麗;蔡?hào)|風(fēng);季鐸;白宇;;統(tǒng)計(jì)與語(yǔ)義相融合的詞語(yǔ)相似度計(jì)算[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

3 吳志雄;;不精確數(shù)據(jù)的相似度計(jì)算[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國(guó)邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

4 王凱;李紹穩(wěn);張友華;劉超;;缺值背景中的粗糙形式概念相似度計(jì)算理論與方法[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

5 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計(jì)算研究[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

6 車萬翔;劉挺;秦兵;李生;;面向雙語(yǔ)句對(duì)檢索的漢語(yǔ)句子相似度計(jì)算[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

7 郭文宏;范學(xué)峰;;基于語(yǔ)義詞典和本體知識(shí)的概念相似度計(jì)算[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

8 宋彥;張桂平;蔡?hào)|風(fēng);;基于N-gram的句子相似度計(jì)算技術(shù)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

9 關(guān)毅;王曉龍;王強(qiáng);;論系統(tǒng)相似的度量[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

10 林民;宋柔;;基于結(jié)構(gòu)描述的漢字字形相似度計(jì)算[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

相關(guān)重要報(bào)紙文章 前1條

1 海量智能計(jì)算技術(shù)研究中心 霍剛;新興技術(shù)為互聯(lián)網(wǎng)加速[N];計(jì)算機(jī)世界;2007年

相關(guān)博士學(xué)位論文 前4條

1 馮曉文;基于GPU的相似度計(jì)算關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2014年

2 王秀紅;文本相似度計(jì)算核函數(shù)的構(gòu)造及其在分布式信息檢索中的應(yīng)用研究[D];江蘇大學(xué);2012年

3 劉磊;概念內(nèi)涵屬性計(jì)算研究[D];上海交通大學(xué);2011年

4 任磊;推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 梁韜;中文微博新詞與熱點(diǎn)話題發(fā)現(xiàn)技術(shù)研究[D];湖南工業(yè)大學(xué);2015年

2 汪建成;漢越雙語(yǔ)新聞話題分析方法研究[D];昆明理工大學(xué);2015年

3 唐海燕;基于全文的教育資源檢索模型研究[D];四川師范大學(xué);2015年

4 舒佳根;中文實(shí)體鏈接研究[D];蘇州大學(xué);2015年

5 孔行;基于主題推薦的輔助寫作系統(tǒng)[D];哈爾濱工業(yè)大學(xué);2015年

6 孫潤(rùn)志;基于語(yǔ)義理解的文本相似度計(jì)算研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(沈陽(yáng)計(jì)算技術(shù)研究所);2015年

7 劉敏;基于詞向量的句子相似度計(jì)算及其在基于實(shí)例的機(jī)器翻譯中的應(yīng)用[D];北京理工大學(xué);2015年

8 康毅;面向客服的自動(dòng)問答系統(tǒng)關(guān)鍵技術(shù)研究[D];東北大學(xué);2014年

9 吳宇浩;南海檔案數(shù)字化半自動(dòng)?敝械牡妆就扑]探討[D];南京大學(xué);2015年

10 吐爾遜阿依·阿不來提;小學(xué)維吾爾語(yǔ)文教材中的單句相似度研究[D];新疆師范大學(xué);2015年

,

本文編號(hào):1646559

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1646559.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b42da***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com