基于非結(jié)構(gòu)化文本檢索模型綜述
本文選題:相似度計(jì)算 切入點(diǎn):檢索模型 出處:《計(jì)算機(jī)應(yīng)用研究》2017年06期 論文類(lèi)型:期刊論文
【摘要】:隨辦公信息化、生活網(wǎng)絡(luò)化不斷推進(jìn),諸如企業(yè)產(chǎn)品問(wèn)題描述、Web用戶(hù)評(píng)論、通信文本信息等新生的非結(jié)構(gòu)化文本數(shù)據(jù)也伴隨著快速的增長(zhǎng)以及其不斷積累。這對(duì)于如何能準(zhǔn)確、高效地檢索到用戶(hù)真實(shí)需求的文本信息提出了新的要求和挑戰(zhàn)。檢索模型對(duì)檢索準(zhǔn)確度、效率等具有決定性影響。近年來(lái),大量新興方法融入到文本的檢索模型中,使模型本身變得紛繁復(fù)雜,同時(shí)傳統(tǒng)模型間的界限變得模糊。從非結(jié)構(gòu)化文本數(shù)據(jù)的檢索需求出發(fā),歸納檢索模型的定義和通用框架;進(jìn)而基于檢索詞項(xiàng)相似性計(jì)算采用的數(shù)學(xué)理論,對(duì)檢索模型進(jìn)行分類(lèi),并詳細(xì)闡述各類(lèi)模型的發(fā)展脈絡(luò)、分析其優(yōu)缺點(diǎn)及適用場(chǎng)景。最后,討論了新環(huán)境下海量文本檢索模型面臨的挑戰(zhàn)及相關(guān)研究問(wèn)題思考。
[Abstract]:With the development of office information and network, new unstructured text data, such as enterprise product problem description, Web user review, communication text information and so on, are growing rapidly and accumulating. In recent years, a large number of new methods have been integrated into the text retrieval model, which has a decisive effect on retrieval accuracy and efficiency. The model itself becomes complicated and the boundary between the traditional models becomes blurred. Based on the retrieval requirements of unstructured text data, the definition and general framework of the retrieval model are summarized. Then, based on the mathematical theory of similarity calculation, the retrieval model is classified, and the development of each model is described in detail, and its advantages and disadvantages and applicable scenarios are analyzed. This paper discusses the challenge of massive text retrieval model in the new environment and some related research issues.
【作者單位】: 桂林電子科技大學(xué)廣西云計(jì)算與大數(shù)據(jù)協(xié)同創(chuàng)新中心;桂林電子科技大學(xué)廣西可信軟件重點(diǎn)實(shí)驗(yàn)室;桂林電子科技大學(xué)廣西自動(dòng)檢測(cè)技術(shù)與儀器重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(U1501252,61462017,61363005) 廣西區(qū)自然科學(xué)基金資助項(xiàng)目(2014GXNSFAA118353,2014GXNSFAA118390,2014GXNSFDA118036) 廣西自動(dòng)檢測(cè)技術(shù)與儀器重點(diǎn)實(shí)驗(yàn)室基金資助項(xiàng)目(YQ15110) 廣西高等學(xué)校高水平創(chuàng)新團(tuán)隊(duì)及卓越學(xué)者計(jì)劃資助項(xiàng)目
【分類(lèi)號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 印鑒;一種對(duì)象檢索模型[J];小型微型計(jì)算機(jī)系統(tǒng);2000年08期
2 李衛(wèi)紅,萬(wàn)建成;書(shū)面漢語(yǔ)全切分算法中的并發(fā)檢索模型[J];計(jì)算機(jī)應(yīng)用;2004年05期
3 王珂;廖文和;郭宇;劉金山;;基于位索引的多層次實(shí)例檢索模型研究[J];中國(guó)機(jī)械工程;2007年16期
4 吳楠;;計(jì)算機(jī)檢索模型與分析[J];科技信息(學(xué)術(shù)研究);2007年28期
5 劉玉琴;劉嵩;于波;;面向?qū)彶槿蝿?wù)的中文專(zhuān)利檢索模型與實(shí)驗(yàn)[J];計(jì)算機(jī)應(yīng)用研究;2008年05期
6 黃穎臻;情報(bào)檢索模型的演變過(guò)程及其評(píng)價(jià)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);1989年01期
7 胡軍,耿國(guó)華,周明全;一個(gè)圖像檢索模型及其應(yīng)用[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年06期
8 印鑒,李師賢;一種基于事例推理的檢索模型[J];中山大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年02期
9 許錫春;基于相似性的檢索模型[J];上海海運(yùn)學(xué)院學(xué)報(bào);2000年03期
10 謝桂芳;;一種網(wǎng)絡(luò)學(xué)習(xí)資源的檢索模型研究[J];信息技術(shù);2008年10期
相關(guān)會(huì)議論文 前8條
1 楊小銳;林磊;孫承杰;劉秉權(quán);;基于結(jié)構(gòu)挖掘的論壇檢索模型[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 申展;王建會(huì);吳愛(ài)華;胡運(yùn)發(fā);;互關(guān)聯(lián)后繼樹(shù)模型——一種新穎的全文檢索模型[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
3 沈水榮;;建立計(jì)算機(jī)知識(shí)點(diǎn)檢索模型探索語(yǔ)義自動(dòng)識(shí)別的相關(guān)問(wèn)題——關(guān)于“人民金典”語(yǔ)義自動(dòng)識(shí)別系列產(chǎn)品研發(fā)的理論思考[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)2011年學(xué)術(shù)年會(huì)論文集(上篇)[C];2011年
4 王宗文;彭亮;趙奇;;一種互助檢索模型的設(shè)計(jì)[A];提升知識(shí)產(chǎn)權(quán)服務(wù)能力 促進(jìn)創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略——2014年中華全國(guó)專(zhuān)利代理人協(xié)會(huì)年會(huì)第五屆知識(shí)產(chǎn)權(quán)論壇優(yōu)秀論文集[C];2014年
5 汪明;熊璋;吳晶;;基于LDAP的多語(yǔ)言概念檢索模型的研究[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
6 謝祖銘;張亮;周向東;葉劍燁;陳戀;;一種基于概念的貝葉斯網(wǎng)絡(luò)圖像檢索模型[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
7 刁宇峰;林鴻飛;;基于LDA模型的博客垃圾評(píng)論發(fā)現(xiàn)[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
8 徐建民;陳富節(jié);朱松;;基于量化同義詞擴(kuò)展的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)化檢索模型[A];2007'儀表,,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(二)[C];2007年
相關(guān)博士學(xué)位論文 前2條
1 蔡柯柯;基于查詢(xún)特征上下文的檢索模型研究[D];浙江大學(xué);2007年
2 丁國(guó)棟;基于統(tǒng)計(jì)語(yǔ)言建模的信息檢索及相關(guān)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
相關(guān)碩士學(xué)位論文 前10條
1 溫大軍;復(fù)雜工程系統(tǒng)監(jiān)測(cè)數(shù)據(jù)檢索模型研究與應(yīng)用[D];重慶大學(xué);2015年
2 劉春蔚;日地空間系統(tǒng)領(lǐng)域科學(xué)數(shù)據(jù)檢索模型研究[D];中國(guó)科學(xué)院國(guó)家空間科學(xué)中心;2016年
3 孫霞;大數(shù)據(jù)環(huán)境下分子檢索與藥物候選物識(shí)別研究[D];新疆大學(xué);2016年
4 楊清泉;基于文摘的LDA檢索模型[D];昆明理工大學(xué);2016年
5 李珊珊;數(shù)學(xué)表達(dá)式相似檢索的擴(kuò)充規(guī)則研究[D];河北大學(xué);2016年
6 楊樝;需求概念圖導(dǎo)引下的檢索模型研究[D];上海交通大學(xué);2013年
7 董錦霞;基于菱形思維的概念檢索模型研究[D];大連理工大學(xué);2011年
8 龔小龍;結(jié)合鄰近度的語(yǔ)義位置語(yǔ)言檢索模型[D];江西師范大學(xué);2014年
9 胡威;基于本體的教育資源檢索模型的研究及其本體庫(kù)的構(gòu)建[D];內(nèi)蒙古大學(xué);2014年
10 吳建波;基于內(nèi)容的多媒體圖像檢索模型的研究[D];浙江師范大學(xué);2012年
本文編號(hào):1647363
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1647363.html