天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

從Web獲取部分整體關(guān)系語(yǔ)料的方法

發(fā)布時(shí)間:2019-12-02 05:09
【摘要】:部分整體關(guān)系獲取是知識(shí)獲取中的重要組成部分。Web逐步成為知識(shí)獲取的重要資源之一。搜索引擎是從Web中獲取部分整體關(guān)系知識(shí)的有效手段之一,我們將Web中包含部分整體關(guān)系的檢索結(jié)果集合稱(chēng)為部分整體關(guān)系語(yǔ)料。由于目前主流搜索引擎尚不支持語(yǔ)義搜索,如何構(gòu)造有效的查詢(xún)以得到富含部分整體關(guān)系的語(yǔ)料,從而進(jìn)一步獲取部分整體關(guān)系,就成為一個(gè)重要的問(wèn)題。該文提出了一種新的查詢(xún)構(gòu)造方法,目的在于從Web中獲取部分整體關(guān)系語(yǔ)料。該方法能夠構(gòu)造基于語(yǔ)境詞的查詢(xún),進(jìn)而利用現(xiàn)有的搜索引擎從Web中獲取部分整體關(guān)系語(yǔ)料。該方法在兩個(gè)方面與人工構(gòu)造查詢(xún)方法和基于語(yǔ)料庫(kù)查詢(xún)構(gòu)造查詢(xún)方法所獲取的語(yǔ)料進(jìn)行對(duì)比,其一是語(yǔ)料中含有部分整體關(guān)系的語(yǔ)句數(shù)量;二是從語(yǔ)料中進(jìn)一步獲取部分整體關(guān)系的難易程度。實(shí)驗(yàn)結(jié)果表明,該方法遠(yuǎn)遠(yuǎn)優(yōu)于后兩者。
【圖文】:

信息圖,關(guān)系語(yǔ),查詢(xún)方法,方法


詢(xún)串關(guān)鍵詞的部分標(biāo)記為紅字,我們用斜體黑體表示這些匹配的部分。圖1中比較三種不同方法中獲取的部分整體關(guān)系語(yǔ)料中,含有部分整體關(guān)系語(yǔ)句的數(shù)量。由于人工構(gòu)造查詢(xún)方法獲取的部分整體關(guān)系語(yǔ)料是一種完全非結(jié)構(gòu)化的,因此不能利用查詢(xún)串提供的信息自動(dòng)獲取其中的部分整體關(guān)系。圖2對(duì)比基于語(yǔ)料庫(kù)構(gòu)造查詢(xún)方法和意圖查詢(xún)方法獲取的部分整體關(guān)系數(shù)量。4.3 實(shí)驗(yàn)分析從圖1可以看出,在由返回的Top100項(xiàng)、Top200項(xiàng)、Top300項(xiàng)、Top400項(xiàng)和Top500項(xiàng)檢索結(jié)果組成的部分整體關(guān)系語(yǔ)料中,人工構(gòu)造查詢(xún)方法所獲取的各個(gè)語(yǔ)料中蘊(yùn)含部分整體關(guān)系的語(yǔ)句數(shù)量最少,意圖查詢(xún)方法獲取數(shù)量最多,且部分整體關(guān)系語(yǔ)料的規(guī)模越大,意圖查詢(xún)方法的優(yōu)勢(shì)越明顯。圖1 三種不同方法獲取的語(yǔ)料中含有部分整體關(guān)系的語(yǔ)句的數(shù)量在部分整體關(guān)系抽取難易方面

語(yǔ)義圖,信息圖,查詢(xún)方法,關(guān)系語(yǔ)


對(duì)于這種語(yǔ)料,我們能很容易的利用查詢(xún)串本身提供的信息,從中抽取出符合我們查詢(xún)本意的部分整體關(guān)系。通過(guò)圖2中的實(shí)驗(yàn)數(shù)據(jù)可以看出,對(duì)比基于語(yǔ)料庫(kù)構(gòu)造查詢(xún)方法,意圖查詢(xún)方法從獲取的部分整體關(guān)系語(yǔ)料中可以多獲取大約兩倍的部分整體關(guān)系。5 結(jié)束語(yǔ)目前人們使用搜索引擎作為從Web獲取知識(shí)的有效手段,但網(wǎng)上絕大多數(shù)搜索引擎都使用基于關(guān)鍵詞匹配的全文檢索技術(shù),不支持語(yǔ)義搜索。因?yàn)椴灰讓?duì)檢索對(duì)象本身做出處理[4],我們只能對(duì)查詢(xún)串本身做出某些改變,使其接近我們需要的語(yǔ)義。故本文提出了一種新的用于從Web獲取部分整體關(guān)系語(yǔ)料的基于意圖的查詢(xún)構(gòu)造方法即意圖查詢(xún)方法。在查詢(xún)中加入與部分整體相關(guān)度高的語(yǔ)境詞,構(gòu)造新的查詢(xún)

【共引文獻(xiàn)】

相關(guān)期刊論文 前8條

1 余正濤,樊孝忠,宋麗榮;基于特定問(wèn)題類(lèi)別的漢語(yǔ)問(wèn)答系統(tǒng)查詢(xún)擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期

2 陳麗,于浩,鄭德權(quán),趙鐵軍;基于文本內(nèi)容的超鏈接分類(lèi)研究[J];哈爾濱商業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期

3 鄭慶華,王朝靜,孫霞;一種基于結(jié)構(gòu)化語(yǔ)料庫(kù)的概念語(yǔ)義網(wǎng)絡(luò)自動(dòng)生成算法[J];計(jì)算機(jī)研究與發(fā)展;2005年03期

4 張虎,鄭家恒,劉江;語(yǔ)料庫(kù)詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期

5 康海燕,李彥芳,林培光,樊孝忠;信息檢索策略性能的云模型評(píng)價(jià)方法[J];中文信息學(xué)報(bào);2005年01期

6 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢(xún)擴(kuò)展[J];中文信息學(xué)報(bào);2006年03期

7 左家莉,王明文,王希;基于Markov網(wǎng)絡(luò)的信息檢索擴(kuò)展模型[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期

8 李智,李敏強(qiáng);基金項(xiàng)目評(píng)審管理中智能交互式文檔檢索[J];研究與發(fā)展管理;2005年03期

相關(guān)博士學(xué)位論文 前3條

1 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評(píng)審中的應(yīng)用研究[D];天津大學(xué);2004年

2 潘旭偉;集成情境知識(shí)管理中幾個(gè)關(guān)鍵技術(shù)的研究[D];浙江大學(xué);2005年

3 王樹(shù)梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前9條

1 代學(xué)武;基于神經(jīng)網(wǎng)絡(luò)的用戶(hù)建模和Web信息過(guò)濾研究[D];西南師范大學(xué);2003年

2 杭月芹;基于文檔查詢(xún)信息的檢索系統(tǒng)研究與實(shí)現(xiàn)[D];揚(yáng)州大學(xué);2005年

3 吳煒;基于用戶(hù)日志的信息檢索研究[D];同濟(jì)大學(xué);2006年

4 張波;個(gè)性化Web搜索系統(tǒng)研究[D];燕山大學(xué);2006年

5 謝翠華;基于概念格的Web文本管理研究[D];揚(yáng)州大學(xué);2006年

6 盛俊;潛在語(yǔ)義的Markov網(wǎng)絡(luò)檢索模型的研究[D];江西師范大學(xué);2006年

7 余超;基于知網(wǎng)的詞匯語(yǔ)義計(jì)算研究及應(yīng)用[D];沈陽(yáng)航空工業(yè)學(xué)院;2007年

8 藕軍;Deep Web搜索引擎的關(guān)鍵技術(shù)[D];合肥工業(yè)大學(xué);2007年

9 馮運(yùn);信息檢索中的查詢(xún)算法研究[D];湖南大學(xué);2007年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 袁毓林;計(jì)算語(yǔ)言學(xué)的理論方法和研究取向[J];中國(guó)社會(huì)科學(xué);2001年04期

,

本文編號(hào):2568651

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2568651.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)aa029***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com