基于Web的語料自動采集技術(shù)研究
本文選題:語料采集 + 搜索引擎。 參考:《太原理工大學(xué)學(xué)報》2008年S1期
【摘要】:在為詞典編撰進行大規(guī)模語料采集工作的背景下,以實現(xiàn)語料的批量自動采集為目的,介紹了基于Web的詞典編撰語料自動采集技術(shù)。同時提出了該技術(shù)在圖書信息領(lǐng)域的實驗?zāi)P?圖書信息搜尋系統(tǒng)(SearchBook v2.1.0)的設(shè)計與實現(xiàn),包括如何利用搜索引擎技術(shù)及信息提取技術(shù)進行圖書信息的搜索及提取。
[Abstract]:Under the background of large-scale data collection for dictionary compilation, this paper introduces the automatic data collection technology based on Web in order to realize the batch automatic data collection. At the same time, the paper puts forward the experimental model of this technology in the field of book information, and the design and implementation of book information search system (SearchBook v2.1.0), including how to use search engine technology and information extraction technology to search and extract book information.
【作者單位】: 太原理工大學(xué)計算機與軟件學(xué)院;中國電子科技集團第三十三研究所;
【基金】:國家863計劃資助項目(2006AA01Z142) 國家社科基金資助項目(07CYY022)
【分類號】:TP274
【參考文獻】
相關(guān)期刊論文 前2條
1 鄧長壽,趙秉巖;下一代Web搜索引擎探討[J];情報科學(xué);2005年03期
2 劉肖靜,耿騫;Ontology與面向概念的網(wǎng)絡(luò)信息檢索[J];情報理論與實踐;2004年06期
【共引文獻】
相關(guān)期刊論文 前3條
1 楊建林;;基于本體的文本信息檢索研究[J];情報理論與實踐;2006年05期
2 張鼐;;基于本體論的網(wǎng)絡(luò)信息檢索[J];情報雜志;2006年04期
3 王弼佐;王茜;李鵬;;基于Ontology的多主體知識檢索模型[J];情報雜志;2006年06期
相關(guān)博士學(xué)位論文 前2條
1 谷建軍;基于敘詞表的中醫(yī)古籍文獻領(lǐng)域本體建模方法研究[D];中國中醫(yī)科學(xué)院;2006年
2 謝剛;基于變精度粗集的軟件項目投標風險挖掘與規(guī)避研究[D];華中科技大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 張英;基于工作流的協(xié)同制造任務(wù)分配技術(shù)研究[D];西北工業(yè)大學(xué);2006年
2 姚永祥;基于XTM的政務(wù)知識導(dǎo)航系統(tǒng)的研究與實現(xiàn)[D];大連理工大學(xué);2006年
3 王煜;Internet智能比較購物的研究與實現(xiàn)[D];浙江工商大學(xué);2006年
4 許又泉;一種網(wǎng)絡(luò)學(xué)習系統(tǒng)的研究與設(shè)計[D];湖南大學(xué);2006年
5 楊若望;基于本體的語義檢索方法研究[D];北京郵電大學(xué);2006年
6 常江;數(shù)字圖書館建設(shè)中數(shù)字資源整合的研究與藍圖設(shè)計[D];北京交通大學(xué);2007年
7 李愛明;個性化搜索引擎用戶模型研究[D];華中師范大學(xué);2007年
8 于俊洋;智能搜索引擎導(dǎo)航器的研究和設(shè)計[D];河南大學(xué);2007年
9 李淵;面向異步通訊機制的網(wǎng)頁搜索技術(shù)研究[D];浙江工商大學(xué);2007年
10 魏丕國;基于本體的信息檢索系統(tǒng)模型研究[D];山東科技大學(xué);2007年
【二級參考文獻】
相關(guān)期刊論文 前3條
1 王繼成,蕭嶸,孫正興,張福炎;Web信息檢索研究進展[J];計算機研究與發(fā)展;2001年02期
2 朱禮軍,陶蘭,黃赤;語義萬維網(wǎng)的概念、方法及應(yīng)用[J];計算機工程與應(yīng)用;2004年03期
3 張曉林;Semantic Web與基于語義的網(wǎng)絡(luò)信息檢索[J];情報學(xué)報;2002年04期
【相似文獻】
相關(guān)期刊論文 前10條
1 胡風華;郭丹峰;劉冰;;搜索引擎的智能化和知識庫系統(tǒng)在其中的應(yīng)用[J];光盤技術(shù);2009年05期
2 張蓮梅,陳紅梅,許繼紅,楊璃,李凌;基于分布式電力資源庫的搜索引擎框架設(shè)計[J];電力信息化;2005年03期
3 袁林;;基于搜索引擎的電力調(diào)度知識管理系統(tǒng)[J];電力信息化;2008年07期
4 謝文潔;陳森利;;企業(yè)搜索引擎在供電行業(yè)的研究和應(yīng)用[J];辦公自動化;2009年02期
5 陳紅英;楊宜民;;基于決策樹技術(shù)的個性化服務(wù)Agent[J];微電子學(xué)與計算機;2006年03期
6 仇壯麗;;在線論文復(fù)制檢測系統(tǒng)設(shè)計[J];計算機工程與應(yīng)用;2011年19期
7 謝建國;;智能代理在電子商務(wù)中的應(yīng)用[J];閩西職業(yè)技術(shù)學(xué)院學(xué)報;2010年01期
8 陳正銘;鄧雪梅;;Web知識挖掘與計算機網(wǎng)絡(luò)[J];韶關(guān)學(xué)院學(xué)報;2006年09期
9 謝娟文;秦淑娟;焦愛勝;;人工智能在搜索引擎資源獲取中的應(yīng)用[J];機械研究與應(yīng)用;2009年02期
10 李春杰;崔紅霞;;基于多Agent搜索行為分析的用戶興趣模型[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2010年02期
相關(guān)會議論文 前4條
1 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系統(tǒng)中的應(yīng)用研究[A];圖像圖形技術(shù)與應(yīng)用進展——第三屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2008年
2 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評論信息的挖掘[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
3 張素智;李寶燕;樊得強;;面向用戶和領(lǐng)域本體的Web信息采集系統(tǒng)[A];計算機研究新進展(2010)——河南省計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
4 付雙雙;段京莉;;治療藥物監(jiān)測軟件應(yīng)用進展[A];2011年中國藥學(xué)大會暨第11屆中國藥師周論文集[C];2011年
相關(guān)重要報紙文章 前3條
1 ;搜索引擎將引入人工智能技術(shù)[N];人民郵電;2006年
2 本報記者 金真;破解行業(yè)發(fā)展瓶頸 力爭接軌國際標準[N];中國建設(shè)報;2010年
3 本報記者 余建斌;機器學(xué)習與互聯(lián)網(wǎng)搜索[N];人民日報;2011年
相關(guān)博士學(xué)位論文 前10條
1 王德吉;復(fù)雜環(huán)境下自適應(yīng)智能決策支持系統(tǒng)研究[D];中國科學(xué)技術(shù)大學(xué);2007年
2 徐晴陽;基于關(guān)系子群發(fā)現(xiàn)算法的聚焦爬行技術(shù)[D];吉林大學(xué);2008年
3 陳德品;基于遷移學(xué)習的跨領(lǐng)域排序?qū)W習算法研究[D];中國科學(xué)技術(shù)大學(xué);2010年
4 張亮;面向開放域的中文問答系統(tǒng)問句處理相關(guān)技術(shù)研究[D];南京理工大學(xué);2006年
5 王亮;基于胞映射的數(shù)字控制系統(tǒng)量化效應(yīng)分析與設(shè)計[D];華中科技大學(xué);2008年
6 孫小林;2-型模糊描述邏輯及其在本體進化中的應(yīng)用研究[D];華中科技大學(xué);2007年
7 孫建濤;Web挖掘中的降維和分類方法研究[D];清華大學(xué);2005年
8 胡國平;基于超大規(guī)模問答對庫和語音界面的非受限領(lǐng)域自動問答系統(tǒng)研究[D];中國科學(xué)技術(shù)大學(xué);2007年
9 張顯;信息距離理論及其在問答系統(tǒng)中的應(yīng)用研究[D];清華大學(xué);2008年
10 許笑;分布式Web信息采集關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 王亞偉;智能代理在網(wǎng)絡(luò)營銷中的應(yīng)用框架研究[D];河北工業(yè)大學(xué);2006年
2 程濤;個性化網(wǎng)絡(luò)信息采集處理系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2011年
3 車志軍;人工智能在搜索引擎資源獲取中的應(yīng)用[D];浙江大學(xué);2006年
4 王放;一種自治的分布式信息采集與檢索系統(tǒng)[D];四川大學(xué);2006年
5 徐芳;利用概念檢索實現(xiàn)專業(yè)搜索引擎的智能化[D];北京化工大學(xué);2008年
6 張興;數(shù)字有機體中資源發(fā)現(xiàn)的知識庫構(gòu)建[D];電子科技大學(xué);2007年
7 王曉;網(wǎng)絡(luò)制造資源搜索關(guān)鍵技術(shù)研究與應(yīng)用[D];貴州大學(xué);2006年
8 朱宏磊;流形學(xué)習算法的研究與應(yīng)用[D];天津大學(xué);2007年
9 姜博;基于聚焦爬蟲的web信息采集技術(shù)研究[D];北方工業(yè)大學(xué);2011年
10 安利斌;基于知網(wǎng)的內(nèi)容知曉研究[D];太原理工大學(xué);2006年
,本文編號:2022909
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2022909.html