天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

搜索引擎用短語詞典建設

發(fā)布時間:2019-09-05 07:21
【摘要】:百度搜索引擎分詞系統(tǒng)中的原短語庫是由統(tǒng)計得出,含有大量噪音。委托北京大學計算語言學研究所進行了手工整理標注。為此設計了加工規(guī)范,對短語進行了嚴格的定義,制定了加工操作手冊,并開展了手工工程,通過嚴格的控制保證標注的一致性。共整理短語119 984條,噪音短語比例約占7%。當前該短語詞典已應用于百度搜索引擎中,對提高檢索效果和減少索引空間都起到一定作用。
【作者單位】: 北京大學計算語言學研究所 北京大學計算語言學研究所 北京大學計算語言學研究所 北京大學計算語言學研究所
【基金】:國家“八六三”高技術項目(2002AA117010-8) 國家自然科學基金資助項目(60203022)
【分類號】:TP391.3;

【共引文獻】

相關期刊論文 前10條

1 肖建濤;張仰森;謝宇;;面向漢語詞義自動標注研究的軟件平臺開發(fā)[J];北京機械工業(yè)學院學報;2007年03期

2 吳林;張仰森;王璐;;《現(xiàn)代漢語語法信息詞典》的概率化改造及其應用[J];北京信息科技大學學報(自然科學版);2011年06期

3 路云;;《現(xiàn)代漢語詞典》中雙音節(jié)“形名”復合詞探析[J];重慶師范大學學報(哲學社會科學版);2011年02期

4 劉云峰;;依據(jù)語篇中多層次信息的句法分析方法[J];大家;2011年09期

5 張惠春;由麗萍;;中文核心框架元素標注規(guī)則的獲取和實驗——以認知語義領域為例[J];電腦開發(fā)與應用;2011年12期

6 林曉恒;;也談現(xiàn)代漢語方位詞的內(nèi)涵與外延[J];廣西大學學報(哲學社會科學版);2010年04期

7 韓蕾;;事件名詞與量詞的選擇關系——以含有語素“雨”的名詞為例[J];華東師范大學學報(哲學社會科學版);2007年03期

8 李學寧;陸汝占;;形容詞多義性在《現(xiàn)代漢語規(guī)范詞典》中的表征[J];井岡山學院學報;2008年01期

9 賈玉祥;俞士汶;;基于實例的隱喻理解與生成[J];計算機科學;2009年03期

10 周溢輝;穆玲玲;昝紅英;袁應成;;漢語語氣詞用法的自動識別研究[J];計算機工程;2010年23期

相關會議論文 前10條

1 加米拉·吾守爾;瓦依提·阿布力孜;吐爾根·依布拉音;;《現(xiàn)代維吾爾語語法信息詞典》數(shù)據(jù)庫建設的研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

2 安娜;劉海濤;侯敏;;語料庫中熟語的標記問題[A];第三屆全國語言文字應用學術研討會論文集[C];2004年

3 楊翠蘭;;基于語料統(tǒng)計的漢語成語語法功能研究[A];第二屆全國學生計算語言學研討會論文集[C];2004年

4 寶金良;;蒙古文文本標點符號及其屬性字段設置[A];第十屆全國少數(shù)民族語言文字信息處理學術研討會論文集[C];2005年

5 郭慧志;劉華;謝學敏;張普;;《人民日報》標注語料的初步統(tǒng)計分析[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

6 王波;王厚峰;;中文單詞聚類的比較研究[A];第三屆學生計算語言學研討會論文集[C];2006年

7 王素格;張武;李德玉;楊軍玲;彭其偉;;基于最大熵模型的漢語動詞與動詞搭配識別[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年

8 王萌;俞士汶;段慧明;孫薇薇;;基于語料統(tǒng)計的現(xiàn)代漢語量名搭配研究[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年

9 海銀花;那順烏日圖;;《蒙古語語法信息詞典量詞分庫》的建設[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年

10 周麗娟;張坤麗;袁應成;昝紅英;;基于規(guī)則的現(xiàn)代漢語連詞用法自動識別研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年

相關博士學位論文 前8條

1 吳善子;漢韓反詰語氣副詞對比研究[D];上海外國語大學;2010年

2 張金圈;漢語單音方位詞與單音動詞的偏正性組配研究[D];華中師范大學;2011年

3 郭鴻志;多源語義知識庫融合方法研究[D];哈爾濱工業(yè)大學;2011年

4 王智強;漢語指代消解及相關技術研究[D];北京郵電大學;2006年

5 徐艷華;現(xiàn)代漢語實詞語法功能考察及詞類體系重構(gòu)[D];南京師范大學;2006年

6 Maharani(陳玉蘭);漢語、印尼語動詞重疊對比研究[D];上海師范大學;2007年

7 何琳;古農(nóng)學本體的半自動構(gòu)建及檢索研究[D];南京農(nóng)業(yè)大學;2007年

8 宗守云;集合量詞的認知研究[D];上海師范大學;2008年

相關碩士學位論文 前10條

1 谷文;基于概念樹的Web信息抽取技術研究[D];長春工業(yè)大學;2010年

2 趙小曼;英漢平行語料庫句子級對齊研究及其在機器翻譯中的應用[D];安徽大學;2010年

3 羅歡;“A_1+A_2”組合研究[D];上海師范大學;2011年

4 郭家翔;賓位主謂結(jié)構(gòu)及其述語的相關考察[D];華中科技大學;2004年

5 成斌;漢語時間語義分析及推理[D];國防科學技術大學;2005年

6 崔寧;單音節(jié)顏色詞研究[D];上海交通大學;2007年

7 王榮;漢語“NP的VP”結(jié)構(gòu)在句子中的句法語義語用研究[D];東北師范大學;2007年

8 于超;副詞“還是”的多角度考察[D];延邊大學;2007年

9 程壽鳳;韓國語反身代詞與漢語“自己”的對比研究[D];延邊大學;2007年

10 郭寶清;“兩典”詞類標注問題研究[D];福建師范大學;2007年

【相似文獻】

相關期刊論文 前10條

1 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡與信息;1999年09期

2 ;關鍵詞搜索[J];每周電腦報;2000年38期

3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學之友;2000年07期

4 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術學院學報;2001年01期

5 周毅華;從搜索引擎的分類看其應用技巧[J];圖書館理論與實踐;2002年06期

6 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書館學研究;2002年05期

7 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期

8 林中;GOOGLE搜索引擎的關鍵詞檢索[J];中國信息導報;2003年03期

9 封劍待封喉;吸星大法“搜”天下 笑傲網(wǎng)絡任我行——搜索引擎絕對專題[J];網(wǎng)絡與信息;2003年07期

10 閆凡蕾;建設站內(nèi)搜索的好幫手——Search Engine Maker[J];少年電世界;2003年08期

相關會議論文 前10條

1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術年會論文集[C];2008年

2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學術交流會議論文匯編[C];2003年

3 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年

4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術研討會論文集[C];2010年

5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學會2008年年會論文集[C];2008年

6 姚樹宇;趙少東;;一種使用分布式技術的搜索引擎[A];2005年全國開放式分布與并行計算學術會議論文集[C];2005年

7 倪俊峰;;基于黃頁搜索引擎的關鍵字排名廣告系統(tǒng)的設計與實現(xiàn)[A];2005年中國索引學會年會暨學術研討會論文集[C];2005年

8 張怡;查貴庭;;SEO在信息服務中的應用研究[A];2010年中國索引學會年會暨學術研討會論文集[C];2010年

9 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第2屆中國普適計算學術會議(PCC'06)論文集[C];2006年

10 楊萌;李春麗;朱明;;網(wǎng)絡搜索技術下的編輯工作[A];學報編輯論叢(第十一集)[C];2003年

相關重要報紙文章 前10條

1 李一鑫;搜索排名的紅與黑[N];財經(jīng)時報;2007年

2 周文林;搜狗3.0能否撼動搜索市場[N];經(jīng)濟參考報;2007年

3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財經(jīng)日報;2005年

4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務咨詢中心 常燕杰;搜索,還是門戶[N];中國計算機報;2005年

5 陳珊;浙江移動推出手機搜索引擎服務[N];人民郵電;2005年

6 趙法忠;搜索引擎還需悠著點[N];中國經(jīng)營報;2005年

7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報;2006年

8 本報記者  趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L港”[N];中國證券報;2006年

9 孫t;搜索引擎驚喜侵權官司止于“避風港”?[N];第一財經(jīng)日報;2006年

10 姜蕊;問天下誰識搜索?[N];中國高新技術產(chǎn)業(yè)導報;2006年

相關博士學位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年

2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年

3 蘇君華;面向搜索引擎的技術接受模型研究[D];南京大學;2011年

4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年

7 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年

8 李莎莎;面向搜索引擎的自然語言處理關鍵技術研究[D];國防科學技術大學;2011年

9 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應用研究所);2003年

10 費巍;搜索引擎檢索功能的性能評價研究[D];武漢大學;2010年

相關碩士學位論文 前10條

1 薛云;Internet上元搜索引擎的研究與設計[D];太原理工大學;2003年

2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學;2010年

3 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年

4 董晨;基于模糊聚類的個性化搜索引擎的研究[D];福州大學;2005年

5 封俊;基于Hadoop的分布式搜索引擎研究與實現(xiàn)[D];太原理工大學;2010年

6 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實現(xiàn)[D];華南理工大學;2010年

7 尉建興;基于Lucene搜索引擎的研究與應用[D];太原理工大學;2011年

8 李建平;智能化WEB信息搜索引擎的研究與實現(xiàn)[D];大慶石油學院;2003年

9 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實踐[D];新疆大學;2004年

10 歐建斌;基于Web挖掘與信息分類的個性化搜索引擎研究[D];暨南大學;2010年



本文編號:2532056

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2532056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶5a5b1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com