百度的大數(shù)據(jù)實踐
本文關鍵詞:百度的大數(shù)據(jù)實踐
更多相關文章: 搜索引擎 海量數(shù)據(jù) 互聯(lián)網(wǎng) 百度 用戶 數(shù)據(jù)應用 關鍵詞 網(wǎng)頁數(shù)據(jù)庫 信息 數(shù)據(jù)產(chǎn)品
【摘要】:正互聯(lián)網(wǎng)搜索引擎從第一天開始就是大數(shù)據(jù)應用,互聯(lián)網(wǎng)產(chǎn)生了海量數(shù)據(jù),如何從中找到需要的信息就是一個大數(shù)據(jù)的命題。搜索引擎正好解決這一問題,網(wǎng)絡爬蟲首先從數(shù)以千億級的網(wǎng)頁中搜集信息,建立網(wǎng)頁數(shù)據(jù)庫。當用戶以關鍵詞查找信息時,搜索引擎會在數(shù)據(jù)庫中進行搜尋,如果找到與用戶查詢語句相符的網(wǎng)站,便采用排序算法——通常根據(jù)網(wǎng)頁中關鍵詞的匹配程
【作者單位】: 百度公司;
【關鍵詞】: 搜索引擎 海量數(shù)據(jù) 互聯(lián)網(wǎng) 百度 用戶 數(shù)據(jù)應用 關鍵詞 網(wǎng)頁數(shù)據(jù)庫 信息 數(shù)據(jù)產(chǎn)品
【分類號】:F49
【正文快照】: 互聯(lián)網(wǎng)搜索引擎從第一天開始就是大數(shù)據(jù)應用,互聯(lián)網(wǎng)產(chǎn)生了海量數(shù)據(jù),如何從中找到需要的信息就是一個大數(shù)據(jù)的命題。搜索引擎正好解決這一問題,網(wǎng)絡爬蟲首先從數(shù)以千億級的網(wǎng)頁中搜集信息,建立網(wǎng)頁數(shù)據(jù)庫。當用戶以關鍵詞查找信息時,搜索引擎會在數(shù)據(jù)庫中進行搜尋,如果找到與
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 董曉常;;百度關口[J];互聯(lián)網(wǎng)周刊;2006年36期
2 袁學倫;;百度:創(chuàng)新團隊推動戰(zhàn)略變身[J];經(jīng)理人;2008年10期
3 ;百度推出老年搜索頻道[J];天津社會保險;2009年03期
4 張健敏;;微軟"必應" 有求"必應"乎?[J];上海信息化;2009年07期
5 ;百度不完全批判[J];互聯(lián)網(wǎng)天地;2010年02期
6 ;到互聯(lián)網(wǎng)去,啟動汽車營銷“搜索”引擎[J];廣告大觀(綜合版);2009年06期
7 王新業(yè);;淘寶 VS 百度死磕 C2C[J];企業(yè)文化;2009年07期
8 李娜;;淘寶VS百度:緣何死磕C2C[J];品牌;2009年05期
9 林濤;;谷歌逼近百度[J];中國企業(yè)家;2009年08期
10 賈玉文;;國內(nèi)搜索引擎SWOT戰(zhàn)略分析——以百度公司為例[J];生產(chǎn)力研究;2009年22期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 包木春;;淺談互聯(lián)網(wǎng)情報信息收集[A];第二十次全國計算機安全學術交流會論文集[C];2005年
2 張冠群;杜建清;楊家海;;基于搜索引擎的網(wǎng)站流量估算模型[A];2009年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2009年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術年會論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學術交流會議論文匯編[C];2003年
5 湯薇;曾艷;;構建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學會2008年年會論文集[C];2008年
6 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年
7 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術研討會論文集[C];2010年
8 陳沛;;搜索的未來[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
9 張t$t$;陳華;姜曉寧;;農(nóng)業(yè)電子圖書館在網(wǎng)絡搜索引擎沖擊下如何發(fā)展的幾點思考[A];中國農(nóng)業(yè)信息科技創(chuàng)新與學科發(fā)展大會論文匯編[C];2007年
10 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學會、河北省計算機學會、河北省自動化學會、河北省人工智能學會、河北省計算機輔助設計研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學術年會論文集[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 加貝;百度谷歌風景獨好 搜索引擎“冬泳”正酣[N];證券日報;2008年
2 本報記者 何苗;李彥宏 專注于簡單管理[N];中華工商時報;2009年
3 本報記者 郭川;移動搜索要跳出傳統(tǒng)互聯(lián)網(wǎng)模式[N];人民郵電;2009年
4 見習記者 張惠;谷歌退出?中國搜索市場前路難測[N];中國商報;2010年
5 本報記者 姜靖;雷鳴:四年躋身數(shù)字音樂三甲[N];科技日報;2009年
6 本報記者 李新國;傳統(tǒng)搜索變身挑戰(zhàn)互聯(lián)網(wǎng)[N];南京日報;2006年
7 本報記者 張明;谷歌攻城計[N];中國經(jīng)營報;2009年
8 加貝;李開復入主三年有余 谷歌中國變化幾多?[N];證券日報;2009年
9 何軍;“鳳巢”現(xiàn)身 助中國企業(yè)過冬[N];證券日報;2009年
10 ;“搜索引擎”為學術造假提供了便利[N];遼寧日報;2010年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
3 蘇君華;面向搜索引擎的技術接受模型研究[D];南京大學;2011年
4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
7 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年
8 李莎莎;面向搜索引擎的自然語言處理關鍵技術研究[D];國防科學技術大學;2011年
9 鄭文良;基于簡單本體的農(nóng)業(yè)P2P搜索引擎關鍵技術研究[D];沈陽農(nóng)業(yè)大學;2013年
10 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應用研究所);2003年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 郝金隆;網(wǎng)絡原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究[D];重慶大學;2007年
2 徐坤;基于關系數(shù)據(jù)庫搜索引擎的研究[D];長春理工大學;2008年
3 何華;搜索引擎中的數(shù)據(jù)存儲問題研究[D];浙江大學;2005年
4 李玨伶;搜索引擎網(wǎng)頁相關性評估方法設計及其在rank模型上的應用[D];北京交通大學;2011年
5 劉宇波;面向可下載資源的WEB搜索引擎的設計與實現(xiàn)[D];湖南大學;2005年
6 余光莉;基于互聯(lián)網(wǎng)的交互式積累式WebTRIZ系統(tǒng)[D];天津大學;2005年
7 薛云;Internet上元搜索引擎的研究與設計[D];太原理工大學;2003年
8 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結果排序策略的研究[D];西北農(nóng)林科技大學;2010年
9 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年
10 董晨;基于模糊聚類的個性化搜索引擎的研究[D];福州大學;2005年
,本文編號:937150
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/937150.html