Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用
本文關(guān)鍵詞:Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用,由筆耕文化傳播整理發(fā)布。
數(shù)學(xué)建模競(jìng)賽
第36卷第3期
‘一……。May
201oJoumaIIofSouthw西est南Un民iv族ers大ity學(xué)fo學(xué)r
N報(bào)ati。on自al然itie苧s.
N學(xué)at版ural
1ScienceEdition
文章編號(hào):1003-2843(2010)03-0480--07
Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用
趙國(guó),宋建成
(西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,四川成都610041)
摘要:該文在闡明Google搜索引擎中關(guān)鍵的頁(yè)面等級(jí)算法(PageRallk)原理的基礎(chǔ)上,,分析了PageRank算法的隨機(jī)沖浪模型,并著重討論相應(yīng)的數(shù)學(xué)模型在足球隊(duì)排名問題(1993年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽B題)中的應(yīng)用.具體做法是綜合考慮各隊(duì)的比賽成績(jī),為每支球隊(duì)計(jì)算相應(yīng)的等級(jí)分(Rank),然后根據(jù)各隊(duì)的等級(jí)分高低來確定名次.考慮到競(jìng)技比賽結(jié)果的不確定性,最后建立了等級(jí)分的隨機(jī)沖浪模型.分析表明等級(jí)分排名結(jié)果具有良好的參數(shù)穩(wěn)定性,并且可以成功地處理數(shù)據(jù)缺損方面的困難.
關(guān)鍵詞:搜索引擎;GooglePageRank算法;隨機(jī)沖浪模型;足球隊(duì)排名問題中圖分類號(hào):0141.4
文獻(xiàn)標(biāo)識(shí)碼:A
1
引言
據(jù)統(tǒng)計(jì),在短短20多年的時(shí)間里,Intemet中產(chǎn)生的信息量相當(dāng)于人類過去100年產(chǎn)生的信息總量,而且
Internet上的信息量正以幾何級(jí)數(shù)遞增.搜索引擎已經(jīng)成為人們進(jìn)行Internet信息資源搜索必不可少的工具.在
眾多的搜索引擎中,Google搜索引擎以其雄厚的技術(shù)為支撐,憑借其強(qiáng)大的檢索功能和高質(zhì)量的檢索服務(wù),逐
漸脫穎而出.Google搜索引擎是由斯坦福大學(xué)SergeyBrin和LawrencePage共同設(shè)計(jì)的…,它是目前功能最強(qiáng)的搜索引擎.通過對(duì)80億網(wǎng)頁(yè)進(jìn)行整理,Google可為世界各地的用戶提供所需的搜索結(jié)果,而且搜索速度極快,
通常不到半秒,每天可提供約3億次查詢服務(wù).
圖1
Google搜索引擎的工作原理示意圖
圖2Intemet網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
Google的優(yōu)勢(shì)在于掌握的信息量以及檢索模型和檢索速度.傳統(tǒng)的搜索引擎在很大程度上取決于文字在
網(wǎng)頁(yè)上出現(xiàn)的頻率.Google使用PageRank技術(shù)檢查整個(gè)網(wǎng)絡(luò)鏈接結(jié)構(gòu),并確定哪些網(wǎng)頁(yè)重要性最高.然后進(jìn)
行超文本匹配分析(HypeneXtMatchingAnalysis),以確定哪些網(wǎng)頁(yè)與正在執(zhí)行的特定搜索相關(guān).在綜合考慮整體
收稿日期:2010.03.13
作者簡(jiǎn)介:趙國(guó)(1979.),男,碩士,西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院講師,主要研究方向?yàn)榻鹑跀?shù)學(xué)、數(shù)學(xué)模型
基金項(xiàng)目:西南民族大學(xué)青年項(xiàng)目.
本文關(guān)鍵詞:Google搜索引擎的數(shù)學(xué)模型及其應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號(hào):199066
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/199066.html