淺談一種面向大數(shù)據(jù)行業(yè)的智能搜索引擎技術(shù)
發(fā)布時間:2021-12-23 19:39
大數(shù)據(jù)這個名詞誕生于2008年,其主要應(yīng)用于商業(yè)智能、互聯(lián)網(wǎng)、云計算,最重要應(yīng)用突出在人工智能領(lǐng)域。其主要特點是大量、高速、多樣、價值及真實性。智能搜索引擎在大數(shù)據(jù)中應(yīng)運而生,并且在不斷的發(fā)展。通過介紹智能搜索引擎的技術(shù)選型、框架結(jié)構(gòu)、技術(shù)實現(xiàn)方法及技術(shù)難點、主要系統(tǒng)功能等,分析其在大數(shù)據(jù)時代的實際應(yīng)用性能?蔀轭愃浦悄芸萍继峁┙(jīng)驗。
【文章來源】:計算技術(shù)與自動化. 2020,39(02)
【文章頁數(shù)】:7 頁
【部分圖文】:
索引目錄
查詢結(jié)構(gòu)圖
d.分布式索引(見附圖5):通過SolrCloud實現(xiàn)分布式索引,SolrCloud中包含有多個Solr Instance,而每個Solr Instance中包含有多個Solr Core,Solr Core對應(yīng)著一個可訪問的Solr索引資源,每個Solr Core對應(yīng)著一個Replica或者Leader,這樣一來,就可以實現(xiàn)對Solr集群的快速訪問,效率相比較過去明顯提高。在solrcloud的眾多solr服務(wù)中,solr分兩種角色,leader和非leader,當solr實例數(shù)量發(fā)生變化時會重新進行選舉leader。要解決這個問題,可以通過使用solrcloud,其中的shard和replica是透明的,且任何一臺機器都可以接受查詢、修改、刪除請求,創(chuàng)建collection、shard、replica,更新索引等數(shù)據(jù)修改操作只能由leader進行,避免產(chǎn)生并發(fā)修改問題,當非leader節(jié)點收到修改操作請求時,要將請求信息存儲在zookeeper中相應(yīng)節(jié)點上,leader節(jié)點對該zookeeper信息進行監(jiān)聽,近實時進行處理。
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則的網(wǎng)絡(luò)行為分析[J]. 劉宗成,張忠林,田苗鳳. 電子科技. 2015(09)
[2]基于小波聚類的網(wǎng)絡(luò)用戶行為分析[J]. 陳嘉翼. 計算機光盤軟件與應(yīng)用. 2015(01)
[3]分布式存儲系統(tǒng)HBase關(guān)鍵技術(shù)研究[J]. 張智,龔宇. 現(xiàn)代計算機(專業(yè)版). 2014(32)
[4]社會化電商用戶需求挖掘初探[J]. 王洪艷. 電子商務(wù). 2014(08)
[5]一個基于hadoop的并行社交網(wǎng)絡(luò)挖掘系統(tǒng)[J]. 李冠辰. 軟件. 2013(12)
[6]Web數(shù)據(jù)挖掘在搜索引擎中的運用[J]. 王剛,張順. 計算機光盤軟件與應(yīng)用. 2013(16)
[7]基于百度搜索日志的用戶行為分析[J]. 董志安,呂學(xué)強. 計算機應(yīng)用與軟件. 2013(07)
[8]基于文本聚類與分布式Lucene的知識檢索[J]. 馮汝偉,謝強,丁秋林. 計算機應(yīng)用. 2013(01)
[9]基于Hadoop的搜索引擎用戶行為分析[J]. 王振宇,郭力. 計算機工程與科學(xué). 2011(04)
[10]傳統(tǒng)數(shù)據(jù)庫技術(shù)與信息檢索技術(shù)的集成[J]. 鄭益,毛楚祥. 計算機時代. 2010(08)
本文編號:3549067
【文章來源】:計算技術(shù)與自動化. 2020,39(02)
【文章頁數(shù)】:7 頁
【部分圖文】:
索引目錄
查詢結(jié)構(gòu)圖
d.分布式索引(見附圖5):通過SolrCloud實現(xiàn)分布式索引,SolrCloud中包含有多個Solr Instance,而每個Solr Instance中包含有多個Solr Core,Solr Core對應(yīng)著一個可訪問的Solr索引資源,每個Solr Core對應(yīng)著一個Replica或者Leader,這樣一來,就可以實現(xiàn)對Solr集群的快速訪問,效率相比較過去明顯提高。在solrcloud的眾多solr服務(wù)中,solr分兩種角色,leader和非leader,當solr實例數(shù)量發(fā)生變化時會重新進行選舉leader。要解決這個問題,可以通過使用solrcloud,其中的shard和replica是透明的,且任何一臺機器都可以接受查詢、修改、刪除請求,創(chuàng)建collection、shard、replica,更新索引等數(shù)據(jù)修改操作只能由leader進行,避免產(chǎn)生并發(fā)修改問題,當非leader節(jié)點收到修改操作請求時,要將請求信息存儲在zookeeper中相應(yīng)節(jié)點上,leader節(jié)點對該zookeeper信息進行監(jiān)聽,近實時進行處理。
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則的網(wǎng)絡(luò)行為分析[J]. 劉宗成,張忠林,田苗鳳. 電子科技. 2015(09)
[2]基于小波聚類的網(wǎng)絡(luò)用戶行為分析[J]. 陳嘉翼. 計算機光盤軟件與應(yīng)用. 2015(01)
[3]分布式存儲系統(tǒng)HBase關(guān)鍵技術(shù)研究[J]. 張智,龔宇. 現(xiàn)代計算機(專業(yè)版). 2014(32)
[4]社會化電商用戶需求挖掘初探[J]. 王洪艷. 電子商務(wù). 2014(08)
[5]一個基于hadoop的并行社交網(wǎng)絡(luò)挖掘系統(tǒng)[J]. 李冠辰. 軟件. 2013(12)
[6]Web數(shù)據(jù)挖掘在搜索引擎中的運用[J]. 王剛,張順. 計算機光盤軟件與應(yīng)用. 2013(16)
[7]基于百度搜索日志的用戶行為分析[J]. 董志安,呂學(xué)強. 計算機應(yīng)用與軟件. 2013(07)
[8]基于文本聚類與分布式Lucene的知識檢索[J]. 馮汝偉,謝強,丁秋林. 計算機應(yīng)用. 2013(01)
[9]基于Hadoop的搜索引擎用戶行為分析[J]. 王振宇,郭力. 計算機工程與科學(xué). 2011(04)
[10]傳統(tǒng)數(shù)據(jù)庫技術(shù)與信息檢索技術(shù)的集成[J]. 鄭益,毛楚祥. 計算機時代. 2010(08)
本文編號:3549067
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3549067.html
最近更新
教材專著