Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.
發(fā)布時(shí)間:2017-01-18 10:54
本文關(guān)鍵詞:Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
[摘要] 電子商務(wù)網(wǎng)站每天都會產(chǎn)生大量的數(shù)據(jù),運(yùn)用數(shù)據(jù)挖掘技術(shù)可以從這些數(shù)據(jù)中發(fā)現(xiàn)對市場分析及預(yù)測非常有益的信息。本文討論了Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。
[關(guān)鍵詞] 數(shù)據(jù)挖掘Web數(shù)據(jù)挖掘電子商務(wù)
網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)飛速發(fā)展,電子商務(wù)顯示出越來越強(qiáng)大的生命力,同時(shí)各種基于互聯(lián)網(wǎng)的商業(yè)Web站點(diǎn)也面臨越來越激烈的競爭。如何了解到顧客盡可能多的愛好和價(jià)值取向,為顧客提供更優(yōu)質(zhì)的服務(wù)成為電子商務(wù)發(fā)展迫切要解決的問題。而電子商務(wù)網(wǎng)站的顧客在Web上的行為都會產(chǎn)生大量數(shù)據(jù)信息,不僅包括本次交易信息而且還有利用搜索引擎,以及在站點(diǎn)內(nèi)進(jìn)行瀏覽的相關(guān)數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析這些數(shù)據(jù),優(yōu)化Web站點(diǎn)拓?fù)浣Y(jié)構(gòu),指導(dǎo)企業(yè)調(diào)整營銷策略,給客戶提供動(dòng)態(tài)的個(gè)性化的高效率服務(wù)。
一、Web數(shù)據(jù)挖掘
Web數(shù)據(jù)挖掘(Web Data Mining),是數(shù)據(jù)挖掘技術(shù)在Web環(huán)境下的應(yīng)用,是從大量的Web文檔集合和在站點(diǎn)內(nèi)進(jìn)行瀏覽的相關(guān)數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的模式或信息。它是一項(xiàng)綜合技術(shù),涉及到Internet技術(shù)、人工智能、計(jì)算機(jī)語言學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域。對應(yīng)于不同的Web數(shù)據(jù),Web挖掘也分成三類:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用模式挖掘。
Web使用模式挖掘(Web Usage Mining)是對用戶訪問Web時(shí)在服務(wù)器方留下的訪問記錄進(jìn)行挖掘,它通過挖掘Web日志文件及客戶交易數(shù)據(jù)來發(fā)現(xiàn)有意義的用戶訪問模式和相關(guān)的潛在用戶群。其主要特點(diǎn)是對用戶信息數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。
盡管Web挖掘的形式和研究方向?qū)映霾桓F,但隨著電子商務(wù)的興起和迅猛發(fā)展,,Web挖掘的一個(gè)重要應(yīng)用方向?qū)⑹请娮由虅?wù)系統(tǒng)。電子商務(wù)是數(shù)據(jù)挖掘技術(shù)最恰當(dāng)?shù)膽?yīng)用領(lǐng)域,因?yàn)殡娮由虅?wù)可以很容易滿足數(shù)據(jù)挖掘所必需的因素:豐富的數(shù)據(jù)源、自動(dòng)收集的可靠數(shù)據(jù),并且可將挖掘的結(jié)果轉(zhuǎn)化成商業(yè)行為,商業(yè)投資可以及時(shí)評價(jià)。其中與電子商務(wù)關(guān)系最為密切的是Web使用模式挖掘。
二、電子商務(wù)中Web挖掘的數(shù)據(jù)源
在Web上可以用來作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識模式。
1.服務(wù)器數(shù)據(jù)
客戶訪問站點(diǎn)時(shí)會在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲在服務(wù)器上。一般包括sever logs、error logs、cookie logs等。 查詢數(shù)據(jù)
它是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對于在線客戶也許會搜索一些產(chǎn)品或某些廣告信息,這些查詢信息就通過cookie或是登記信息連接到服務(wù)器的訪問日志上。 在線市場數(shù)據(jù)
這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫里存儲的有關(guān)電子商務(wù)站點(diǎn)信息、用戶購買信息、商品信息等數(shù)據(jù)。 Web頁面
主要是指HTLM和XML頁面的內(nèi)容,包括本文、圖片、語音、圖像等。 Web頁面超級鏈接關(guān)系
主要是指頁面之間存在的超級鏈接關(guān)系,這也是一種重要的資源。
6.客戶登記信息
客戶登記信息是指客戶通過Web頁輸入的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問日志集成,以提高數(shù)據(jù)挖掘的準(zhǔn)確度,使之能更進(jìn)一步的了解客戶。
1 2 3 下一頁
本文關(guān)鍵詞:Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:238108
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/238108.html
最近更新
教材專著