天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向汽車領(lǐng)域知識圖譜構(gòu)建的研究與實現(xiàn)

發(fā)布時間:2024-03-02 05:41
  進入二十一世紀以來,人們逐漸意識到了信息、數(shù)據(jù)的重要性。但是現(xiàn)在網(wǎng)絡(luò)上的數(shù)據(jù)呈井噴式增長,如何從海量數(shù)據(jù)中快速搜索出自己感興趣的數(shù)據(jù)是一個亟待解決的問題。知識圖譜的興起能夠幫助我們解決這一難題,知識圖譜能夠挖掘出實體間的語義關(guān)系,能夠幫助我們更好地組織數(shù)據(jù)。隨著人們生活水平的提高,汽車已經(jīng)是人們生活中必不可少的一部分了,人們對于汽車領(lǐng)域相關(guān)信息的需求也越來越大。面向汽車領(lǐng)域的知識圖譜能夠方便人們查詢汽車領(lǐng)域的相關(guān)資訊、配置、評論等信息。本文首先介紹了汽車領(lǐng)域知識圖譜的研究背景和意義,然后闡述了知識圖譜構(gòu)建技術(shù)的現(xiàn)狀,并分析了存在的問題。目前存在的三元組抽取算法,普遍都是直接從網(wǎng)頁文本中抽取三元組,得到的三元組質(zhì)量不是很高。用代詞來替代上文中提到的對象是漢語中常用的表達方式,之前的算法往往會造三元組中的頭實體和尾實體可能是“他”、“他們”等代詞,極大的降低了三元組的質(zhì)量。本文根據(jù)汽車領(lǐng)域數(shù)據(jù)信息的特征,提出了一套完整的汽車領(lǐng)域知識圖譜構(gòu)建算法,能夠很好的解決這個問題。首先用Scrapy爬蟲框架爬取新浪汽車網(wǎng)、網(wǎng)易汽車網(wǎng)和太平洋汽車網(wǎng)等汽車領(lǐng)域相關(guān)數(shù)據(jù)信息,其次用決策樹算法對爬取的文本進行...

【文章頁數(shù)】:71 頁

【學位級別】:碩士

【部分圖文】:

圖1.3網(wǎng)頁的DOM樹結(jié)構(gòu)

圖1.3網(wǎng)頁的DOM樹結(jié)構(gòu)

第1章緒論。正則表達式是將網(wǎng)頁內(nèi)容當做一個字符串來處理,它優(yōu)點在于,運行速度較快,耗時較少,效率相對比較高。但是正則表達式語法比較難,對于復雜網(wǎng)頁,寫出正確高效的正則表達式是一個考驗。BeautifulSoup是python一個HTML解析庫,我們可以利用Bea....


圖3.3奧迪Q5百度百科詞條

圖3.3奧迪Q5百度百科詞條

圖3.3奧迪Q5百度百科詞條從詞條半結(jié)構(gòu)化信息中,我們可以獲得的知識三元組如下表所示。表3.1抽取的知識三元組頭實體關(guān)系(屬性)尾實體奧迪Q5品牌奧迪奧迪Q5生產(chǎn)廠商一汽奧迪/進口奧迪奧迪Q5參考價格35.85-67.80萬奧迪Q5油耗1....


圖5.2系統(tǒng)登錄界面

圖5.2系統(tǒng)登錄界面

圖5.2系統(tǒng)登錄界面若用戶忘記了密碼,可以進入密碼找回頁面,輸入用戶名,系統(tǒng)會將新發(fā)送到該用戶的郵箱中。


圖5.3密碼找回界面

圖5.3密碼找回界面

圖5.2系統(tǒng)登錄界面若用戶忘記了密碼,可以進入密碼找回頁面,輸入用戶名,系統(tǒng)會將新口發(fā)送到該用戶的郵箱中。



本文編號:3916418

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3916418.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6e221***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com