企業(yè)輿情監(jiān)控系統(tǒng)POMS的設(shè)計(jì)與實(shí)現(xiàn)
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1Scrapy主要模塊之間的協(xié)同工作圖
圖2-1Scrapy主要模塊之間的協(xié)同工作圖Fig.2-1Scrapyworkflowpicture圖2-1為Scrapy主要模塊之間的協(xié)同工作圖。每個(gè)模塊的功能如下:1)Scrapy引擎:爬蟲的核心部分,是程序的入口和主要工作單元,負(fù)責(zé)與調(diào)度器、數(shù)據(jù)結(jié)構(gòu)化....
圖3-1搜狗微信接口Fig.3-1WebAPIofsogouweixin
圖3-1搜狗微信接口Fig.3-1WebAPIofsogouweixin在輿情監(jiān)控系統(tǒng)中提供了對(duì)新聞網(wǎng)站、論壇網(wǎng)站、新浪微博以及微信等網(wǎng)站上所發(fā)布的信息進(jìn)行爬取監(jiān)控的功能。本章主要介紹了輿情監(jiān)控系統(tǒng)中數(shù)據(jù)采集模塊如何對(duì)微信公眾號(hào)上的文章進(jìn)行爬取。數(shù)據(jù)采集模塊通過騰訊提....
圖3-2搜狗微信搜索結(jié)果圖
圖右邊為查詢結(jié)果列表在網(wǎng)頁中的XPATH信息。由于搜狗微信接口的網(wǎng)頁頁面時(shí)常會(huì)進(jìn)行更新,所以需要定期更新查詢結(jié)果列表的XPATH信息。本文將XPATH信息存儲(chǔ)于MySql關(guān)系型數(shù)據(jù)庫中,通過外部配置XPATH信息的方式定期更新XPATH信息。搜狗微信關(guān)鍵詞....
圖3-3采集文章示例
-25-圖3-3采集文章示例Fig.3-3Exampleofcrawlcontentresult
本文編號(hào):3951820
本文鏈接:http://www.sikaile.net/jingjilunwen/xmjj/3951820.html