天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

社交媒體用戶識別方法研究

發(fā)布時間:2021-01-02 20:00
  伴隨著移動網(wǎng)絡(luò)技術(shù)的發(fā)展,社交媒體用戶數(shù)量迎來了爆炸式增長,社交媒體已然成為存儲用戶信息的龐大數(shù)據(jù)庫。社交媒體用戶識別是指對用戶的賬號信息、屬性信息、心理狀況和行為習(xí)慣等相關(guān)內(nèi)容進行識別。出于不同的社交目的,同一用戶通常會在不同的社交應(yīng)用中注冊多個賬號,并且有可能提供不同的身份信息。通過社交媒體用戶識別技術(shù)匹配不同平臺的用戶賬號,構(gòu)建全面的用戶信息庫,從而為商品推薦、信息檢索和網(wǎng)絡(luò)空間監(jiān)管等下游應(yīng)用提供有效支撐。同時出于保護個人隱私的考慮,用戶往往會選擇隱藏個人信息,這導(dǎo)致用戶某些有價值的屬性信息難以直接獲取。通過社交媒體用戶識別技術(shù)對用戶缺失的屬性信息進行推測,能夠進一步完善用戶信息庫,從而更加全面地了解用戶。本文針對社交媒體用戶識別問題,從跨社交媒體的用戶賬號匹配和社交媒體用戶屬性識別兩方面開展研究,主要貢獻包括如下兩方面內(nèi)容:(1)提出了一種基于維特比算法的社交媒體賬號匹配方法。傳統(tǒng)的賬號匹配方法存在著匹配效率低下和多平臺賬號匹配準確率低的問題。本論文通過以下三個步驟解決了傳統(tǒng)方法存在的問題。首先,該方法基于賬號用戶名相似性構(gòu)建候選匹配賬號集合,通過縮小候選匹配賬號集合的大小解決... 

【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:73 頁

【學(xué)位級別】:碩士

【部分圖文】:

社交媒體用戶識別方法研究


圖卷積網(wǎng)絡(luò)算法框架圖

示意圖,地理位置,示意圖,邊界框


電子科技大學(xué)碩士學(xué)位論文24上述三種情況的公式化定義如(3-11)所示。1212212112122Bbox()/Bbox()ifBbox()Bbox()Bbox()/Bbox()ifBbox()Bbox()score1/(1)if,0.0locllllllllllll=+在一個國家其它(3-11)根據(jù)上述公式,假如,1l=“NewYork”,2l=“Manhattan”,由于Manhattan是NewYork的一個行政區(qū),NewYork的邊界框覆蓋了Manhattan區(qū)域,則這兩個地理位置的相似度值為兩個區(qū)域的面積的比值。假如,1l=“Athens”,2l=“Logan”,如圖3-5所示,兩個地理位置屬于同一個國家,但兩個地理位置的邊界框不重合則使用邊界框中心的歐幾里得距離進行計算,其中122ll表示兩個邊界框中心的的歐幾里得距離。圖3-5地理位置示意圖(3)教育工作信息教育工作信息由用戶就職的公司和受教育的學(xué)校組成。Linkedin是一個專業(yè)的職場社交網(wǎng)站,用戶通常會選擇公開其教育和工作經(jīng)歷,F(xiàn)acebook網(wǎng)站的個人信息頁也要求用戶填寫教育和工作經(jīng)歷,雖然Twitter的個人信息頁面不包含教育和工作經(jīng)歷,但用戶經(jīng)常會在其推文中提及(@)其公司和學(xué)校,我們可以從推文中提取@信息作為工作和教育信息的來源。因此可以通過上述方式獲得用戶在不同社交平臺上的教育工作信息集合,例如,用戶PeterMullen對應(yīng)的三個集合為SetL={CNNInternational,CNN,BBC,NewYorkTimes,UniversityofColumbia},SetF

用戶信息,網(wǎng)站,頁面,賬號


第三章基于維特比算法的社交媒體賬號匹配29維特比算法是一種動態(tài)規(guī)劃算法,通過記錄中間狀態(tài)的最短路經(jīng)對匹配路徑不斷進行剪枝大大降低了在匹配網(wǎng)絡(luò)中尋找最短路的時間復(fù)雜度,使用維特比算法進行求解的時間復(fù)雜度為()2KN,其時間復(fù)雜度與K呈線性關(guān)系。綜上所述,基于維特比算法的社交媒體賬號匹配方法的整體時間復(fù)雜度為()2KN。在實際應(yīng)用中,本論文方法通過使用維特比算法極大地降低了多平臺賬號匹配的時間復(fù)雜度,同時可以通過設(shè)定D和p的大小來控制N值的大小將本論文算法的時間消耗控制在可以接受的范圍。3.6實驗評估3.6.1實驗數(shù)據(jù)和評估指標為了驗證基于維特比算法的社交媒體賬號匹配方法的有效性,需要對一批具有真實匹配關(guān)系的賬號進行測試。目前通常使用眾包平臺和問卷調(diào)查的方式獲得具有真實匹配關(guān)系的社交賬號,但是使用這兩種方式獲得可靠匹配賬號的難度較大。經(jīng)過調(diào)研發(fā)現(xiàn)很多網(wǎng)站提供個人聯(lián)系信息匯總服務(wù),如圖3-8所示,Rocketreach是一個聯(lián)系信息匯總網(wǎng)站,用戶在該網(wǎng)站上注冊賬號時需要提供指向其他社交平臺的個人主頁鏈接,從該網(wǎng)站的用戶信息頁面能夠獲得該用戶在不同平臺的社交賬號。因此本論文從Rocketreach網(wǎng)站上收集匹配賬號構(gòu)建測試數(shù)據(jù)集。圖3-8RocketSearch網(wǎng)站用戶信息頁面本論文一共在RocketSearch網(wǎng)站收集了6427個社交賬號,這些社交賬號來自于Facebook,Twitter,Linkedin,Github,Quora和Instagram等社交平臺,不同社交平臺賬號占比統(tǒng)計數(shù)據(jù)如表3-8所示。

【參考文獻】:
期刊論文
[1]基于信息熵的跨社交網(wǎng)絡(luò)用戶身份識別方法[J]. 吳錚,于洪濤,劉樹新,朱宇航.  計算機應(yīng)用. 2017(08)
[2]基于用戶名特征的用戶身份同一性判定方法[J]. 劉東,吳泉源,韓偉紅,周斌.  計算機學(xué)報. 2015(10)
[3]基于多屬性決策的社交網(wǎng)絡(luò)用戶識別(英文)[J]. 葉娜,張銀亮,董麗麗,邊根慶,Enjie LIU,Gordon J.Clapworthy.  中國通信. 2013(12)



本文編號:2953544

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2953544.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4cd16***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com