天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 新聞傳播論文 >

在線社會(huì)網(wǎng)絡(luò)關(guān)鍵用戶挖掘方法研究

發(fā)布時(shí)間:2018-03-07 11:12

  本文選題:在線社會(huì)網(wǎng)絡(luò) 切入點(diǎn):關(guān)鍵用戶 出處:《哈爾濱工程大學(xué)》2016年博士論文 論文類型:學(xué)位論文


【摘要】:近年來,Facebook、Twitter、微博、微信等社交網(wǎng)站已經(jīng)逐漸成為人們?nèi)粘I钪械闹饕缃磺。人們可以隨時(shí)隨地通過社交媒體建立各種交互關(guān)系,從而產(chǎn)生了不同層次和粒度的虛擬在線社交網(wǎng)絡(luò)。在線社會(huì)網(wǎng)絡(luò)由動(dòng)態(tài)變化的用戶和他們的交互關(guān)系組成,以支撐網(wǎng)絡(luò)信息和數(shù)據(jù)的即時(shí)交換。因此,在線社會(huì)網(wǎng)絡(luò)關(guān)鍵用戶挖掘方法研究可以幫助企業(yè)進(jìn)行產(chǎn)品推廣、幫助政府進(jìn)行輿情分析、預(yù)警與調(diào)控,具有實(shí)際應(yīng)用價(jià)值。本文以真實(shí)的在線社會(huì)網(wǎng)絡(luò)數(shù)據(jù)為研究對(duì)象,主要針對(duì)熱點(diǎn)話題意見領(lǐng)袖挖掘、持久話題中關(guān)鍵人物分析、信息溯源研究中關(guān)鍵用戶提取、信息傳播引擎節(jié)點(diǎn)挖掘等問題展開研究,并在虛假信息控制和高效網(wǎng)絡(luò)營銷上進(jìn)行了應(yīng)用性研究。本文的研究內(nèi)容主要包括以下四個(gè)部分:首先,現(xiàn)有的意見領(lǐng)袖挖掘算法都沒有考慮在特定話題中來分析用戶的重要程度,應(yīng)用傳統(tǒng)聚類方法很難把某一話題的相關(guān)帖子準(zhǔn)確地識(shí)別并聚類到一起,傳統(tǒng)的熱點(diǎn)話題意見領(lǐng)袖挖掘方法很難達(dá)到預(yù)期效果,而且文本的情感分析在輿論領(lǐng)袖挖掘中的應(yīng)用問題也有待解決。本文提出一種基于話題模型的意見領(lǐng)袖挖掘算法TOLM(Topic Opinion Leader Mining),以真實(shí) BBS(Bulletin Board System)論壇為研究對(duì)象,應(yīng)用 LDA(Latent Dirichlet Allocation)話題模型計(jì)算標(biāo)題的相似度并自動(dòng)聚類,構(gòu)建變規(guī)模用戶回復(fù)關(guān)系網(wǎng)絡(luò)模型,通過社會(huì)網(wǎng)絡(luò)分析得到意見領(lǐng)袖以及不同觀點(diǎn)派別,能有效捕捉輿情并分析輿論傳播特點(diǎn),對(duì)及時(shí)疏導(dǎo)輿情有一定意義。本文提出的意見領(lǐng)袖挖掘算法旨在快速發(fā)現(xiàn)某一網(wǎng)絡(luò)熱門事件中的意見領(lǐng)袖,綜合考慮的帖子的話題屬性、情感傾向和網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系,具有較高的實(shí)用性。其次,作為一個(gè)實(shí)時(shí)性公共信息平臺(tái),BBS上的話題分為突發(fā)性話題和持久性話題,其中持久性話題多為貼近生活的民生話題,擁有較長的時(shí)間跨度。持久話題中關(guān)鍵用戶挖掘的難點(diǎn)在于持久話題的發(fā)現(xiàn)與提取和稀疏網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)挖掘;诖,文章提出持久性話題中關(guān)鍵人物的分析方法,主要包括持久話題的識(shí)別算法和在持久話題社會(huì)網(wǎng)絡(luò)中通過情感加權(quán)的節(jié)點(diǎn)位置分析來提取關(guān)鍵人物的算法兩部分。持久話題的識(shí)別主要結(jié)合LDA模型和相似度模型并在時(shí)間軸上進(jìn)行刻畫。關(guān)鍵人物提取為一種考慮了鄰居節(jié)點(diǎn)的位置、網(wǎng)絡(luò)中節(jié)點(diǎn)關(guān)系的強(qiáng)弱及情感傾向的局部節(jié)點(diǎn)位置確定方法。算法在真實(shí)數(shù)據(jù)集驗(yàn)證了有效性。再次,做為一種典型的社交網(wǎng)絡(luò)平臺(tái),微博信息傳播速度快,如何準(zhǔn)確鎖定信息的精準(zhǔn)源頭是輿情預(yù)警的關(guān)鍵。針對(duì)現(xiàn)有的算法僅僅找到時(shí)間戳最早的節(jié)點(diǎn),沒有考慮節(jié)點(diǎn)的社會(huì)網(wǎng)絡(luò)關(guān)系(好友、關(guān)注等)和信息的語義關(guān)系的問題,本章以新媒體微博信息傳播機(jī)制為例,提出了一種信息傳播溯源算法ITEAE(Initiators and Early Adopters Extraction)。首先,根據(jù)微博轉(zhuǎn)發(fā)關(guān)系建立級(jí)聯(lián)(會(huì)話樹)并按主題相關(guān)性進(jìn)行聚類得到級(jí)聯(lián)的集合(會(huì)話森林);其次,結(jié)合用戶關(guān)系網(wǎng)和信息級(jí)聯(lián)關(guān)系網(wǎng)確定微博信息的真正發(fā)起者;再次,通過文本情感分析和信息級(jí)聯(lián)關(guān)系迭代計(jì)算節(jié)點(diǎn)的影響力指數(shù)和從眾指數(shù),提取微博信息早期重要參與者;最后,分析發(fā)起者和早期重要參與者確定信息源頭并進(jìn)行實(shí)驗(yàn)評(píng)估,并通過刪除優(yōu)質(zhì)源頭節(jié)點(diǎn)和全局高影響力節(jié)點(diǎn)來控制虛假信息的傳播,實(shí)驗(yàn)在新浪微博數(shù)據(jù)集上驗(yàn)證了算法的有效性。相比于已有的研究,本文算法能夠通過轉(zhuǎn)發(fā)關(guān)系形成的級(jí)聯(lián)集合進(jìn)行信息的溯源。最后,以轉(zhuǎn)發(fā)為傳播機(jī)制微博平臺(tái)上,信息經(jīng)常以“引擎節(jié)點(diǎn)”為中心進(jìn)行“核裂變”式傳播,挖掘這些“引擎節(jié)點(diǎn)”來進(jìn)行微博營銷是一種成本低效率高的營銷手段。其問題的關(guān)鍵是準(zhǔn)確尋找網(wǎng)絡(luò)中有影響力的節(jié)點(diǎn)作為觸發(fā)品牌知名度的少數(shù)用戶,保證在較少投入情況下獲得較大收益;诖,文章提出了一種引擎節(jié)點(diǎn)挖掘算法,首先,基于微博轉(zhuǎn)發(fā)關(guān)系形成信息級(jí)聯(lián)并按時(shí)間戳進(jìn)行剪枝,其次,按話題相關(guān)性生成信息級(jí)聯(lián)樹,通過計(jì)算節(jié)點(diǎn)的綜合擴(kuò)散能力來提取不同精度下的引擎節(jié)點(diǎn),最后,以這些引擎節(jié)點(diǎn)作為初始傳播節(jié)點(diǎn)進(jìn)行信息傳播演化,實(shí)驗(yàn)結(jié)果表明,利用引擎節(jié)點(diǎn)進(jìn)行作為初始節(jié)點(diǎn)能夠使信息傳播速度更快、范圍更大。
[Abstract]:In recent years, Facebook, Twitter, micro-blog, WeChat and other social networking sites have gradually become the main social channels in people's daily life. People can set up various interactive relationship whenever and wherever possible through social media, to create a virtual network of online social network and different levels of granularity. The online social network is composed of the dynamic changes of users and their interactions to exchange instant support, network information and data. Therefore, can help enterprises to promote the product key users of online social network mining method research, public opinion analysis of government help, warning and controlling, and has practical application value. Based on the data of real online social network as the research object, mainly aimed at the hot topic opinion leader mining and analysis key figures lasting topic, key user research information traceability extraction, information dissemination engine node digging questions Study, and Application Research on false information control and efficient network marketing. The main contents of this paper include the following four parts: firstly, the existing opinion leader mining algorithms do not consider the degree of importance in specific topics to analyze the user's application, the traditional clustering method is very difficult to post a topic the accurate identification and clustering together, hot topic opinion leaders in the traditional mining method is difficult to achieve the desired effect, and text sentiment analysis application in opinion leaders in mining has yet to be resolved. This paper proposes a mining algorithm of TOLM topic model based on opinion leaders (Topic Opinion Leader Mining), with the real BBS (Bulletin Board System) forum as the research object, the application of LDA (Latent Dirichlet Allocation) similarity calculation model and title topic clustering, construction of variable size Users reply relation network model, through social network analysis from different views of opinion leaders and factions, can effectively capture the public opinion and public opinion analysis, has a certain significance for timely public opinion. This opinion leader mining algorithm is designed to quickly find a network of popular events in the opinion leaders, considering the topic attribute post that sentiment and network structure, with high practicality. Secondly, as a real-time public information platform, BBS on the topic is divided into hot topics and persistent topics, including persistent topic for people's livelihood topics close to the life, have a longer time span. Key users lasting topic mining is the key node discovery and lasting topic extraction and sparse network mining. Based on this, the article puts forward analysis method of key figures in the main topic of persistence. To identify algorithm including persistent topic and emotion in the weighted by enduring subject in social network node location analysis to extract two part of key figures. The main topic lasting recognition algorithm based on LDA model and similarity model is described in the time axis. The key figure extraction as a consideration to the neighbor node location, local node strength and emotion node relationship in the network. The method to determine the set of algorithms to verify the effectiveness of the real data. Again, as a typical social network platform, micro-blog information dissemination speed, how to accurately accurately lock source of information is the key node for public opinion warning. Existing algorithms only to find the time at the earliest, did not consider the relationship between the social network nodes (friends, attention) semantic relations and information problems, this chapter takes the information dissemination mechanism of new media micro-blog For example, ITEAE proposed an information dissemination algorithm (Initiators and Early Adopters of Extraction). First, according to micro-blog forwarding relationship cascade (session tree) and clustering set by topic correlation (cascade forest; secondly, combined with the session) to determine the real information of the user micro-blog initiator network and information cascade again, through the network; text sentiment analysis and information cascade iterative computation node influence index and conformity index, information extraction of micro-blog early participants; finally, analysis of the initiator and the early participants determine source of information and experimental evaluation, and transmitted by the source node and the global high quality delete node to control the influence of false information. Experiments verify the effectiveness of the algorithm in Sina micro-blog data set. Compared to the existing research, this algorithm can by forwarding relationship The formation of a set of information cascade traceability. Finally, the communication mechanism of the micro-blog platform for forwarding information, often with "engine node" as the center of "fission" type of communication, these "mining engine node" to micro-blog marketing is a kind of high efficiency low cost marketing tool. The key problem is accurately find influential nodes in the network as a trigger for a few users of brand awareness, ensure in less investment under the condition of large gains. Based on this, this paper proposes a mining algorithm engine node, first of all, micro-blog information and forwarding relationship between cascade pruning, according to the time stamp based on second generation information cascade by topic correlation the tree, through comprehensive diffusion capacity calculation of node to node extraction engine, different accuracy. Finally, with these engines as the initial node node dissemination of information dissemination and evolution, The experimental results show that the use of the engine node as the initial node can make the information spread faster and wider.

【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:G206;TP393.09

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊建梅;王舒軍;陸履平;莊東;;廣州軟件產(chǎn)業(yè)社會(huì)網(wǎng)絡(luò)與競(jìng)爭(zhēng)關(guān)系復(fù)雜網(wǎng)絡(luò)的分析與比較[J];管理學(xué)報(bào);2006年06期

2 彭蘭;;從社區(qū)到社會(huì)網(wǎng)絡(luò)——一種互聯(lián)網(wǎng)研究視野與方法的拓展[J];國際新聞界;2009年05期

3 王琪;;嵌入互聯(lián)網(wǎng)中的社會(huì)網(wǎng)絡(luò)—企業(yè)電子社會(huì)網(wǎng)絡(luò)[J];企業(yè)經(jīng)濟(jì);2011年04期

4 李春霞;;網(wǎng)絡(luò)媒體對(duì)社會(huì)網(wǎng)絡(luò)的影響[J];河北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2013年01期

5 阮冰;朱建沖;姜禮平;汲萬鋒;;基于社會(huì)網(wǎng)絡(luò)的民意形成演化建模與仿真研究[J];計(jì)算機(jī)仿真;2011年02期

6 劉晶;張秀蘭;;談社會(huì)網(wǎng)絡(luò)在圖書館的應(yīng)用[J];新世紀(jì)圖書館;2011年09期

7 秦紅霞;陳華東;;社會(huì)網(wǎng)絡(luò)視角的企業(yè)知識(shí)共享演化博弈分析[J];情報(bào)雜志;2009年05期

8 王煜全;;警惕互聯(lián)網(wǎng)上的“國家模式”——再談社會(huì)網(wǎng)絡(luò)的進(jìn)化機(jī)制[J];互聯(lián)網(wǎng)周刊;2011年02期

9 陳萍;;社會(huì)網(wǎng)絡(luò)中企業(yè)知識(shí)資源的互補(bǔ)性[J];圖書與情報(bào);2007年05期

10 黎剛;;文獻(xiàn)信息社會(huì)網(wǎng)絡(luò)建設(shè)新論[J];職業(yè)技術(shù);2007年24期

相關(guān)會(huì)議論文 前10條

1 郭永昌;;中國大城市流動(dòng)人口社會(huì)網(wǎng)絡(luò)構(gòu)筑的空間過程研究[A];2006年中國可持續(xù)發(fā)展論壇——中國可持續(xù)發(fā)展研究會(huì)2006學(xué)術(shù)年會(huì)經(jīng)濟(jì)發(fā)展與人文關(guān)懷專輯[C];2006年

2 程平;;基于社會(huì)網(wǎng)絡(luò)的“云會(huì)計(jì)”知識(shí)流動(dòng)研究[A];第十屆全國會(huì)計(jì)信息化年會(huì)論文集[C];2011年

3 馬宗正;楊永芳;;貧困地區(qū)農(nóng)村社會(huì)網(wǎng)絡(luò)與農(nóng)民發(fā)展——對(duì)寧夏固原市五個(gè)村落的調(diào)查與思考[A];西部發(fā)展評(píng)論(2005年第2期 總第16期)[C];2005年

4 陸雙梅;;藏民社會(huì)網(wǎng)絡(luò)在手機(jī)中的呈現(xiàn)與重構(gòu)[A];第四屆中國少數(shù)民族地區(qū)信息傳播與社會(huì)發(fā)展論叢[C];2012年

5 周靜;;社會(huì)網(wǎng)絡(luò)在營銷實(shí)踐中的研究初探[A];中國高等院校市場(chǎng)學(xué)研究會(huì)2011年年會(huì)論文集[C];2011年

6 周尚意;吳莉萍;王策;;都市更新中社區(qū)社會(huì)網(wǎng)絡(luò)變遷的結(jié)構(gòu)主義分析——以北京西單南太常社區(qū)整體搬遷為例[A];中國地理學(xué)會(huì)百年慶典學(xué)術(shù)論文摘要集[C];2009年

7 陳忠衛(wèi);王志成;;社會(huì)資本對(duì)企業(yè)成長的推動(dòng)作用分析[A];2004年中國管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2004年

8 陳典全;黃朝陽;;基于位置的社會(huì)網(wǎng)絡(luò)(LBSN)研究及其產(chǎn)業(yè)化[A];第二屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會(huì)電子文集[C];2011年

9 李莉;武邦濤;陳忠;;社會(huì)網(wǎng)絡(luò)作為雙刃劍:交易網(wǎng)絡(luò)的摩擦、中介可能性與結(jié)構(gòu)洞[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年

10 郭彥麗;;社會(huì)網(wǎng)絡(luò)視角下組織內(nèi)部信息資源共享研究[A];信息資源配置理論與模型研究——2009信息化與信息資源管理學(xué)術(shù)研討會(huì)專集[C];2009年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 范昕;面對(duì)巨大的社會(huì)網(wǎng)絡(luò),你無法獨(dú)立存在[N];文匯報(bào);2013年

2 本報(bào)記者 蔡雙喜;家政服務(wù)員如何建構(gòu)社會(huì)網(wǎng)絡(luò)[N];中國婦女報(bào);2013年

3 ;Google對(duì)搜索人感興趣[N];計(jì)算機(jī)世界;2004年

4 周麗萍;社會(huì)資本在保險(xiǎn)業(yè)發(fā)展中的作用[N];中國保險(xiǎn)報(bào);2003年

5 席來旺;社會(huì)網(wǎng)絡(luò)提高競(jìng)爭(zhēng)優(yōu)勢(shì)[N];人民日?qǐng)?bào);2007年

6 沈慧婷 本報(bào)記者 丁秀偉;從“擇偶途徑”看改革30年婚戀變遷[N];中國婦女報(bào);2008年

7 北京大學(xué)博士后 山東大學(xué)教授 博導(dǎo) 李春霞;家政服務(wù)員的社會(huì)網(wǎng)絡(luò)及其城鄉(xiāng)差異[N];中國婦女報(bào);2013年

8 賈利強(qiáng);人物研究須重視社會(huì)網(wǎng)絡(luò)與日常生活[N];中國社會(huì)科學(xué)報(bào);2011年

9 梁捷;節(jié)點(diǎn)人際關(guān)系[N];經(jīng)濟(jì)觀察報(bào);2012年

10 ;加強(qiáng)理論研究 推動(dòng)社會(huì)發(fā)展[N];中國社會(huì)科學(xué)院報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 周雪妍;在線社會(huì)網(wǎng)絡(luò)關(guān)鍵用戶挖掘方法研究[D];哈爾濱工程大學(xué);2016年

2 杜曉林;大規(guī)模社會(huì)網(wǎng)絡(luò)可視化若干問題及算法研究[D];哈爾濱工業(yè)大學(xué);2015年

3 李棟;在線社會(huì)網(wǎng)絡(luò)中信息擴(kuò)散研究[D];哈爾濱工業(yè)大學(xué);2014年

4 易成岐;社會(huì)網(wǎng)絡(luò)的信息傳播機(jī)制及控制方法研究[D];哈爾濱理工大學(xué);2016年

5 張伯雷;社會(huì)網(wǎng)絡(luò)信息傳播與影響力最大化研究[D];南京大學(xué);2016年

6 王萬元;基于多Agent技術(shù)的異質(zhì)社會(huì)網(wǎng)絡(luò)群組形成方法研究[D];東南大學(xué);2016年

7 周一峰;非可靠社會(huì)網(wǎng)絡(luò)中多Agent系統(tǒng)任務(wù)合作的自適應(yīng)機(jī)制研究[D];東南大學(xué);2016年

8 吳鴻;社會(huì)網(wǎng)絡(luò)中競(jìng)爭(zhēng)與合作影響最大化研究[D];云南大學(xué);2016年

9 張靜;社會(huì)網(wǎng)絡(luò)影響力建模與度量[D];清華大學(xué);2016年

10 李文金;創(chuàng)業(yè)者社會(huì)網(wǎng)絡(luò)的演化過程研究[D];吉林大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 吳迪;《在線社會(huì)網(wǎng)絡(luò)中產(chǎn)生信任評(píng)價(jià)的可信圖》翻譯實(shí)踐報(bào)告[D];內(nèi)蒙古大學(xué);2015年

2 于洋;國有企業(yè)高管社會(huì)網(wǎng)絡(luò)與企業(yè)創(chuàng)新行為關(guān)系研究[D];遼寧大學(xué);2015年

3 周新;建筑行業(yè)農(nóng)民工社會(huì)網(wǎng)絡(luò)對(duì)收入狀況的影響研究[D];西南交通大學(xué);2015年

4 閆晶星;基于敏感關(guān)系的社會(huì)網(wǎng)絡(luò)隱私保護(hù)方法研究[D];河北工程大學(xué);2015年

5 王美;社會(huì)網(wǎng)絡(luò)視角下的裝備制造業(yè)產(chǎn)業(yè)集群創(chuàng)新研究[D];集美大學(xué);2015年

6 杜宇;社會(huì)網(wǎng)絡(luò)對(duì)中小企業(yè)融資可獲性的作用[D];蘇州大學(xué);2015年

7 張玉志;社會(huì)網(wǎng)絡(luò)中知識(shí)流動(dòng)的邏輯研究[D];西南大學(xué);2015年

8 王利娟;都市菜販的社會(huì)網(wǎng)絡(luò)建構(gòu)[D];西南大學(xué);2015年

9 李超;多維社會(huì)網(wǎng)絡(luò)上的信息挖掘問題研究[D];電子科技大學(xué);2014年

10 王詩懿;GraphLab云計(jì)算平臺(tái)下社會(huì)網(wǎng)絡(luò)的社區(qū)識(shí)別[D];寧波大學(xué);2015年

,

本文編號(hào):1579046

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/xinwenchuanbolunwen/1579046.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶69f51***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com