基于文本信息的社會關(guān)系分析與研究
本文選題:社會關(guān)系分析 切入點:群組分析 出處:《蘇州大學(xué)》2016年博士論文
【摘要】:目前,隨著互聯(lián)網(wǎng)的發(fā)展,大量的信息被呈現(xiàn)在我們面前。社交網(wǎng)絡(luò)起源于網(wǎng)絡(luò)交友,人們使用社交網(wǎng)絡(luò)服務(wù)來組織、維護現(xiàn)有的社會關(guān)系,發(fā)現(xiàn)新的社會關(guān)系,從而在網(wǎng)絡(luò)上呈現(xiàn)自己,并進行相關(guān)的社交活動。人與人之間的最簡單的社會關(guān)系為好友關(guān)系。除了好友關(guān)系之外,人們還可以根據(jù)興趣和個人屬性被區(qū)分為不同的群組。比如根據(jù)興趣,人們可以被分為愛好書籍的和愛好跳舞的群組等。另外,根據(jù)對于某一事物的專業(yè)程度,人們又可以被分為專業(yè)人士和普通大眾。因此,識別人與人之間的兩大類社會關(guān)系,即好友關(guān)系和群組關(guān)系,將是本文的研究的兩個主要方面。傳統(tǒng)的針對社交網(wǎng)絡(luò)的研究通常會基于用戶之間的聯(lián)系進行分析,但是很多用戶之間并沒有足夠多的聯(lián)系用來幫助分析。而用戶發(fā)表的文本信息在很多情況下能夠有效的幫助分析社會關(guān)系,比如從文本中能找出有相近愛好或者相近寫作風(fēng)格的用戶群組。因此,本文主要將研究基于文本信息的用戶間好友和群組關(guān)系分析。除此之外,從文本中抽取的用戶的個人屬性信息能夠很好的幫助識別社會關(guān)系,因此,本文的另一個研究重點就是從文本中有效的抽取有代表性的個人屬性信息。本文主要利用文本信息進行用戶社會關(guān)系分析,并開展了以下幾方面的研究內(nèi)容:1.我們從簡歷文本中抽取用戶的兩類重要的信息來反映用戶的基本屬性。一類是用戶的技能的信息,但是,單純通過技能信息來描述一個用戶又會顯得過于簡單,因此我們從簡歷文本中抽取文本摘要信息作為另一類信息,從而更全面地體現(xiàn)用戶信息。為了抽取用戶的技能和簡歷信息,我們提出了一個聯(lián)合預(yù)測因子圖模型,用來將不同用戶與技能通過多種關(guān)系聯(lián)系起來。具體來說,我們提出的因子圖模型通過屬性函數(shù)利用多種文本信息,而基于因子函數(shù)將不同的用戶聯(lián)系起來。并利用置信傳播算法學(xué)習(xí)與抽取用戶的技能和摘要信息。2.在獲取了用戶的個人屬性信息之后,我們從用戶發(fā)表的文本中抽取的多種文本信息幫助好友關(guān)系預(yù)測任務(wù)。由于好友關(guān)系和興趣是高度相關(guān)的,比如相互聯(lián)系的好友傾向于有相近的興趣,我們抽取了多種情感信息來聯(lián)系有相近興趣的用戶。另外,好友之間的寫作風(fēng)格也會類似,因此,我們抽取了多種寫作風(fēng)格特征,比如,文本結(jié)構(gòu)特征,詞法特征,句法與篇章特征來幫助預(yù)測好友關(guān)系。我們最終基于概率圖模型融合上述信息并進行用戶好友關(guān)系的學(xué)習(xí)與預(yù)測。3.由于區(qū)分用戶群組有很多種標(biāo)準(zhǔn),我們分別按照興趣與專業(yè)程度對用戶的群組進行區(qū)分。值得注意的是,用戶之間可能會有多個共同的興趣群組,而一個用戶只可能是專業(yè)的或者非專業(yè)的。對于基于興趣的群組推薦,由于同一個用戶可能存在多個興趣群組,而不同群組之間也可能存在關(guān)聯(lián),因此我們提出了一種新的隱含因子圖模型,用來有效的集成表層與潛在的文本與社交信息,從而將用戶與群組有效的集成在一起。而對于區(qū)分專業(yè)和非專業(yè)人群,由于專業(yè)人士和非專業(yè)人士的關(guān)注點通常是不同的,而評論的專業(yè)程度通常和語言的表達有關(guān)。同時,對于同一事物的評論,不同類型的評論者也是有關(guān)聯(lián)的。因此,我們提出一種基于協(xié)同矩陣分解的框架,用來預(yù)測用戶發(fā)表評論的專業(yè)程度,并結(jié)合了多種文本特征與評論之間的聯(lián)系。目前,用戶社會關(guān)系分析研究尚處于起步階段,本文研究亦屬探索性工作,上述工作對用戶社會關(guān)系分析在理論、資源、計算上均有不同程度的創(chuàng)新,對該領(lǐng)域的相關(guān)研究具有重要參考價值。
[Abstract]:At present, with the development of the Internet, a large amount of information to be presented in front of us. The social network originated in the network of friends, people use social networking services to organize, maintain the existing social relations, the discovery of new social relations, which presents itself in the network, and related social activities. The most simple social relationship between people and people's friendship. In addition to a friend relationship, people can also be divided into different groups according to their interests and personal attributes. For example, according to the interest, people can be divided into love books and loving dance group. In addition, according to the professional degree for one thing, it can be divided into professionals and the general public. Therefore, two kinds of social relations between recognition of people, namely friends and group relations, will be the two main aspects of this research. The traditional acupuncture on social networks Network research will usually be analyzed based on the link between the user, but many users is not enough to help the user contact analysis. While the published text information can effectively help the analysis of social relations in many cases, for example, from the text can be found with similar hobbies or similar writing styles of users. Therefore, this paper will study and analyze the text information between users and groups based on the relationship between friends. In addition, the personal information in the text selected users can help identify social relations, therefore, another focus of this paper is effective from the text of the selected personal information representative in this paper. The main use of text analysis of the information users of social relations, and carried out as follows: 1. we extracted from the text of the two types of user resume weight The basic attribute to the information to reflect the user. One is user skills information, but only by skill information to describe a user will seem too simple, so we extracted from text summarization information resume text as another type of information, which reflects the user information in a more comprehensive way. In order to extract the user skills and resume information, we propose a joint prediction factor graph model, for different users and skills linked through a variety of relationships. Specifically, the factor graph model we propose using a variety of text information through the attribute function, and function will link users based on different. And the belief propagation algorithm learning and extraction user skills and abstract information.2. after obtaining the user's personal information, a variety of text information extraction from text published by users in good help The relationship between the prediction task. Because friends and interests are highly relevant, such as mutual contact friends tend to have similar interests, we selected a variety of emotional contact information to users with similar interest. In addition, between friends writing style will be similar, therefore, we selected a variety of writing style, for example. The text structure features, lexical features, syntactic and textual features to help predict friendship. We finally learn and predict the probability of.3. graph model and the information fusion based on user friend relationship due to distinguish between user groups there are many standards, we respectively according to the degree of interest and professional user groups are distinguished. It is worth noting that, there may be many common interests between the users in a group, and a user can only be professional or non professional. Recommended for interest groups based on the In the same user may have more than one interest group, and may also exist between different groups, so we propose a new implicit factor graph model for the effective integration of the surface and the potential of text and social information to users and groups will effectively integrated together. The distinction between professional and non because of professional groups, professional and non professional persons concerned are usually different, and professional comments usually associated with the expression of language. At the same time, the same thing comments, different types of reviewers is also related. Therefore, we propose a collaborative framework based on matrix decomposition, used to predict professional the degree of user comments, and combination between text features and reviews a variety of contact. At present, analysis of user of social relations is still in its infancy, this study is exploratory work The above work has a different degree of innovation on the analysis of social relations in the theory, resources and calculation, and has important reference value for the related research in this field.
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 史加榮;鄭秀云;周水生;;矩陣補全算法研究進展[J];計算機科學(xué);2014年04期
2 李聰;駱志剛;;用于魯棒協(xié)同推薦的元信息增強變分貝葉斯矩陣分解模型[J];自動化學(xué)報;2011年09期
3 袁運祥;基于矩陣分解的子結(jié)構(gòu)法求解介紹[J];計算機應(yīng)用通訊;1981年00期
4 張海建;;分布式矩陣分解算法在推薦系統(tǒng)中的研究與應(yīng)用[J];科技通報;2013年12期
5 何朕,趙文斌,于達仁;攝動矩陣的分解[J];電機與控制學(xué)報;2004年03期
6 李華云;;F范數(shù)及矩陣分解實例研究[J];現(xiàn)代情報;2008年10期
7 鄒理和;;系數(shù)矩陣分解二維譜估值[J];信號處理;1985年03期
8 陳伯倫;陳];鄒盛榮;徐秀蓮;;基于矩陣分解的二分網(wǎng)絡(luò)社區(qū)挖掘算法[J];計算機科學(xué);2014年02期
9 王鋒;趙志文;牟盛;;整數(shù)提升小波多相矩陣分解系數(shù)的快速提取算法[J];中國圖象圖形學(xué)報;2012年03期
10 段華杰;;考慮時間效應(yīng)的矩陣分解技術(shù)在推薦系統(tǒng)中的應(yīng)用[J];微型電腦應(yīng)用;2013年03期
相關(guān)會議論文 前2條
1 王春江;錢若軍;王人鵬;楊聯(lián)萍;;矩陣分解在張力集成體系模態(tài)分析中的應(yīng)用[A];第九屆全國結(jié)構(gòu)工程學(xué)術(shù)會議論文集第Ⅰ卷[C];2000年
2 王春江;王人鵬;錢若軍;王穎;;矩陣分解技術(shù)在體系性態(tài)綜合分析中的初步應(yīng)用[A];“力學(xué)2000”學(xué)術(shù)大會論文集[C];2000年
相關(guān)博士學(xué)位論文 前6條
1 王中卿;基于文本信息的社會關(guān)系分析與研究[D];蘇州大學(xué);2016年
2 李英明;矩陣分解在數(shù)據(jù)挖掘中的應(yīng)用[D];浙江大學(xué);2014年
3 趙科科;低秩矩陣分解的正則化方法與應(yīng)用[D];浙江大學(xué);2012年
4 郭亦鴻;利用穆勒矩陣分解定量測量各向異性介質(zhì)微觀結(jié)構(gòu)[D];清華大學(xué);2014年
5 胡惠軼;基于分解的系統(tǒng)辨識方法研究[D];江南大學(xué);2014年
6 陳根浪;基于社交媒體的推薦技術(shù)若干問題研究[D];浙江大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 秦曉暉;個性化微博推薦方法研究[D];華南理工大學(xué);2015年
2 劉鳳林;基于矩陣分解的協(xié)同過濾推薦算法研究[D];南京理工大學(xué);2015年
3 李源鑫;基于提升的信任融合矩陣分解推薦算法[D];福建師范大學(xué);2015年
4 陳洪濤;基于矩陣分解的常規(guī)與長尾捆綁推薦的博弈研究[D];福建師范大學(xué);2015年
5 張濟龍;基于概率矩陣分解的推薦算法研究[D];燕山大學(xué);2015年
6 鄧志豪;基于物品相似度和主題回歸的矩陣分解推薦算法[D];浙江大學(xué);2015年
7 余露;利用矩陣分解算法建模數(shù)據(jù)稀疏環(huán)境下用戶協(xié)同行為[D];杭州師范大學(xué);2015年
8 倪澤明;混合用戶行為建模的概率矩陣分解推薦算法[D];浙江大學(xué);2015年
9 丁浩;基于協(xié)同矩陣分解的藥物靶標(biāo)相互作用關(guān)系預(yù)測[D];復(fù)旦大學(xué);2014年
10 吳世偉;社會網(wǎng)絡(luò)中的鏈接分析[D];復(fù)旦大學(xué);2014年
,本文編號:1700864
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/1700864.html