網(wǎng)絡環(huán)境下的領域知識挖掘
[Abstract]:At present, massive heterogeneous and rapidly growing network resources bring about the contradiction between "data surplus" and "knowledge poverty", which makes it more difficult for people to obtain useful knowledge in time. Taking heterogeneous data sources in the network environment as the research object, this paper explores the feasibility of knowledge discovery in various kinds of data, and studies how to effectively utilize and mine network data resources according to the idea of "model-algorithmic realization-data verification". Acquire potential, valuable domain knowledge. 1. A domain knowledge mining model in network environment is proposed. The model is a three-tiered model including data layer, knowledge layer and application layer, which can be used to mine multi-dimensional knowledge from heterogeneous data sources to provide a variety of knowledge applications. Based on this model, this paper takes the web science and technology literature, blog log and social tagging as the research objects, and carries out three kinds of practical research on domain knowledge mining. 2. In this paper, a new probabilistic topic model, the: Topic-Author model, is proposed. In this model, the text information and author information of scientific and technological documents are modeled jointly, and the literature is analyzed in depth. Based on this model, a framework of multi-dimensional literature knowledge mining is constructed, which includes concept mining, expert discovery, literature recommendation, research trend analysis, topic relationship mining, and so on. This paper presents a Blog knowledge mining framework for topic mining, viewpoint analysis and diffusion research. Text clustering and topic model are used to mine the potential concepts in Blog log content and analyze their viewpoints. In this paper, the diffusion model of social network is studied, the method of maximizing diffusion is summarized, and an improved threshold diffusion model is proposed. The collective wisdom based on social tagging and the classification of knowledge organization in Web environment are analyzed. The semantic knowledge mining of social tagging is carried out, and a lightweight ontology construction method is proposed. This method is based on the proposed social label clustering algorithm based on weighted network segmentation, and carries out semantic clustering and semantic stratification. The results show that the domain knowledge mining method proposed in this paper can discover a large number of valuable and potential multi-dimensional knowledge, provide users with a variety of knowledge application services, and support knowledge acquisition and learning in the information age.
【學位授予單位】:華東師范大學
【學位級別】:博士
【學位授予年份】:2010
【分類號】:G434
【相似文獻】
相關期刊論文 前10條
1 王晶;肖興榮;陳英和;;幼兒前提反事實推理的發(fā)展特點和影響因素[J];心理發(fā)展與教育;2009年04期
2 譚金波,宮明明;基于多agent的個性化學習系統(tǒng)研究[J];情報雜志;2005年11期
3 李志平;劉敏昆;孫瑜;;基于web的智能教學系統(tǒng)研究[J];計算機工程與應用;2006年02期
4 張光前;王久銥;周寬久;;基于領域知識的納稅評估方法研究[J];數(shù)理統(tǒng)計與管理;2007年02期
5 朱思峰;錢中華;;基于語義的領域知識檢索系統(tǒng)的設計及實現(xiàn)[J];周口師范學院學報;2008年02期
6 穆肅;;基于語義本體的遠程教育領域知識特點及關系研究[J];現(xiàn)代遠程教育研究;2010年03期
7 姚夫永;政治課教學中對結構不良領域知識簡單化處理的幾種錯誤傾向[J];中學政治教學參考;2002年Z2期
8 袁昱明;李海濤;;語義網(wǎng)、課程領域知識與教育資源網(wǎng)站——從課程資源本體到基于本體的資源網(wǎng)站[J];中國遠程教育;2009年01期
9 安蓉;;面向工程形成的工程知識組織[J];高等工程教育研究;2009年01期
10 杜蕓普,周三元;一種基于多agent的合作智能教學系統(tǒng)模型方法[J];沈陽工業(yè)大學學報;2003年03期
相關會議論文 前10條
1 裴利芳;;領域知識與自我解釋策略間關系的實驗研究[A];第八屆全國心理學學術會議文摘選集[C];1997年
2 韓敏;唐常杰;段磊;李川;鞏杰;;基于TF/IDF相似度的標簽聚類方法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(A輯)[C];2009年
3 陳戰(zhàn)偉;李晉宏;;領域知識在知識發(fā)現(xiàn)過程中的使用[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
4 房冠南;袁彩霞;王小捷;李江;宋占江;;面向對話語料的標簽推薦[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
5 李靜;林鴻飛;;基于用戶情感標簽的音樂檢索算法[A];第六屆全國信息檢索學術會議論文集[C];2010年
6 張文凌;李晉宏;;應用領域知識的數(shù)據(jù)預處理方法的研究[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
7 彭怡;寇綱;;基于領域知識的數(shù)據(jù)挖掘理論框架研究[A];第三屆(2008)中國管理學年會論文集[C];2008年
8 黃安強;張玲玲;陳全;王曉;;用于支撐智能知識發(fā)現(xiàn)的領域知識的表示和提取研究[A];第四屆(2009)中國管理學年會——管理科學與工程分會場論文集[C];2009年
9 劉朝陽;;領域知識和數(shù)據(jù)結合的神經網(wǎng)絡學習方法和應用[A];復雜巨系統(tǒng)理論·方法·應用——中國系統(tǒng)工程學會第八屆學術年會論文集[C];1994年
10 陳志興;;醫(yī)藥衛(wèi)生領域知識產權的發(fā)展與保護[A];中華口腔醫(yī)學會第六屆全國口腔黏膜病學術會議論文集[C];2004年
相關重要報紙文章 前10條
1 記者 方曉靜 黃官國;交流生產技術經驗 增進科技領域知識[N];中國食品質量報;2005年
2 傅愛平;數(shù)字化應用系統(tǒng)中的領域知識[N];中國社會科學院院報;2006年
3 奚啟新;新制定的《國防專利條例》公布[N];人民日報;2004年
4 記者 張珂 尹航 李彩霞;2007國際標簽印刷展覽會(Labelexpo Asia 2007)蓄勢待發(fā)[N];中國包裝報;2007年
5 中國科學院計算技術研究所 黃瑞邋史忠植;加強知識的共享與重用[N];計算機世界;2007年
6 見習記者 劉世昌;2007國際標簽印刷展覽會將在上海舉行[N];中國新聞出版報;2007年
7 鄒大斌;行業(yè)應用軟件開發(fā)需夯實基礎[N];計算機世界;2007年
8 王寅生 張孔生;今年培養(yǎng)技師1.8萬人[N];揚州日報;2006年
9 呂曼華;如何認清投資大勢[N];經濟視點報;2007年
10 左春;讓技術與業(yè)務對話[N];計算機世界;2007年
相關博士學位論文 前10條
1 王萍;網(wǎng)絡環(huán)境下的領域知識挖掘[D];華東師范大學;2010年
2 靳延安;社會標簽推薦技術與方法研究[D];華中科技大學;2011年
3 吳超;在線社會化網(wǎng)絡的語義分析和語義社會網(wǎng)的構建[D];浙江大學;2010年
4 高田;基于領域知識的旅游突發(fā)事件狀態(tài)評估與演化研究[D];北京郵電大學;2011年
5 宣云干;基于潛在語義分析的社會化標注系統(tǒng)標簽語義檢索研究[D];南京大學;2011年
6 楊立;基于領域知識的知識發(fā)現(xiàn)研究[D];中國科學院研究生院(軟件研究所);2005年
7 張裕鼎;問題解決策略遷移研究[D];華東師范大學;2008年
8 熊回香;面向Web3.0的大眾分類研究[D];華中師范大學;2011年
9 栗華;UHF RFID多標簽防碰撞算法的研究與性能分析[D];山東大學;2011年
10 朱正祥;領域驅動知識發(fā)現(xiàn)方法研究[D];大連理工大學;2010年
相關碩士學位論文 前10條
1 蘇亞萍;基于本體的領域知識建模研究[D];吉林大學;2007年
2 張誠;基于領域知識的限定域中文問答系統(tǒng)研究[D];上海交通大學;2010年
3 周循;基于領域知識的面向分類的屬性泛化研究[D];合肥工業(yè)大學;2008年
4 馬超;基于隱馬爾科夫模型的足球視頻典型事件檢測[D];吉林大學;2005年
5 賈萌;基于領域知識的中文短信理解模型研究[D];大連理工大學;2006年
6 胡謝斐;基于多重關系領域知識的分類問題研究[D];合肥工業(yè)大學;2006年
7 朱志偉;基于有限狀態(tài)機的體育視頻比賽類型識別[D];吉林大學;2006年
8 莫富強;基于領域知識的貝葉斯網(wǎng)絡學習研究[D];合肥工業(yè)大學;2008年
9 劉愛喜;基于領域知識的數(shù)據(jù)庫模式匹配技術研究[D];哈爾濱工程大學;2009年
10 陳戰(zhàn)偉;領域知識在輔助知識發(fā)現(xiàn)過程中的初始聚焦問題研究[D];北方工業(yè)大學;2008年
,本文編號:2230427
本文鏈接:http://www.sikaile.net/jiaoyulunwen/jykj/2230427.html