基于文本挖掘技術(shù)的建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型研究
發(fā)布時間:2022-02-16 17:15
建筑節(jié)能是應(yīng)對氣候變化和能源緊缺最重要的領(lǐng)域之一,與建筑節(jié)能相關(guān)的在線資源和文獻數(shù)量呈指數(shù)性增長,海量文獻數(shù)據(jù)為研究者和從業(yè)者及時準(zhǔn)確地掌握領(lǐng)域研究主題和發(fā)展趨勢帶來挑戰(zhàn),現(xiàn)有文獻分析研究中以文獻綜述和文獻計量法為主,分析內(nèi)容和形式存在明顯局限性。因此,通過文本挖掘技術(shù)對建筑節(jié)能領(lǐng)域文獻進行系統(tǒng)分析,對促進建筑節(jié)能研究發(fā)展具有重要的理論和實踐價值。本文以web of science數(shù)據(jù)庫中5712篇建筑節(jié)能相關(guān)的文獻為數(shù)據(jù)對象開展研究。首先,根據(jù)建筑能耗和氣候變化之間的關(guān)系,將數(shù)據(jù)劃分為5個階段并分別進行數(shù)據(jù)清洗和數(shù)據(jù)結(jié)構(gòu)化,構(gòu)建建筑節(jié)能領(lǐng)域文獻數(shù)據(jù)語料庫。其次,對不同階段建筑節(jié)能文獻進行關(guān)鍵詞分析和LDA主題模型建模,系統(tǒng)分析建筑節(jié)能的主要研究主題。然后,基于LDA主題模型的不足,利用word2vec詞向量模型優(yōu)化LDA主題模型,完善研究主題的語義關(guān)系,并結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題間關(guān)聯(lián),依托Gephi網(wǎng)絡(luò)模型可視化平臺,提出一種新的建筑節(jié)能文獻數(shù)據(jù)主題網(wǎng)絡(luò)模型。最后,通過不同階段主題網(wǎng)絡(luò)模型結(jié)果分析,闡明1973-2018年間建筑節(jié)能領(lǐng)域的研究主題,揭示主題間關(guān)聯(lián)性及主題演化。經(jīng)過建...
【文章來源】:深圳大學(xué)廣東省
【文章頁數(shù)】:112 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標(biāo)與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻分析與文本挖掘技術(shù)研究綜述
2.1 國內(nèi)外研究現(xiàn)狀
2.1.1 建筑節(jié)能文獻分析
2.1.2 文本挖掘技術(shù)發(fā)展研究
2.1.3 LDA主題模型改進研究
2.2 研究問題提煉
2.3 研究內(nèi)容
2.3.1 建筑節(jié)能文獻數(shù)據(jù)采集及分析
2.3.2 構(gòu)建筑節(jié)能主題網(wǎng)絡(luò)模型
2.4 技術(shù)路線
第3章 研究理論基礎(chǔ)及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實現(xiàn)步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實現(xiàn)
3.3 社交網(wǎng)絡(luò)模型
3.3.1 社區(qū)檢測算法
3.3.2 Gephi可視化平臺
第4章 建筑節(jié)能文獻數(shù)據(jù)語料庫搭建
4.1 數(shù)據(jù)采集
4.1.1 數(shù)據(jù)采集范圍
4.1.2 數(shù)據(jù)采集來源
4.2 數(shù)據(jù)預(yù)處理
4.2.1 數(shù)據(jù)清洗
4.2.2 文本數(shù)據(jù)結(jié)構(gòu)化
4.2.3 數(shù)據(jù)再清洗
第5章 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建及分析
5.1 研究問題
5.2 基于特征提取的建筑節(jié)能研究熱點
5.2.1 不同階段建筑節(jié)能研究熱點對比
5.2.2 不同階段建筑節(jié)能研究熱點變化趨勢
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構(gòu)建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢
5.4 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題網(wǎng)絡(luò)模型
5.4.3 不同階段建筑節(jié)能主題網(wǎng)絡(luò)結(jié)果分析
5.4.4 基于主題網(wǎng)絡(luò)模型的建筑節(jié)能領(lǐng)域研究主題變化分析
5.5 模型應(yīng)用
第6章 結(jié)論及建議
6.1 結(jié)論
6.2 本文創(chuàng)新點
6.3 后續(xù)研究建議
參考文獻
附錄
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術(shù). 2017(07)
[2]共詞網(wǎng)絡(luò)LDA模型的中文文本主題分析:以交通法學(xué)文獻(2000-2016)為例[J]. 馬紅,蔡永明. 現(xiàn)代圖書情報技術(shù). 2016(12)
[3]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報技術(shù). 2016(06)
[4]國內(nèi)基于主題模型的科技文獻主題發(fā)現(xiàn)及演化研究進展[J]. 王燕鵬. 圖書情報工作. 2016(03)
[5]基于LDA主題模型的專利內(nèi)容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報科學(xué). 2015(01)
[7]基于Gephi的可視分析方法研究與應(yīng)用[J]. 關(guān)迎暉,向勇,陳康. 電信科學(xué). 2013(S1)
[8]基于概率模型的主題識別方法實證研究[J]. 葉春蕾,冷伏海. 情報科學(xué). 2013(02)
[9]詞形還原方法及實現(xiàn)工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書情報技術(shù). 2012(03)
[10]文本挖掘技術(shù)在科研信息自動建議中的應(yīng)用[J]. 李芳,朱群雄. 計算機工程與應(yīng)用. 2011(10)
碩士論文
[1]時間序列的復(fù)雜網(wǎng)絡(luò)轉(zhuǎn)換策略研究[D]. 蘭鑫.西南大學(xué) 2015
[2]中文文本挖掘基本理論與應(yīng)用[D]. 康東.蘇州大學(xué) 2014
[3]社會網(wǎng)絡(luò)分析在學(xué)科熱點分析中的實證研究[D]. 王慧.江蘇大學(xué) 2010
本文編號:3628345
【文章來源】:深圳大學(xué)廣東省
【文章頁數(shù)】:112 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標(biāo)與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻分析與文本挖掘技術(shù)研究綜述
2.1 國內(nèi)外研究現(xiàn)狀
2.1.1 建筑節(jié)能文獻分析
2.1.2 文本挖掘技術(shù)發(fā)展研究
2.1.3 LDA主題模型改進研究
2.2 研究問題提煉
2.3 研究內(nèi)容
2.3.1 建筑節(jié)能文獻數(shù)據(jù)采集及分析
2.3.2 構(gòu)建筑節(jié)能主題網(wǎng)絡(luò)模型
2.4 技術(shù)路線
第3章 研究理論基礎(chǔ)及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實現(xiàn)步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實現(xiàn)
3.3 社交網(wǎng)絡(luò)模型
3.3.1 社區(qū)檢測算法
3.3.2 Gephi可視化平臺
第4章 建筑節(jié)能文獻數(shù)據(jù)語料庫搭建
4.1 數(shù)據(jù)采集
4.1.1 數(shù)據(jù)采集范圍
4.1.2 數(shù)據(jù)采集來源
4.2 數(shù)據(jù)預(yù)處理
4.2.1 數(shù)據(jù)清洗
4.2.2 文本數(shù)據(jù)結(jié)構(gòu)化
4.2.3 數(shù)據(jù)再清洗
第5章 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建及分析
5.1 研究問題
5.2 基于特征提取的建筑節(jié)能研究熱點
5.2.1 不同階段建筑節(jié)能研究熱點對比
5.2.2 不同階段建筑節(jié)能研究熱點變化趨勢
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構(gòu)建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢
5.4 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題網(wǎng)絡(luò)模型
5.4.3 不同階段建筑節(jié)能主題網(wǎng)絡(luò)結(jié)果分析
5.4.4 基于主題網(wǎng)絡(luò)模型的建筑節(jié)能領(lǐng)域研究主題變化分析
5.5 模型應(yīng)用
第6章 結(jié)論及建議
6.1 結(jié)論
6.2 本文創(chuàng)新點
6.3 后續(xù)研究建議
參考文獻
附錄
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術(shù). 2017(07)
[2]共詞網(wǎng)絡(luò)LDA模型的中文文本主題分析:以交通法學(xué)文獻(2000-2016)為例[J]. 馬紅,蔡永明. 現(xiàn)代圖書情報技術(shù). 2016(12)
[3]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報技術(shù). 2016(06)
[4]國內(nèi)基于主題模型的科技文獻主題發(fā)現(xiàn)及演化研究進展[J]. 王燕鵬. 圖書情報工作. 2016(03)
[5]基于LDA主題模型的專利內(nèi)容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報科學(xué). 2015(01)
[7]基于Gephi的可視分析方法研究與應(yīng)用[J]. 關(guān)迎暉,向勇,陳康. 電信科學(xué). 2013(S1)
[8]基于概率模型的主題識別方法實證研究[J]. 葉春蕾,冷伏海. 情報科學(xué). 2013(02)
[9]詞形還原方法及實現(xiàn)工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書情報技術(shù). 2012(03)
[10]文本挖掘技術(shù)在科研信息自動建議中的應(yīng)用[J]. 李芳,朱群雄. 計算機工程與應(yīng)用. 2011(10)
碩士論文
[1]時間序列的復(fù)雜網(wǎng)絡(luò)轉(zhuǎn)換策略研究[D]. 蘭鑫.西南大學(xué) 2015
[2]中文文本挖掘基本理論與應(yīng)用[D]. 康東.蘇州大學(xué) 2014
[3]社會網(wǎng)絡(luò)分析在學(xué)科熱點分析中的實證研究[D]. 王慧.江蘇大學(xué) 2010
本文編號:3628345
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628345.html
最近更新
教材專著