農(nóng)村信用社信貸項(xiàng)目評(píng)審專家智能管理軟件的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-31 14:57
文本自動(dòng)聚類是指通過(guò)對(duì)大規(guī)模語(yǔ)料信息的分析,抽取出能夠全面概括文本的特征詞,根據(jù)文本間相似度計(jì)算,形成文本簇的一種方法。根據(jù)文本內(nèi)容自動(dòng)確定其所屬類別。文本聚類技術(shù)的出現(xiàn),使文檔可以自動(dòng)地按照內(nèi)容進(jìn)行關(guān)聯(lián)和計(jì)算,符合人類對(duì)文檔信息的管理需求。同時(shí),作為信息過(guò)濾、信息檢索、搜索引擎等領(lǐng)域的技術(shù)基礎(chǔ),文本聚類技術(shù)有著廣泛的應(yīng)用前景。農(nóng)村信用社信貸項(xiàng)目評(píng)審專家智能管理軟件,其原型來(lái)自于農(nóng)村信用社征信系統(tǒng)。由于每年都有大量的審批文件審報(bào),面對(duì)如此龐大的評(píng)審項(xiàng)目,評(píng)審專家的合理分配成為一項(xiàng)艱巨的任務(wù)。本文利用自然語(yǔ)言處理技術(shù)和聚類分析技術(shù),將上報(bào)申請(qǐng)書進(jìn)行分組管理,在評(píng)審項(xiàng)目專家分配的過(guò)程中,以組為單位進(jìn)行評(píng)審?fù)扑]。采用以論文為媒介的自動(dòng)推薦服務(wù),其核心思想是通過(guò)評(píng)審專家發(fā)表的已有文件,對(duì)專家進(jìn)行特征描述,從而使得系統(tǒng)具有了可計(jì)算的知識(shí)模型。本文以關(guān)鍵詞抽取和文本聚類及相似度計(jì)算為核心技術(shù),以采集互聯(lián)網(wǎng)上的大規(guī)模相關(guān)數(shù)據(jù)為基礎(chǔ),建立了專家知識(shí)庫(kù)和論文知識(shí)庫(kù)。在此基礎(chǔ)之上,通過(guò)對(duì)專家的同名消歧和專家關(guān)系網(wǎng)的建立,進(jìn)一步使系統(tǒng)的正確性得到了保證。論文主要工作如下:1)針對(duì)專家推薦服務(wù)的具體需求,設(shè)計(jì)...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
雅虎收購(gòu)案聚類結(jié)果
[7]。如圖 2-2 所示。圖2-2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖輸出層神經(jīng)元構(gòu)成一維或二維的結(jié)構(gòu),這個(gè)結(jié)構(gòu)就確定了神經(jīng)元在空間中的關(guān)系,輸出神經(jīng)元必須要與輸入神經(jīng)元連接。若輸入為 n 維向量,則每個(gè)輸出神經(jīng)元對(duì)應(yīng)一個(gè) n 維權(quán)值向量 w。SOM 可以將數(shù)據(jù)的維度降低,轉(zhuǎn)化成二維神經(jīng)元,而且聚類得出的結(jié)果質(zhì)量較高。但是 SOM 聚類的難點(diǎn)是確定輸出節(jié)點(diǎn)的個(gè)數(shù)。若節(jié)點(diǎn)數(shù)多于類別數(shù),則導(dǎo)致類別劃分過(guò)細(xì),最終導(dǎo)致聚類的結(jié)果質(zhì)量較差。若節(jié)點(diǎn)個(gè)數(shù)少于類別數(shù),則無(wú)法分辨究竟有哪些模式,原本為相似的類別被誤分為一類。
17圖3-4 網(wǎng)頁(yè)內(nèi)容如下圖所示,可以觀察到在網(wǎng)頁(yè)地址中的查詢地址,通過(guò)向爬蟲(chóng)程序當(dāng)中注入地址(/library/Book_select.aspx?dbcatalog=中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù)&skind=&Type=FILE&Param=“)獲得爬蟲(chóng)根據(jù)鏈接 URL,不斷的根據(jù)數(shù)據(jù)進(jìn)行遍歷檢索,直到將該庫(kù)下的所有數(shù)據(jù)遍歷檢索完成。
【參考文獻(xiàn)】:
期刊論文
[1]基于社會(huì)網(wǎng)絡(luò)的跨文本同名消歧[J]. 陳晨,王厚峰. 中文信息學(xué)報(bào). 2011(05)
[2]基于BBS熱點(diǎn)主題發(fā)現(xiàn)的文本聚類方法[J]. 唐果,陳宏剛. 計(jì)算機(jī)工程. 2010(07)
[3]文本自動(dòng)聚類技術(shù)研究[J]. 王偉. 情報(bào)雜志. 2009(02)
[4]雙語(yǔ)知識(shí)庫(kù)中關(guān)聯(lián)實(shí)例的多策略提取機(jī)制[J]. 張桂平,姚天順,尹寶生,蔡?hào)|風(fēng),宋彥. 中文信息學(xué)報(bào). 2007(03)
[5]Web中文文本聚類研究及實(shí)現(xiàn)[J]. 楊學(xué)明. 現(xiàn)代圖書情報(bào)技術(shù). 2006(12)
[6]中文全文檢索系統(tǒng)中實(shí)現(xiàn)主題詞標(biāo)引思路[J]. 吳春玉. 情報(bào)雜志. 2005(01)
[7]基于篇章理解的自動(dòng)文摘研究[J]. 王建波,杜春玲,王開(kāi)鑄. 中文信息學(xué)報(bào). 1995(03)
博士論文
[1]推薦系統(tǒng)中協(xié)同過(guò)濾算法若干問(wèn)題的研究[D]. 張亮.北京郵電大學(xué) 2009
[2]基于神經(jīng)網(wǎng)絡(luò)和模糊邏輯的智能推薦系統(tǒng)研究[D]. 曹渝昆.重慶大學(xué) 2006
[3]聚類/分類理論研究及其在文本挖掘中的應(yīng)用[D]. 卜東波.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2000
碩士論文
[1]數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用與研究[D]. 衛(wèi)華.西安科技大學(xué) 2013
[2]電子商務(wù)推薦系統(tǒng)核心技術(shù)研究[D]. 青海.北京工業(yè)大學(xué) 2009
[3]多文檔關(guān)鍵詞抽取技術(shù)的研究[D]. 楊潔.沈陽(yáng)航空工業(yè)學(xué)院 2009
[4]基于項(xiàng)目特征模型的協(xié)同過(guò)濾推薦算法研究[D]. 莊永龍.南京理工大學(xué) 2008
本文編號(hào):2949817
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
雅虎收購(gòu)案聚類結(jié)果
[7]。如圖 2-2 所示。圖2-2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖輸出層神經(jīng)元構(gòu)成一維或二維的結(jié)構(gòu),這個(gè)結(jié)構(gòu)就確定了神經(jīng)元在空間中的關(guān)系,輸出神經(jīng)元必須要與輸入神經(jīng)元連接。若輸入為 n 維向量,則每個(gè)輸出神經(jīng)元對(duì)應(yīng)一個(gè) n 維權(quán)值向量 w。SOM 可以將數(shù)據(jù)的維度降低,轉(zhuǎn)化成二維神經(jīng)元,而且聚類得出的結(jié)果質(zhì)量較高。但是 SOM 聚類的難點(diǎn)是確定輸出節(jié)點(diǎn)的個(gè)數(shù)。若節(jié)點(diǎn)數(shù)多于類別數(shù),則導(dǎo)致類別劃分過(guò)細(xì),最終導(dǎo)致聚類的結(jié)果質(zhì)量較差。若節(jié)點(diǎn)個(gè)數(shù)少于類別數(shù),則無(wú)法分辨究竟有哪些模式,原本為相似的類別被誤分為一類。
17圖3-4 網(wǎng)頁(yè)內(nèi)容如下圖所示,可以觀察到在網(wǎng)頁(yè)地址中的查詢地址,通過(guò)向爬蟲(chóng)程序當(dāng)中注入地址(/library/Book_select.aspx?dbcatalog=中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù)&skind=&Type=FILE&Param=“)獲得爬蟲(chóng)根據(jù)鏈接 URL,不斷的根據(jù)數(shù)據(jù)進(jìn)行遍歷檢索,直到將該庫(kù)下的所有數(shù)據(jù)遍歷檢索完成。
【參考文獻(xiàn)】:
期刊論文
[1]基于社會(huì)網(wǎng)絡(luò)的跨文本同名消歧[J]. 陳晨,王厚峰. 中文信息學(xué)報(bào). 2011(05)
[2]基于BBS熱點(diǎn)主題發(fā)現(xiàn)的文本聚類方法[J]. 唐果,陳宏剛. 計(jì)算機(jī)工程. 2010(07)
[3]文本自動(dòng)聚類技術(shù)研究[J]. 王偉. 情報(bào)雜志. 2009(02)
[4]雙語(yǔ)知識(shí)庫(kù)中關(guān)聯(lián)實(shí)例的多策略提取機(jī)制[J]. 張桂平,姚天順,尹寶生,蔡?hào)|風(fēng),宋彥. 中文信息學(xué)報(bào). 2007(03)
[5]Web中文文本聚類研究及實(shí)現(xiàn)[J]. 楊學(xué)明. 現(xiàn)代圖書情報(bào)技術(shù). 2006(12)
[6]中文全文檢索系統(tǒng)中實(shí)現(xiàn)主題詞標(biāo)引思路[J]. 吳春玉. 情報(bào)雜志. 2005(01)
[7]基于篇章理解的自動(dòng)文摘研究[J]. 王建波,杜春玲,王開(kāi)鑄. 中文信息學(xué)報(bào). 1995(03)
博士論文
[1]推薦系統(tǒng)中協(xié)同過(guò)濾算法若干問(wèn)題的研究[D]. 張亮.北京郵電大學(xué) 2009
[2]基于神經(jīng)網(wǎng)絡(luò)和模糊邏輯的智能推薦系統(tǒng)研究[D]. 曹渝昆.重慶大學(xué) 2006
[3]聚類/分類理論研究及其在文本挖掘中的應(yīng)用[D]. 卜東波.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2000
碩士論文
[1]數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用與研究[D]. 衛(wèi)華.西安科技大學(xué) 2013
[2]電子商務(wù)推薦系統(tǒng)核心技術(shù)研究[D]. 青海.北京工業(yè)大學(xué) 2009
[3]多文檔關(guān)鍵詞抽取技術(shù)的研究[D]. 楊潔.沈陽(yáng)航空工業(yè)學(xué)院 2009
[4]基于項(xiàng)目特征模型的協(xié)同過(guò)濾推薦算法研究[D]. 莊永龍.南京理工大學(xué) 2008
本文編號(hào):2949817
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2949817.html
最近更新
教材專著