天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于敘詞表和文獻(xiàn)數(shù)據(jù)庫的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究

發(fā)布時間:2021-07-24 19:50
  我國是一個農(nóng)業(yè)大國,農(nóng)業(yè)的發(fā)展對于國民經(jīng)濟的增長具有舉足輕重的作用,而農(nóng)業(yè)領(lǐng)域的科學(xué)研究則與農(nóng)業(yè)發(fā)展有著直接而密切的聯(lián)系。目前,農(nóng)業(yè)領(lǐng)域的科研人員所面臨的一個困擾就是自己被信息的海洋所湮沒,無法方便地獲得自己需要的信息,根本原因在于傳統(tǒng)的知識組織方式固有的弊端。而本體的構(gòu)建可以在很大程度上解決這個問題。本文在研究了國內(nèi)外大量相關(guān)文獻(xiàn)的基礎(chǔ)上,提出了以《農(nóng)業(yè)科學(xué)敘詞表》和農(nóng)業(yè)領(lǐng)域文獻(xiàn)為基礎(chǔ)進(jìn)行農(nóng)業(yè)領(lǐng)域本體半自動構(gòu)建的思路。該思想的提出基于以下兩點:(1)《農(nóng)表》是現(xiàn)已有的知識體系,是農(nóng)業(yè)領(lǐng)域?qū)<壹w智慧的結(jié)晶,它提供了最豐富、最權(quán)威的術(shù)語集合,從中進(jìn)行領(lǐng)域概念和術(shù)語的提取,可以保證本體知識體系的完整性和規(guī)范性。(2)農(nóng)業(yè)領(lǐng)域文獻(xiàn)作為本體概念的另一個來源,則是《農(nóng)表》最為有力的補充,它存儲量大,動態(tài)性好,可以為本體的構(gòu)建提供更為廣泛的術(shù)語范圍和更復(fù)雜的概念關(guān)系。文章對于農(nóng)業(yè)文獻(xiàn)的篇章結(jié)構(gòu)進(jìn)行了研究,并據(jù)此提出了農(nóng)業(yè)領(lǐng)域本體的整體框架,確定了主要的類、屬性及類間關(guān)系,橫向上保證了本體框架的科學(xué)性和合理性;對于《農(nóng)表》編制結(jié)構(gòu)、收錄的術(shù)語范圍、術(shù)語間關(guān)系進(jìn)行了深入剖析,挑取出了本體的主要研究類... 

【文章來源】:中國農(nóng)業(yè)科學(xué)院北京市

【文章頁數(shù)】:67 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于敘詞表和文獻(xiàn)數(shù)據(jù)庫的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究


語義網(wǎng)層次結(jié)構(gòu)

文檔,格式,中文分詞


圖 3-4 PDF 文檔向 WORD 格式的轉(zhuǎn)換Figure 3-4 The Conversion of PDF to WORD3.3.2 中文分詞(1)分詞方法英文中的詞與詞之間都有空格這一分隔符,因此,英文基本不用分詞就可以直接進(jìn)入到檢索技術(shù)、短語切分、語義分析等高一層的技術(shù)領(lǐng)域。中文與英文不同,對于中文來說,詞是承載語義的最小單位。單個漢字一般很難單獨表達(dá)一定的含義,需要幾個字連在一起去表達(dá)一個完整的意思,又因為中文的詞之間沒有自然分隔符,這就需要采用一定的技術(shù)手段把中文的詞進(jìn)行切分,使其成為有意義的詞,把字與字連在一起的漢語句子分成若干個相互獨立、完整、正確的單詞的過程就是中文分詞。中文分詞屬于自然語言處理技術(shù)的范疇,處理過程需要依賴分詞算法才能進(jìn)行。現(xiàn)有的分詞方法分為以下三種:1)基于字符串匹配的分詞法該方法又叫機械分詞法,一般以分詞詞典為依據(jù),按照一定的策略將文檔中的待切分漢字串與詞典中的詞條進(jìn)行逐一匹配,若在詞典中找到一個最長的結(jié)果,則匹配成功。常用的幾種機械分詞方法如下:正向最大匹配法(Forward Maximum Matching,F(xiàn)MM)、逆向最大匹配法(Reverse

獼猴桃科,獼猴桃屬植物,獼猴桃屬


該方法的缺陷在于,會抽取出一些共現(xiàn)頻度很高、但又不是詞的字組,此外詞的識別精度差,時空開銷比較大。實際應(yīng)用中,統(tǒng)計分詞系統(tǒng)一般將串匹配和串頻統(tǒng)計結(jié)合到一起進(jìn)行分詞。用一部常用行串匹配分詞,同時利用串頻統(tǒng)計方法識別新詞,這樣既結(jié)合了匹配分詞切詞速度快的特用了無詞典分詞方法能夠識別生詞、自動消除歧義的優(yōu)勢。)分詞工具 ICTCLAS2011基于多層隱馬模型的漢語語法分析系統(tǒng) ICTCLAS(Institute of Computing Technology,Chical Analysis System)是由中國科學(xué)院計算技術(shù)研究所在多年研究基礎(chǔ)上研制成功的。它一個開放源碼的中文分詞系統(tǒng),其主要功能包括中文分詞、詞性標(biāo)注、命名實體識別、識別,同時支持用戶詞典、繁體中文,支持 UNICODE、GBK、UTF-8、UTF-7 等多種。ICTCLAS 還提供完整的動態(tài)連接庫組件和相應(yīng)的概率詞典,開發(fā)者可以完全忽略漢析,直接在自己的系統(tǒng)中調(diào)用 ICTCLAS。2011 年 4 月,ICTCLAS 的發(fā)明者張華平博士ICTCLAS2011 最新 u0404 版本,該版本的主要更新有:全面支持 UTF-8,BIG5 與 GBK式;修正了部分內(nèi)核 Bug;提供了 Win7 下的支持庫,提供 Linux64 位與 32 位的支持庫

【參考文獻(xiàn)】:
期刊論文
[1]基于領(lǐng)域本體的政務(wù)信息檢索系統(tǒng)[J]. 于靜,吳國全,盧燚.  計算機應(yīng)用. 2010(06)
[2]電子信息產(chǎn)品領(lǐng)域的本體構(gòu)建與應(yīng)用[J]. 蔣國瑞,袁通.  計算機應(yīng)用研究. 2010(05)
[3]文本從屬語義關(guān)系提取及本體構(gòu)建研究[J]. 殷鳳霞.  安康學(xué)院學(xué)報. 2010(02)
[4]醫(yī)學(xué)文獻(xiàn)領(lǐng)域本體的構(gòu)建及其關(guān)鍵技術(shù)分析[J]. 李萍萍,李書賓.  預(yù)防醫(yī)學(xué)情報雜志. 2010(03)
[5]基于政務(wù)主題詞表的政府信息本體構(gòu)建及應(yīng)用[J]. 盧燚,張波.  計算機工程與設(shè)計. 2010(03)
[6]從文本自動構(gòu)建OWL本體的研究[J]. 蔡榮彥.  信息與電腦(理論版). 2010(02)
[7]中文本體構(gòu)建及可視化研究[J]. 王曉盈,王曉璇,劉鵬.  計算機技術(shù)與發(fā)展. 2010(02)
[8]中文核心領(lǐng)域本體構(gòu)建的一種改進(jìn)方法[J]. 諶貽榮,陸勤,李文捷,崔高穎.  中文信息學(xué)報. 2010(01)
[9]構(gòu)建本體時獲取概念方法研究[J]. 李光達(dá),常春.  情報科學(xué). 2009(05)
[10]新時期數(shù)字圖書館的本體自動構(gòu)建[J]. 顧波.  黑龍江史志. 2009(07)

博士論文
[1]領(lǐng)域本體的構(gòu)建方法與應(yīng)用研究[D]. 李景.中國農(nóng)業(yè)科學(xué)院 2009
[2]基于敘詞表的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體建模方法研究[D]. 谷建軍.中國中醫(yī)科學(xué)院 2006
[3]Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D]. 常春.中國農(nóng)業(yè)科學(xué)院 2004

碩士論文
[1]基于統(tǒng)計的多文檔關(guān)鍵短語和文摘抽取研究[D]. 張永剛.蘇州大學(xué) 2010
[2]中文自動分詞系統(tǒng)的研究與實現(xiàn)[D]. 周程遠(yuǎn).華東師范大學(xué) 2010
[3]科技論文關(guān)鍵詞抽取技術(shù)的研究[D]. 嚴(yán)春風(fēng).蘇州大學(xué) 2009
[4]基于領(lǐng)域本體的用戶查詢詞擴展方法的研究[D]. 張冰.西華大學(xué) 2009
[5]基于用戶詞典的搜索個性化研究[D]. 羅穎.重慶大學(xué) 2009
[6]基于機器學(xué)習(xí)的中文文本分類方法研究[D]. 劉依璐.西安電子科技大學(xué) 2009
[7]基于領(lǐng)域本體的語義信息檢索及相關(guān)技術(shù)研究[D]. 劉愛軍.西北大學(xué) 2008
[8]本體知識庫的構(gòu)建與進(jìn)化方法研究[D]. 王璀民.中國海洋大學(xué) 2008
[9]農(nóng)業(yè)科學(xué)敘詞表向農(nóng)業(yè)本體轉(zhuǎn)化系統(tǒng)的研究與實現(xiàn)[D]. 鮮國建.中國農(nóng)業(yè)科學(xué)院 2008
[10]基于中文文本的本體構(gòu)建方法研究[D]. 劉威.哈爾濱工程大學(xué) 2008



本文編號:3301315

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/3301315.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d8115***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com