基于內(nèi)容深度揭示的科技文獻多維聚合研究
發(fā)布時間:2021-10-27 07:28
隨著科技文獻數(shù)量的爆炸式增長,如何在浩瀚的檢索資源中精確定位自己所需要的知識變得尤為重要。傳統(tǒng)的以文獻為單位的知識組織方式,主要是從篇名、主題、作者、關鍵字、參考文獻等外部特征進行研究,或者對單篇文獻中的知識對象和語義關系進行文本揭示,缺乏對相同主題文獻間內(nèi)容的深度挖掘與組織,導致科技文獻內(nèi)容知識大多仍以“游離態(tài)”存在,知識間缺乏協(xié)作,難以生成跨文獻的知識簇和知識鏈。本文針對所存在的問題,在借鑒現(xiàn)有有益研究成果的基礎上,提出了基于內(nèi)容地圖的科技文獻內(nèi)容深度揭示方法,該方法以科技文獻為主要研究對象,通過文本挖掘技術對科技文獻集中的文本片段內(nèi)容進行核心知識對象及其之間的語義關系進行提取,構建多篇科技文獻內(nèi)容地圖,并基于內(nèi)容地圖來實現(xiàn)文獻內(nèi)容知識的細粒度描述、多維度聚合。整個研究包括三個關鍵問題:(1)如何從科技文獻中提取符合研究所需的核心知識對象及其之間的關系:(2)如何將提取得到的核心知識對象和關系利用圖結構進行表示;(3)如何借助內(nèi)容地圖實現(xiàn)科技文獻內(nèi)容知識的深度揭示和多維聚合。論文針對這三個關鍵問題,做了以下三方面的研究:(1)在將原始文本數(shù)據(jù)集進行豐富化處理后,設計了基于領域詞典的...
【文章來源】:東北電力大學吉林省
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【部分圖文】:
圖2-1知識對象縮略語識別主要步驟??(1)對科技文獻中的文本進行分段、分句等預處理,并保存在一起,構建成知識對??象縮略語識別預處理集
的可行性,并隨機選取地圖中的解讀內(nèi)容與原文獻內(nèi)容進行??回溯對比分析,驗證該方法的有效性與正確性。??3.1科技文獻內(nèi)容地圖構建的基本思路??人類語義雖然極其復雜和多變,但基本上可以用主語,賓語和謂語三種語法的組合來??表達和表示,科技文獻的本質(zhì)其實是一個通過語義關系將單詞或者短語聯(lián)系起來的語義集??合,以此來表達作者的核心思想和觀念。因為內(nèi)容地圖能夠通過語義和語義關系更好地表??達科技文獻內(nèi)容的語義特征和語義結構,將多篇科技文獻通過語義層面的邏輯聯(lián)系起來,??內(nèi)容地圖的構建思想如圖3-1所示。?????I??關系頮?A一^—?ZTT?'??=?〇?|???/?\??^?^?e?°?°??、、、?身O???一?\???0?〇??一?/〇??\?/??=?e—^?1??、、.?乂??_?口?1丨°/。〇??〇、一??\?〇r-〇?一?〇?注釋.不?娜同的??、、、一奪=〇?務十>?十〉??a.文獻集?b?語義元素?c語義搜梓?d.語義集合?e.內(nèi)容地圖??\?????J??圖3-1內(nèi)容地圖構建思想示意圖??-17-??
?3?—一-一??、-??_????一???語義集U)?語義集(A)?內(nèi)容地圖??‘?V?V?■/?1-.????篤程《_??過程?7???、、▲??卜《〇0?°|?^?f73n?V?v????0?0上—??丨―計算童枕?^??〇—^???-fi?;?'、、??|T)?.T?'???〇?I?、?,?一??一-一????語義集(B)?語義集(B)?內(nèi)容地圖??I?洽乂果?v?J?\?/?——————^??圖3-3內(nèi)容地圖構建示意圖??過程6:依據(jù)語義集(SSA)中知識對象的重要度到語義集(SS)中依次提取語義集??(SSB)、語義集(SSC)、語義集(SSD)?...,從此處往下以提取語義集(SSB)為例;??過程7:重復過程4的工作,即對語義集(SSB)中,除知識對象B以外的知識對象??進行重要度計算,并依據(jù)計算結果將語義集(SSB)中的知識對象進行重要度排序;??過程8:重復過程5的工作,即按照語義集(SSB)中知識對象的重要度依次將其??排入科技文獻內(nèi)容地圖中,它們是科技文獻內(nèi)容地圖生成的第三批點;??像處理語義集(SSB)?—樣,直到依據(jù)內(nèi)容地圖生成的第二批點的重要度提取出來的??語義集(SSC)、語義集(SSD)、語義集(SSE)?...中的知識對象全部排入內(nèi)容地圖中為??止,此時,科技文獻內(nèi)容地圖將生成所有的第三批點。然后在再依據(jù)第三批點的重要度去??原始語義集(SS)中提取語義子集,直到語義集(SS)為空,此時科技文獻內(nèi)容地圖構??建完成。??3.4實驗及結果分析??3.4.1實驗目的??本實驗的主要目的是驗證本文提出的基于
本文編號:3461144
【文章來源】:東北電力大學吉林省
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【部分圖文】:
圖2-1知識對象縮略語識別主要步驟??(1)對科技文獻中的文本進行分段、分句等預處理,并保存在一起,構建成知識對??象縮略語識別預處理集
的可行性,并隨機選取地圖中的解讀內(nèi)容與原文獻內(nèi)容進行??回溯對比分析,驗證該方法的有效性與正確性。??3.1科技文獻內(nèi)容地圖構建的基本思路??人類語義雖然極其復雜和多變,但基本上可以用主語,賓語和謂語三種語法的組合來??表達和表示,科技文獻的本質(zhì)其實是一個通過語義關系將單詞或者短語聯(lián)系起來的語義集??合,以此來表達作者的核心思想和觀念。因為內(nèi)容地圖能夠通過語義和語義關系更好地表??達科技文獻內(nèi)容的語義特征和語義結構,將多篇科技文獻通過語義層面的邏輯聯(lián)系起來,??內(nèi)容地圖的構建思想如圖3-1所示。?????I??關系頮?A一^—?ZTT?'??=?〇?|???/?\??^?^?e?°?°??、、、?身O???一?\???0?〇??一?/〇??\?/??=?e—^?1??、、.?乂??_?口?1丨°/。〇??〇、一??\?〇r-〇?一?〇?注釋.不?娜同的??、、、一奪=〇?務十>?十〉??a.文獻集?b?語義元素?c語義搜梓?d.語義集合?e.內(nèi)容地圖??\?????J??圖3-1內(nèi)容地圖構建思想示意圖??-17-??
?3?—一-一??、-??_????一???語義集U)?語義集(A)?內(nèi)容地圖??‘?V?V?■/?1-.????篤程《_??過程?7???、、▲??卜《〇0?°|?^?f73n?V?v????0?0上—??丨―計算童枕?^??〇—^???-fi?;?'、、??|T)?.T?'???〇?I?、?,?一??一-一????語義集(B)?語義集(B)?內(nèi)容地圖??I?洽乂果?v?J?\?/?——————^??圖3-3內(nèi)容地圖構建示意圖??過程6:依據(jù)語義集(SSA)中知識對象的重要度到語義集(SS)中依次提取語義集??(SSB)、語義集(SSC)、語義集(SSD)?...,從此處往下以提取語義集(SSB)為例;??過程7:重復過程4的工作,即對語義集(SSB)中,除知識對象B以外的知識對象??進行重要度計算,并依據(jù)計算結果將語義集(SSB)中的知識對象進行重要度排序;??過程8:重復過程5的工作,即按照語義集(SSB)中知識對象的重要度依次將其??排入科技文獻內(nèi)容地圖中,它們是科技文獻內(nèi)容地圖生成的第三批點;??像處理語義集(SSB)?—樣,直到依據(jù)內(nèi)容地圖生成的第二批點的重要度提取出來的??語義集(SSC)、語義集(SSD)、語義集(SSE)?...中的知識對象全部排入內(nèi)容地圖中為??止,此時,科技文獻內(nèi)容地圖將生成所有的第三批點。然后在再依據(jù)第三批點的重要度去??原始語義集(SS)中提取語義子集,直到語義集(SS)為空,此時科技文獻內(nèi)容地圖構??建完成。??3.4實驗及結果分析??3.4.1實驗目的??本實驗的主要目的是驗證本文提出的基于
本文編號:3461144
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3461144.html
最近更新
教材專著