天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于局部和全局上下文的蛋白質(zhì)交互關(guān)系識別

發(fā)布時間:2020-08-27 19:53
【摘要】:蛋白質(zhì)交互(Protein-Protein Interaction,PPI)作為生物醫(yī)學(xué)領(lǐng)域一項重要的研究課題,在發(fā)現(xiàn)疾病,探究生命規(guī)律方面有重要的應(yīng)用價值。隨著互聯(lián)網(wǎng)的快速發(fā)展,生物醫(yī)學(xué)文獻(xiàn)呈指數(shù)級增長。依靠人工閱讀的方式,從海量非結(jié)構(gòu)化的文本中獲取PPI的有效信息很難滿足實際需求。因此,如何設(shè)計算法從大量文本資源中準(zhǔn)確提取信息,實現(xiàn)自動化PPI信息抽取的這個問題亟待解決。目前蛋白質(zhì)交互關(guān)系識別主要采用基于單句和基于大規(guī)模文本兩種方式;趩尉涞牡鞍踪|(zhì)交互關(guān)系抽取,只依賴單個句子,很難掌握目標(biāo)蛋白質(zhì)對的全面描述信息。基于大規(guī)模文本的交互關(guān)系抽取,雖然獲取了目標(biāo)蛋白質(zhì)對更全面的信息進(jìn)行PPI判斷,但是對于有交互的蛋白質(zhì)對下會有一些句子沒有表達(dá)蛋白質(zhì)之間的交互關(guān)系,將所有句子同等看待,會抽取出一些無效的特征,從而影響識別的精度。針對兩者各自存在的缺陷,本文首先建立了基于雙層邏輯回歸分類器框架的基本模型,利用多實例多標(biāo)記學(xué)習(xí)關(guān)系抽取框架來對目標(biāo)蛋白質(zhì)對進(jìn)行表示,充分結(jié)合了蛋白質(zhì)對的局部信息和全局上下文信息。利用訓(xùn)練后的分類器在測試數(shù)據(jù)集上進(jìn)行預(yù)測,結(jié)果表明,本文的模型取得了較好的識別性能。接下來本文主要從單句級和蛋白質(zhì)對級兩個層面對基本模型進(jìn)行改進(jìn),設(shè)計了基于多層次線索的PPI識別改進(jìn)模型。對于包含核心詞的蛋白質(zhì)對,利用句子重要性、句子相似性以及關(guān)鍵詞集等概念對包含核心詞集的蛋白質(zhì)對從蛋白質(zhì)對級上抽取額外的特征進(jìn)行特征改進(jìn)。和基本模型相比,有交互蛋白質(zhì)對的F1度量最高提高了2.8%,無交互蛋白質(zhì)對的F1度量最高提高了1.9%。對于無核心詞的蛋白質(zhì)對,觀察到有交互的蛋白質(zhì)之間單詞數(shù)量明顯少于無交互的蛋白質(zhì),因此采用圖模型來對每一個蛋白質(zhì)對進(jìn)行建模,利用不同句子中單詞之間以及單詞和關(guān)鍵詞之間的相似性來構(gòu)建邊。對于最終得到的圖模型,利用圖的相關(guān)屬性抽取有效線索來對句子級分類器特征進(jìn)行更豐富的展示。相較于基本模型,有交互蛋白質(zhì)對F1度量提高了2.9%,無交互蛋白質(zhì)對提高了2.5%。整體來說,該改進(jìn)模型的抽取性能有明顯提升,并且抽取結(jié)果更加穩(wěn)定。
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:Q51;TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐愛國;;法律與文明的交互關(guān)系論[J];民主與科學(xué);2019年02期

2 趙文聘;;我國社會事業(yè)同心圓中互補(bǔ)型交互關(guān)系營造[J];上海師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2019年06期

3 鞏淼森;楊梓;鄭彬彬;張靂;;社區(qū)營造中的共創(chuàng)機(jī)制與交互關(guān)系[J];中國藝術(shù);2019年04期

4 韓莉;;思想政治教育主體間交互關(guān)系的內(nèi)涵界定及意義[J];黑龍江教育學(xué)院學(xué)報;2015年11期

5 李宜川;常景芝;沈永杰;劉國玲;胡靈衛(wèi);蘆琨;;網(wǎng)絡(luò)教育環(huán)境中師生交互關(guān)系的探討[J];西北醫(yī)學(xué)教育;2010年04期

6 劉茜萍;竇萬春;蔡士杰;唐加山;;針對交互關(guān)系模型優(yōu)化的協(xié)作式問題分配[J];電子學(xué)報;2007年02期

7 李麗雙;郭瑞;黃德根;周惠巍;;基于遷移學(xué)習(xí)的蛋白質(zhì)交互關(guān)系抽取[J];中文信息學(xué)報;2016年02期

8 排日代姆·艾合麥提;;漢語交互關(guān)系的判定標(biāo)準(zhǔn)及典型性探討[J];青春歲月;2019年07期

9 余冰;;國家與社會交互關(guān)系:社區(qū)及其組織研究的一種路徑[J];學(xué)術(shù)研究;2007年05期

10 江大紅;;漫話幸福生活[J];決策與信息;2012年07期

相關(guān)會議論文 前1條

1 高湘澤;;人與人之間的交互關(guān)系何以可能和可知?——讓-保羅·薩特的有關(guān)思想略論[A];人學(xué)與現(xiàn)代化——全國第六屆人學(xué)研討會論文集[C];2004年

相關(guān)重要報紙文章 前3條

1 北京大學(xué)法學(xué)院教授 徐愛國;司法與媒體的交互關(guān)系[N];人民法院報;2013年

2 ;《創(chuàng)造網(wǎng)絡(luò)經(jīng)濟(jì)價值》[N];中國計算機(jī)報;2001年

3 鄒華;北京審美文化的歷史融合[N];光明日報;2014年

相關(guān)博士學(xué)位論文 前4條

1 周瑜勝;公司控制權(quán)、流動性與并購績效研究[D];華南理工大學(xué);2015年

2 王洪羿;基于空間與行為交互關(guān)系的機(jī)構(gòu)型養(yǎng)老建筑設(shè)計策略研究[D];大連理工大學(xué);2017年

3 張旺勛;基于復(fù)雜交互網(wǎng)絡(luò)的武器裝備體系安全性分析方法[D];國防科學(xué)技術(shù)大學(xué);2015年

4 李凱;交通犯罪的刑法規(guī)制[D];西南財經(jīng)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 蔡松成;基于局部和全局上下文的蛋白質(zhì)交互關(guān)系識別[D];南京航空航天大學(xué);2019年

2 龐新哲;微生物交互關(guān)系挖掘中的路徑提取算法研究[D];華中師范大學(xué);2019年

3 閔慶凱;基于遠(yuǎn)監(jiān)督的蛋白質(zhì)交互關(guān)系抽取[D];南京航空航天大學(xué);2018年

4 鄒昊;基于支持向量機(jī)的基因-基因交互關(guān)系識別方法研究[D];西北農(nóng)林科技大學(xué);2017年

5 張盼盼;基于篇章的蛋白質(zhì)交互關(guān)系抽取[D];大連理工大學(xué);2014年

6 平金玉;基于組合核與主動學(xué)習(xí)的蛋白質(zhì)交互關(guān)系抽取[D];大連理工大學(xué);2010年

7 郭瑞;基于遷移學(xué)習(xí)和詞表示的蛋白質(zhì)交互關(guān)系抽取[D];大連理工大學(xué);2015年

8 封二英;基于大規(guī)模文本的蛋白質(zhì)交互關(guān)系自動提取研究[D];南京航空航天大學(xué);2012年

9 李婷;產(chǎn)品與服務(wù)之間的交互關(guān)系對制造企業(yè)競爭優(yōu)勢的影響研究[D];中原工學(xué)院;2015年

10 劉洋;基于組合核函數(shù)的蛋白質(zhì)交互關(guān)系抽取[D];大連理工大學(xué);2013年



本文編號:2806544

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/projectlw/swxlw/2806544.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2a45a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com