天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向生物網(wǎng)絡(luò)的并行關(guān)聯(lián)搜索算法研究

發(fā)布時間:2020-06-09 12:43
【摘要】:隨著生物醫(yī)療大數(shù)據(jù)的不斷增長,用戶對生物醫(yī)療大數(shù)據(jù)的搜索需求也隨之增長,但是具體生物蘊含的特定語義使得傳統(tǒng)的搜索引擎失效,無法為醫(yī)療大數(shù)據(jù)提供搜索支持。國家863項目“生物大數(shù)據(jù)表述索引、搜索與存儲訪問關(guān)鍵技術(shù)研發(fā)”就是為解決這個問題。該項目的核心是構(gòu)建在由生物語義關(guān)系構(gòu)建的生物網(wǎng)絡(luò)中進行多關(guān)鍵字關(guān)聯(lián)搜索的算法。生物網(wǎng)絡(luò)中的關(guān)聯(lián)搜索算法大多是以網(wǎng)絡(luò)的最小斯坦納樹問題(SPN問題)作為算法基礎(chǔ)進行設(shè)計,但是SPN問題本身時間復(fù)雜度很高,在大規(guī)模生物網(wǎng)絡(luò)中不再適用。為此,本課題借用Spark計算框架,設(shè)計了針對生物網(wǎng)絡(luò)的基于中心點的并行關(guān)聯(lián)搜索算法(PAS-CN算法),并進行了實驗驗證。多關(guān)鍵字的關(guān)聯(lián)搜索試圖在生物網(wǎng)絡(luò)中搜索到多關(guān)鍵字彼此之間的關(guān)聯(lián)關(guān)系,從而找到可用于輔助醫(yī)療診斷的相關(guān)知識。生物網(wǎng)絡(luò)是基于生物實體的關(guān)系而構(gòu)建的,因此構(gòu)建基于生物網(wǎng)絡(luò)的最小斯坦納樹,就可以探索出這組關(guān)鍵字之間的關(guān)聯(lián)關(guān)系。SPN問題是NP-hard問題,所以只能用近似算法求解。本課題利用生物網(wǎng)絡(luò)的無標度特性對生物網(wǎng)絡(luò)進行層次聚類,從而實現(xiàn)網(wǎng)絡(luò)劃分。并以此為基礎(chǔ)設(shè)計了并行關(guān)聯(lián)搜索算法,大大降低了時間復(fù)雜度,并且通過引入網(wǎng)絡(luò)中心點成功控制了斯坦納樹的規(guī)模。本課題中對生物網(wǎng)絡(luò)做了大量的預(yù)處理作為算法的基礎(chǔ)條件,其中包含了層次聚類、網(wǎng)絡(luò)劃分、子網(wǎng)絡(luò)中心點選取、最低公共祖先矩陣構(gòu)建。本課題設(shè)計的基于中心點的并行關(guān)聯(lián)搜索算法(PAS-CN算法)主要包含了3個部分:子網(wǎng)絡(luò)劃分、并行斯坦納搜索和局部斯坦納樹合并。其中子網(wǎng)絡(luò)劃分和局部斯坦納樹合并部分都是Spark平臺串行計算完成,并行斯坦納搜索部分在Spark集群中并行計算求解。實驗表明PAS-CN算法在運算時間和斯坦納樹規(guī)模的控制上都取得了很大的提升。
【圖文】:

示意圖,示意圖,離群點,工程碩士學位


哈爾濱工業(yè)大學工程碩士學位論文的,幾乎沒有什么差別。最小距離和最大距離將兩個樣個簇之間的距離,由于是由兩個樣本點決定的,,所以穩(wěn)些離群點和錯誤數(shù)據(jù)的影響,從而導(dǎo)致聚類的效果不好慮著兩種做法。離考慮了所有的樣本點之間的距離,全面反映了兩個簇具有很高的穩(wěn)定性和極強的代表性。有時候為了避免離點的影響,可以對一些過大過小的距離進行刪除,求取為兩個簇之間的距離。平均距離還有一個很好的變種,為兩個簇之間的距離,這個方式可以有效避免離群點和

樹狀圖,層次聚類,樹狀圖,示例


從而得到一組不同方案的網(wǎng)絡(luò)劃分結(jié)果。此處以如圖 2-2 為例,介紹對樹狀圖進行分割的算法。如圖2-2 所示,它是一個有 30 個節(jié)點的層次聚類的結(jié)果樹狀圖,其中每層鏈接成一組聚類簇。此處我們設(shè)立簇距 , 表示樹狀圖相鄰兩次分割之后對應(yīng)的層次的簇個數(shù)的差。用簇距控制分割,可以相對在各種不同級別完成對網(wǎng)絡(luò)的子網(wǎng)絡(luò)劃分。層次聚類樹狀圖分割算法描述如下:(1)從根節(jié)點開始,初始化層次 ,記錄當前簇個數(shù) m=1。(2)查看當前層次的簇的數(shù)目 k,如果 k≥m+ ,則進行分割
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:O157.5;TP391.3

【相似文獻】

相關(guān)期刊論文 前10條

1 郭昌;傅明駿;;生物網(wǎng)絡(luò)在生物功能分析中的應(yīng)用[J];高師理科學刊;2018年03期

2 TRAFFIC;PEXELS;;野生物網(wǎng)絡(luò)非法交易新趨勢和問題[J];人與自然;2017年08期

3 梅娟;王正祥;石貴陽;李煒疆;;復(fù)雜生物網(wǎng)絡(luò)分析的圖聚類方法研究進展[J];食品與生物技術(shù)學報;2008年05期

4 肖巧玲;;初次嘗試生物網(wǎng)絡(luò)教學[J];中小學信息技術(shù)教育;2003年03期

5 趙琳琳;趙亞莉;張牧歌;李文龍;;一款輕量級的復(fù)雜生物網(wǎng)絡(luò)圖形化分析軟件的設(shè)計與實現(xiàn)[J];智能計算機與應(yīng)用;2018年02期

6 周鳳妹;;設(shè)計合理高效的生物網(wǎng)絡(luò)課[J];中國信息技術(shù)教育;2011年18期

7 丁永生,任立紅;一種基于免疫突現(xiàn)計算的生物網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計[J];控制與決策;2003年02期

8 張文波;吳晶;;生物網(wǎng)絡(luò)型社會組織[J];辦公自動化;2015年11期

9 張航;昝鄉(xiāng)鎮(zhèn);劉志偉;;生物網(wǎng)絡(luò)模體識別算法概述[J];科協(xié)論壇(下半月);2010年02期

10 丁永生;;計算智能的新框架:生物網(wǎng)絡(luò)結(jié)構(gòu)[J];智能系統(tǒng)學報;2007年02期

相關(guān)會議論文 前10條

1 古華光;;生物網(wǎng)絡(luò)的時空動力學行為的實驗和數(shù)學模型研究[A];The 5th 全國動力學與控制青年學者研討會論文摘要集[C];2011年

2 徐佳;雷明莉;王博;李婧;;生物網(wǎng)絡(luò)與疾病關(guān)鍵肽段/蛋白質(zhì)的鑒定[A];“農(nóng)業(yè)健康與環(huán)境”組學大數(shù)據(jù)整合生物信息學研討會論文集[C];2017年

3 劉曾榮;;動力學與控制在生物系統(tǒng)中應(yīng)用的幾個例子[A];中國力學學會學術(shù)大會'2009論文摘要集[C];2009年

4 張嗣瀛;;網(wǎng)絡(luò)生物學及其一些進展(報告提綱)[A];第四屆全國網(wǎng)絡(luò)科學學術(shù)論壇暨研究生暑期學校論文集[C];2008年

5 徐筱杰;古江勇;陳麗蓉;;藥用天然產(chǎn)物的網(wǎng)絡(luò)藥理學研究[A];中國化學會第28屆學術(shù)年會第14分會場摘要集[C];2012年

6 高蕾;高魯彬;郭進利;;生物網(wǎng)絡(luò)研究進展述評[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學術(shù)會議論文(摘要)匯集[C];2009年

7 楊卓琴;管亭亭;陸啟韶;;多時間尺度的復(fù)雜網(wǎng)絡(luò)的動力學問題研究[A];第四屆全國動力學與控制青年學者研討會論文摘要集[C];2010年

8 李永;方錦清;畢橋;劉強;;和諧統(tǒng)一的混合網(wǎng)絡(luò)中的相稱性系數(shù)轉(zhuǎn)變[A];第三屆全國復(fù)雜動態(tài)網(wǎng)絡(luò)學術(shù)論壇論文集[C];2006年

9 來魯華;;基于系統(tǒng)的藥物設(shè)計[A];中國化學會第30屆學術(shù)年會摘要集-第二十五分會:化學信息學與化學計量學[C];2016年

10 陳慧平;陳慧選;;多重分形譜在非線性網(wǎng)絡(luò)中的應(yīng)用[A];2006全國復(fù)雜網(wǎng)絡(luò)學術(shù)會議論文集[C];2006年

相關(guān)重要報紙文章 前3條

1 記者 周穎;網(wǎng)絡(luò)靶標 可闡釋中藥方劑作用機理[N];中國中醫(yī)藥報;2010年

2 趙曉濤;哲學角度談安全[N];網(wǎng)絡(luò)世界;2008年

3 本報記者 楊豐源;大數(shù)據(jù)治病時代已來臨[N];貴陽日報;2016年

相關(guān)博士學位論文 前10條

1 姜sバ

本文編號:2704707


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2704707.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b853a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com