急性白血病相關(guān)基因的文本挖掘分析
本文關(guān)鍵詞:國(guó)際石油價(jià)格波動(dòng)行為機(jī)理及預(yù)測(cè)模型研究,,由筆耕文化傳播整理發(fā)布。
《中國(guó)醫(yī)科大學(xué)》 2006年
急性白血病相關(guān)基因的文本挖掘分析
閆雷
【摘要】:目的 尋找一種通過(guò)文本挖掘獲取醫(yī)學(xué)文獻(xiàn)中的有益信息進(jìn)而用于解釋生物數(shù)據(jù)的方法。本文以急性白血病為例,通過(guò)主題詞和自然語(yǔ)言兩種途徑以疾病與基因的共現(xiàn)關(guān)系為基礎(chǔ)進(jìn)行聚類分析,挖掘基因與疾病之間的關(guān)系,并對(duì)兩種途徑的有效性進(jìn)行評(píng)價(jià)。 材料與方法 以“l(fā)eukemia[majr] AND genes[majr]”為檢索策略通過(guò)PUBMED檢索1966年到2005年9月6日的有關(guān)白血病與基因關(guān)系的相關(guān)文獻(xiàn),共檢得3529篇。將檢索結(jié)果分別保存為XML格式和Medline格式,作為挖掘樣本。對(duì)XML格式的樣本,根據(jù)主題詞的樹(shù)狀結(jié)構(gòu)從中篩選急性白血病類和基因類主題詞進(jìn)行處理,選取出現(xiàn)頻次大于等于3的主要主題詞共75個(gè)進(jìn)行統(tǒng)計(jì),生成詞篇矩陣,對(duì)生成的詞篇矩陣采用二值(Binary)資料測(cè)量中的hamann變換,使用重心法(centroid clustering)進(jìn)行聚類。對(duì)medline格式樣本采用MMTx進(jìn)行處理,從處理結(jié)果中提取語(yǔ)義類型為“neoplastic process”出現(xiàn)頻次大于30的前30個(gè)腫瘤類概念為列,另取語(yǔ)義類型為“gene or genome”出現(xiàn)頻次大于67的前60個(gè)基因類概念為行,計(jì)算生成腫瘤類概念與基因類概念的共句矩陣,對(duì)生成的矩陣采用計(jì)數(shù)資料(counts)測(cè)量中的chisquare法,使用最大距離(furthest neighbor)進(jìn)行聚類。 結(jié)果 從XML格式文件中提取出來(lái)的有關(guān)急性白血病類主題詞/副主題詞與基因類主題詞/副主題詞生成的詞篇矩陣中涉及29種具體基因。medline
【關(guān)鍵詞】:
【學(xué)位授予單位】:中國(guó)醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2006
【分類號(hào)】:R733.71
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 李穎;賈二鵬;馬力;;國(guó)內(nèi)外共詞分析研究綜述[J];新世紀(jì)圖書(shū)館;2012年01期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 李穎;國(guó)內(nèi)競(jìng)爭(zhēng)情報(bào)研究演進(jìn)態(tài)勢(shì)—共詞分析視角[D];湘潭大學(xué);2010年
2 李博;關(guān)于知識(shí)管理研究的知識(shí)結(jié)構(gòu)圖譜[D];山西師范大學(xué);2013年
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 梅馨,邢桂芬;文本挖掘技術(shù)綜述[J];江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年05期
2 崔雷;專題文獻(xiàn)高頻主題詞的共詞聚類分析[J];情報(bào)理論與實(shí)踐;1996年04期
3 崔雷,胡海榮,李紀(jì)賓;文獻(xiàn)計(jì)量學(xué)共引分析系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)[J];情報(bào)學(xué)報(bào);2000年04期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李楠;楊彬彬;;決策樹(shù)ID3分類算法在文本分類中的應(yīng)用研究[J];大連大學(xué)學(xué)報(bào);2009年06期
2 秦長(zhǎng)江;侯漢清;;知識(shí)圖譜——信息管理與知識(shí)管理的新領(lǐng)域[J];大學(xué)圖書(shū)館學(xué)報(bào);2009年01期
3 王洋;劉忠;;貝葉斯算法實(shí)現(xiàn)文本分類器[J];大眾科技;2011年02期
4 蔡坤;姜保慶;;關(guān)于文本挖掘中文本聚類算法的研究[J];福建電腦;2009年04期
5 文庭孝;劉曉英;羅賢春;張蕊;;知識(shí)關(guān)聯(lián)的測(cè)度及應(yīng)用研究[J];高校圖書(shū)館工作;2010年04期
6 許航;吳堅(jiān);;凝血酶及其相關(guān)編碼基因的文本挖掘分析[J];安徽農(nóng)業(yè)科學(xué);2012年31期
7 楊金鳳;馬巧麗;;基于共詞分析的甘肅省種植業(yè)熱點(diǎn)領(lǐng)域分析[J];甘肅農(nóng)業(yè)大學(xué)學(xué)報(bào);2013年04期
8 謝坤武;;文本挖掘中的層次聚類算法[J];湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年04期
9 張勤;馬費(fèi)成;;國(guó)外知識(shí)管理研究范式——以共詞分析為方法[J];管理科學(xué)學(xué)報(bào);2007年06期
10 姜亞莉;關(guān)澤群;;用于Web文檔聚類的基于相似度的軟聚類算法[J];計(jì)算機(jī)工程;2006年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 許振亮;趙宇娜;;國(guó)際創(chuàng)業(yè)研究現(xiàn)狀的知識(shí)可視化分析——基于共詞分析法的視角[A];2012年全國(guó)科學(xué)學(xué)理論與學(xué)科建設(shè)暨科學(xué)技術(shù)學(xué)兩委聯(lián)合年會(huì)論文集[C];2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 楊瑞龍;基于短語(yǔ)特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年
2 趙慶齡;基于文獻(xiàn)計(jì)量的土壤重金屬污染國(guó)際比較研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2010年
3 徐建鎖;知識(shí)管理和文本挖掘的若干問(wèn)題研究[D];天津大學(xué);2004年
4 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學(xué);2006年
5 耿新青;基于模糊邏輯和神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)及文本挖掘的方法研究[D];天津大學(xué);2005年
6 席運(yùn)江;組織知識(shí)的網(wǎng)絡(luò)表示模型及分析方法[D];大連理工大學(xué);2007年
7 康宇航;一種基于共現(xiàn)分析的科技跟蹤方法研究[D];大連理工大學(xué);2008年
8 秦長(zhǎng)江;基于科學(xué)計(jì)量學(xué)共現(xiàn)分析法的中國(guó)農(nóng)史學(xué)科知識(shí)圖譜構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2009年
9 季托;國(guó)際石油價(jià)格波動(dòng)行為機(jī)理及預(yù)測(cè)模型研究[D];東北石油大學(xué);2011年
10 詹國(guó)梁;基于生命周期策略的企業(yè)知識(shí)管理[D];武漢大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李穎;國(guó)內(nèi)競(jìng)爭(zhēng)情報(bào)研究演進(jìn)態(tài)勢(shì)—共詞分析視角[D];湘潭大學(xué);2010年
2 劉曉英;知識(shí)關(guān)聯(lián)及其應(yīng)用研究[D];湘潭大學(xué);2010年
3 許芳芳;基于DBSCAN優(yōu)化算法的Web文本聚類研究[D];華東師范大學(xué);2011年
4 何曉;模糊聚類算法在漢語(yǔ)文本聚類中的研究[D];天津財(cái)經(jīng)大學(xué);2011年
5 馬麗;融入語(yǔ)義相似度的HITS算法研究及實(shí)現(xiàn)[D];南京理工大學(xué);2011年
6 任剛;面向?qū)W科相關(guān)性分析的文本關(guān)聯(lián)規(guī)則挖掘技術(shù)研究[D];中南大學(xué);2011年
7 王玲玉;文獻(xiàn)共引分析中的關(guān)聯(lián)強(qiáng)度和相關(guān)系數(shù)改進(jìn)研究[D];鄭州大學(xué);2011年
8 邵慧琴;1999-2009年我國(guó)15種中文核心期刊體育旅游研究文獻(xiàn)計(jì)量分析[D];江西師范大學(xué);2011年
9 閆士濤;知識(shí)管理學(xué)學(xué)科體系構(gòu)建研究[D];安徽大學(xué);2011年
10 楊麗;基于遺傳算法的文本聚類研究[D];南京航空航天大學(xué);2009年
【同被引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 黃小燕;;情報(bào)領(lǐng)域研究熱點(diǎn)透視——情報(bào)領(lǐng)域論文關(guān)鍵詞詞頻分析(1999—2003)[J];圖書(shū)與情報(bào);2005年06期
2 寶貢敏;徐碧祥;;國(guó)外知識(shí)共享理論研究述評(píng)[J];重慶大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2007年02期
3 劉濤,陳忠,陳曉榮;復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用研究概述[J];系統(tǒng)工程;2005年06期
4 朱東華,袁軍鵬;基于數(shù)據(jù)挖掘的科技監(jiān)測(cè)方法研究[J];管理工程學(xué)報(bào);2004年04期
5 戰(zhàn)培志,廖文和;企業(yè)知識(shí)管理中的知識(shí)共享建模技術(shù)[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期
6 卜心怡;趙靈麗;;知識(shí)共享研究方法與進(jìn)展綜述[J];杭州電子科技大學(xué)學(xué)報(bào);2007年03期
7 楊立英;;基因組學(xué)領(lǐng)域演進(jìn)的科學(xué)計(jì)量研究[J];科學(xué)觀察;2007年01期
8 梁立明,謝彩霞;詞頻分析法用于我國(guó)納米科技研究動(dòng)向分析[J];科學(xué)學(xué)研究;2003年02期
9 朱祖平;芻議知識(shí)管理及其體系框架[J];科研管理;2000年01期
10 梁立明,李小寧;SPRU科研選題的詞頻分析與計(jì)量研究[J];科研管理;2003年03期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉寧;知識(shí)管理與技術(shù)創(chuàng)新的相關(guān)性研究[D];哈爾濱理工大學(xué);2011年
2 肖景;論社會(huì)組織的知識(shí)管理[D];華中師范大學(xué);2006年
3 李珈;企業(yè)知識(shí)共享中個(gè)體主體主觀障礙及對(duì)策研究[D];重慶大學(xué);2006年
4 宋爽;共現(xiàn)分析在文本知識(shí)挖掘中的應(yīng)用研究[D];南京理工大學(xué);2006年
5 郝麗云;非相關(guān)文獻(xiàn)知識(shí)發(fā)現(xiàn)的醫(yī)學(xué)研究與實(shí)踐[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2007年
6 陳穎;基于摘要信息的中文信息檢索可視化系統(tǒng)研究與實(shí)現(xiàn)[D];黑龍江大學(xué);2007年
7 張浩;MEDLINE數(shù)據(jù)庫(kù)中生物體類主題詞相關(guān)語(yǔ)義關(guān)系的構(gòu)建與評(píng)價(jià)[D];中國(guó)醫(yī)科大學(xué);2008年
8 唐一冰;知識(shí)要素對(duì)都市圈競(jìng)爭(zhēng)力提升的作用研究[D];上海交通大學(xué);2009年
9 宋志航;技術(shù)創(chuàng)新能力對(duì)產(chǎn)業(yè)國(guó)際競(jìng)爭(zhēng)力的影響研究[D];中南大學(xué);2008年
10 謝衛(wèi)軍;文化產(chǎn)業(yè)集群內(nèi)組織間知識(shí)共享與產(chǎn)業(yè)集聚研究[D];陜西師范大學(xué);2010年
【二級(jí)引證文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 唐曉波;肖璐;;融合關(guān)鍵詞增補(bǔ)與領(lǐng)域本體的共詞分析方法研究[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2013年11期
2 俞仙子;高英蓮;馬春霞;劉金星;;提取核心特征詞的懲罰性矩陣分解方法——以共詞分析為例[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2014年03期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 郝心寧;生物育種領(lǐng)域知識(shí)結(jié)構(gòu)與知識(shí)演化研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2013年
2 張素芳;網(wǎng)絡(luò)社區(qū)學(xué)術(shù)資源關(guān)聯(lián)研究[D];南開(kāi)大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李坤侖;多維網(wǎng)絡(luò)視角下研究領(lǐng)域可視化分析[D];西南大學(xué);2012年
2 楊愛(ài)青;我國(guó)圖書(shū)情報(bào)學(xué)科研究態(tài)勢(shì)的可視化研究[D];曲阜師范大學(xué);2012年
3 劉濤;關(guān)于我國(guó)圖書(shū)館學(xué)研究熱點(diǎn)分析[D];東北師范大學(xué);2012年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 王繼成,潘金貴,張福炎;Web文本挖掘技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;2000年05期
2 邢桂芬;ERP與CRM一體化結(jié)構(gòu)中數(shù)據(jù)實(shí)時(shí)通訊的研究[J];江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年06期
3 何佳訊;;中國(guó)引文分析的實(shí)踐歷史:1980—1990——基于論文結(jié)構(gòu)的分析[J];情報(bào)學(xué)刊;1993年03期
4 崔雷;專題文獻(xiàn)高被引論文的連續(xù)同被引聚類分析[J];情報(bào)理論與實(shí)踐;1996年01期
5 崔雷;專題文獻(xiàn)高被引論文的時(shí)間分布與同被引聚類分析[J];情報(bào)學(xué)報(bào);1995年01期
6 崔雷;當(dāng)年高被引論文的主題詞鏈聚類分析及其在情報(bào)預(yù)測(cè)中的應(yīng)用[J];情報(bào)學(xué)報(bào);1995年05期
7 宋擒豹,沈鈞毅;基于關(guān)聯(lián)規(guī)則的Web文檔聚類算法[J];軟件學(xué)報(bào);2002年03期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張新華;白血病相關(guān)基因研究現(xiàn)狀[J];醫(yī)學(xué)綜述;1998年10期
2 于文強(qiáng);早幼粒細(xì)胞白血病相關(guān)基因研究進(jìn)展[J];白血病.淋巴瘤;1998年03期
3 韓為東,于力,樓方定,王全順,趙瑜,史子江,靳海杰;RACE技術(shù)在釣取白血病相關(guān)基因LRP16全長(zhǎng)cDNA中的應(yīng)用[J];中國(guó)實(shí)驗(yàn)血液學(xué)雜志;2001年01期
4 于文強(qiáng);早幼粒細(xì)胞白血病相關(guān)基因與維甲酸治療[J];腫瘤防治研究;1998年03期
5 于力,韓為東,樓方定,王全順,趙瑜,MichaelACaligiuri;新的白血病相關(guān)基因LRP16的克隆[J];軍醫(yī)進(jìn)修學(xué)院學(xué)報(bào);2000年02期
6 韓為東,于力,樓方定,王全順,趙瑜,史子江,焦宏遠(yuǎn),周建軍;一個(gè)新的白血病相關(guān)基因LRP16全長(zhǎng)cDNA的克隆、序列分析及表達(dá)特征[J];中國(guó)生物化學(xué)與分子生物學(xué)報(bào);2001年02期
7 徐周敏,樓方定,于力,盧學(xué)春,楊龍,呂鳴,呂有靈,陳堅(jiān),章菲菲;新的白血病相關(guān)基因LRP15真核表達(dá)載體構(gòu)建及在K562細(xì)胞中的表達(dá)[J];武警醫(yī)學(xué);2003年11期
8 陳賽娟,朱勇梅;白血病的基因研究對(duì)提高臨床診治水平的作用[J];診斷學(xué)理論與實(shí)踐;2003年03期
9 方福德;《基因組科學(xué)與人類疾病》一書(shū)下半年出版[J];中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào);2000年04期
10 王克來(lái);中國(guó)人類基因組研究走向“主戰(zhàn)場(chǎng)”[J];生物技術(shù)通報(bào);2002年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 蔡輝國(guó);于珍;姜學(xué)英;徐晶;張麗艷;;利用改良的SSH方法篩選致白血病相關(guān)基因[A];中國(guó)生物化學(xué)與分子生物學(xué)會(huì)第八屆會(huì)員代表大會(huì)暨全國(guó)學(xué)術(shù)會(huì)議論文摘要集[C];2001年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前4條
1 本報(bào)記者 王代同;[N];科技日?qǐng)?bào);2001年
2 記者 汪敏華;[N];解放日?qǐng)?bào);2000年
3 本報(bào)記者 李恩青;[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2001年
4 陶春祥;[N];中國(guó)醫(yī)藥報(bào);2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 韓為東;一個(gè)新的白血病相關(guān)基因—LRP16的克隆、序列分析、表達(dá)特征及其生物學(xué)功能推測(cè)[D];軍醫(yī)進(jìn)修學(xué)院;2001年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李焱;利用寡核苷酸芯片檢測(cè)部分白血病相關(guān)基因改變[D];第三軍醫(yī)大學(xué);2003年
2 徐周敏;新的白血病相關(guān)基因LRP15的克隆及其功能的初步研究[D];中國(guó)人民解放軍軍醫(yī)進(jìn)修學(xué)院;2003年
3 孫薏;利用寡聚核苷酸芯片進(jìn)行急性白血病疾病基因組檢測(cè)及基因分型的初步研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2003年
本文關(guān)鍵詞:國(guó)際石油價(jià)格波動(dòng)行為機(jī)理及預(yù)測(cè)模型研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):77259
本文鏈接:http://www.sikaile.net/kejilunwen/shiyounenyuanlunwen/77259.html