天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 基因論文 >

基于機器學(xué)習(xí)的植物表型基因的文獻分類及其應(yīng)用

發(fā)布時間:2024-04-11 04:13
  隨著生物信息學(xué)的發(fā)展,每天都有大量的文獻發(fā)布到各種期刊上,面對快速增長的生命科學(xué)文獻,依靠手工標(biāo)注的方式難以實現(xiàn)高效的管理,將文本挖掘技術(shù)應(yīng)用于生物醫(yī)學(xué)領(lǐng)域能夠很好的解決文獻分類效率,文獻分類技術(shù)可以從雜亂無序的信息中提取科研人員感興趣的內(nèi)容。本文通過機器學(xué)習(xí)分類器對文獻進行分類,篩選出植物表型和基因相關(guān)的文獻,提高分類的效率,具體工作如下:(1)完成了數(shù)據(jù)獲取和預(yù)處理工作通過爬蟲軟件收集了 MEDLINE數(shù)據(jù)庫中和植物表型基因相關(guān)的文獻,對收集到的植物表型基因的文獻進行預(yù)處理操作,主要包括:文獻清洗、文獻切分、詞干提取和刪除停用詞。(2)構(gòu)建了詞袋模型、TF-IDF模型和Word2vec模型對文獻進行特征處理針對植物表型基因文獻中特征處理問題,對預(yù)處理后的文獻特征賦予不同的權(quán)重,將文獻的內(nèi)容轉(zhuǎn)換成向量的形式,主要依據(jù)文獻中單詞出現(xiàn)的頻率、逆文檔頻率和文本相似度等屬性,通過實驗選取合理的超參數(shù),最終對不同特征提取方法的分類效果進行評價。(3)運用了機器學(xué)習(xí)分類器對植物表型基因文獻進行分類通過對現(xiàn)有文本分類算法優(yōu)缺點的比較,選取了支持向量機、樸素貝葉斯和隨機森林方法對植物表型基因文獻進行...

【文章頁數(shù)】:63 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2-3?CBOW和skip-gram模型示意圖??Fig.?2-3?Schematic?diagram?of?CBOW?and?skip-gram?models??

圖2-3?CBOW和skip-gram模型示意圖??Fig.?2-3?Schematic?diagram?of?CBOW?and?skip-gram?models??

于其??他神經(jīng)網(wǎng)絡(luò),運行速度更快,而且不需要手工標(biāo)記標(biāo)簽來創(chuàng)建訓(xùn)練集。CB0W模型??又叫連續(xù)詞袋模型是根據(jù)目標(biāo)詞上下文的詞向量對該詞的詞向量進行預(yù)測,而??Skip-gram貝U相反,Skip-gram又叫跳節(jié)模型,逆轉(zhuǎn)CBOW的因果關(guān)系,通過目標(biāo)詞??的詞向量預(yù)測上下文的詞向....


圖3-1文獻分類流程圖??Fig.?3-1?Document?classification?flow?chart??本章主要介紹的是文獻的預(yù)處理和特征選擇,下文是詳細介紹

圖3-1文獻分類流程圖??Fig.?3-1?Document?classification?flow?chart??本章主要介紹的是文獻的預(yù)處理和特征選擇,下文是詳細介紹

文獻清洗??文獻切分??表型數(shù)據(jù)集?S?詞干提取??5特征選擇?S?分類器??去除停用詞??文獻預(yù)處理??圖3-1文獻分類流程圖??Fig.?3-1?Document?classification?flow?chart??本章主要介紹的是文獻的預(yù)處理和特征選擇,下文是詳細介紹。?....


圖3-2株高類別的植物表型文檔???

圖3-2株高類別的植物表型文檔???

omology?was?observed?between?Bt2?and?L2?in?their?coding?region,?but?homology?was?poor?in?the?3'?noncoding?border.??This?result?demonstrates?....


圖3-4?spike詞向量??Fig.?3-4?spike?word?vector??

圖3-4?spike詞向量??Fig.?3-4?spike?word?vector??

容合并一起過程中,要讓文本輸出格式符合utf-8編碼要求。??植物表型基因語料庫共收集到超過100000個單詞,嵌入100維的詞向量,產(chǎn)生??了龐大的權(quán)重矩陣,在神經(jīng)網(wǎng)絡(luò)中進行梯度下降速率較慢,由于需要訓(xùn)練數(shù)據(jù)來調(diào)整??權(quán)重避免過擬合,為了優(yōu)化訓(xùn)練過程,避免權(quán)重矩陣過大,本實驗使....



本文編號:3950859

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jiyingongcheng/3950859.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5d1f6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com