深度學(xué)習(xí)在簡歷解析中的應(yīng)用研究

發(fā)布時(shí)間：2023-10-14 07:02

　　隨著文本數(shù)據(jù)在互聯(lián)網(wǎng)上的快速增長,海量格式自由的文本簡歷雖然在工作中給人們帶來了便利,但也產(chǎn)生了信息過載的困擾。為了提升非結(jié)構(gòu)化文本簡歷的解析性能,本文將深度學(xué)習(xí)技術(shù)應(yīng)用于簡歷解析中。主要工作如下:1.基于字序列的中文簡歷解析方法研究。針對(duì)淺層神經(jīng)網(wǎng)絡(luò)生成詞表示的缺陷,構(gòu)建雙向長短時(shí)記憶模型(Bidirectional Long Short-Term Memory,BLSTM)對(duì)字序列進(jìn)行建模,獲得包含詞內(nèi)部信息的詞表示;然后結(jié)合BLSTM和條件隨機(jī)場(Conditional Random Fields,CRF)(BLSTM-CRF)對(duì)生成的詞表示進(jìn)行建模并對(duì)模型調(diào)優(yōu);最后使用訓(xùn)練好的模型對(duì)非結(jié)構(gòu)化文本簡歷進(jìn)行解析。實(shí)驗(yàn)結(jié)果顯示,與傳統(tǒng)詞向量方案的簡歷解析模型相比,該方法的F1-score提升了2.31%。2.基于特征融合的中文簡歷解析方法研究。針對(duì)簡歷解析模型使用單一特征難以提高模型性能的局限性,提出融合多種有效特征來提升簡歷解析模型性能的方案。本文融合的是傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)生成的語義特征和BLSTM對(duì)字序列建模生成的特征。(1)采用concat的方式對(duì)這兩種特征進(jìn)行融合,然后使用BL...

【文章頁數(shù)】：85 頁

【學(xué)位級(jí)別】：碩士

【文章目錄】：
摘要
abstract
第1章緒論
    1.1 研究背景和意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 簡歷解析的發(fā)展與現(xiàn)狀
    1.3 中文簡歷解析的技術(shù)難點(diǎn)
    1.4 研究內(nèi)容與論文結(jié)構(gòu)
第2章簡歷解析相關(guān)理論基礎(chǔ)
    2.1 基于規(guī)則的簡歷解析方法
    2.2 基于條件隨機(jī)場的簡歷解析方法
    2.3 深度學(xué)習(xí)理論基礎(chǔ)
        2.3.1 深度學(xué)習(xí)概述
        2.3.2 深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)理論
    2.4 評(píng)價(jià)方法
    2.5 本章小結(jié)
第3章基于字序列的中文簡歷解析方法
    3.1 命名實(shí)體識(shí)別技術(shù)概述
    3.2 基于CBLSTMs-CRF的中文簡歷解析方法
        3.2.1 字序列信息的詞表示
        3.2.2 基于BLSTM-CRF的中文簡歷解析
        3.2.3 算法流程總結(jié)
    3.3 實(shí)驗(yàn)結(jié)果與分析
        3.3.1 數(shù)據(jù)集與實(shí)驗(yàn)環(huán)境
        3.3.2 數(shù)據(jù)預(yù)處理
        3.3.3 實(shí)驗(yàn)設(shè)置
        3.3.4 CBLSTMs-CRF模型有效性驗(yàn)證
        3.3.5 字序列詞表示在不同模型中的有效性驗(yàn)證
    3.4 本章小結(jié)
第4章基于多特征融合的中文簡歷解析方法
    4.1 引言
    4.2 基于CWBLSTMs-CRF的中文簡歷解析方法
        4.2.1 詞向量模型
        4.2.2 聯(lián)合字序列信息的詞表示
        4.2.3 算法流程總結(jié)
        4.2.4 實(shí)驗(yàn)設(shè)置
        4.2.5 CWBLSTMs-CRF方法有效性驗(yàn)證
        4.2.6 融合字序列特征方法在不同模型中的有效性驗(yàn)證
    4.3 基于注意力機(jī)制的中文簡歷解析方法
        4.3.1 注意力機(jī)制概述
        4.3.2 基于Att-BLSTMs-CRF的中文簡歷解析方法
        4.3.3 算法流程總結(jié)
        4.3.4 實(shí)驗(yàn)設(shè)置
        4.3.5 注意力機(jī)制有效性驗(yàn)證
    4.4 本章小結(jié)
第5章基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計(jì)
    5.1 系統(tǒng)需求分析
    5.2 基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計(jì)
        5.2.1 獲取文本簡歷模塊
        5.2.2 實(shí)體標(biāo)注抽取模塊
        5.2.3 數(shù)據(jù)存儲(chǔ)模塊
        5.2.4 前端輸出模塊
    5.3 本章小結(jié)
第6章總結(jié)與展望
    6.1 工作總結(jié)
    6.2 工作展望
參考文獻(xiàn)
致謝
附錄攻讀碩士學(xué)位期間從事的科研工作及取得的成果

本文編號(hào)：3853829

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3853829.html

上一篇：基于解耦空間特征學(xué)習(xí)的稀疏表示面部表情識(shí)別算法研究
下一篇：煤礦井下無線傳感器網(wǎng)絡(luò)實(shí)時(shí)RSSI定位算法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

深度學(xué)習(xí)在簡歷解析中的應(yīng)用研究