基于BiLSTM-CRF的體育新聞主題詞抽取方法
發(fā)布時間:2021-07-23 01:25
針對典型的循環(huán)神經(jīng)網(wǎng)絡方法在抽取主題詞時因缺少上下文相關的句子級信息而導致識別準確率較低的問題,提出了一種基于雙向長短期記憶網(wǎng)絡條件隨機場(BiLSTM-CRF)模型聯(lián)合TextRank的主題詞抽取方法。首先,利用TextRank對新聞文本進行主題句抽取,再使用雙向長短期記憶(BiLSTM)模型獲取文本的前后特征,最后使用條件隨機場(CRF)完成句子級序列標注,得到主題詞。在多組體育類新聞數(shù)據(jù)集上進行實驗,該方法較對照組BiLSTM方法F1值提高約0.8%~5.1%,且用時更短。因此,改進的BiLSTM-CRF方法可顯著提升主題詞的抽取準確率和效率。
【文章來源】:武漢工程大學學報. 2020,42(01)
【文章頁數(shù)】:6 頁
【文章目錄】:
1 體育新聞主題詞抽取方法
1.1 抽取流程
1.2 TextRank提取新聞主題句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 實驗部分
2.1 數(shù)據(jù)集
2.2 評價標準
2.3 結果及分析
3 結論
本文編號:3298304
【文章來源】:武漢工程大學學報. 2020,42(01)
【文章頁數(shù)】:6 頁
【文章目錄】:
1 體育新聞主題詞抽取方法
1.1 抽取流程
1.2 TextRank提取新聞主題句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 實驗部分
2.1 數(shù)據(jù)集
2.2 評價標準
2.3 結果及分析
3 結論
本文編號:3298304
本文鏈接:http://www.sikaile.net/jiaoyulunwen/tylw/3298304.html
最近更新
教材專著