天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于動詞特征的文本分類方法研究

發(fā)布時間:2021-04-19 13:52
  隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶在社交媒體和網(wǎng)絡(luò)購物平臺中產(chǎn)生了大量的數(shù)據(jù),文本作為這些數(shù)據(jù)的重要表現(xiàn)形式,從中提取有效信息與尋找信息熱點是現(xiàn)代自然語言處理研究的重要內(nèi)容。文本分類作為文本信息處理的基礎(chǔ)技術(shù)之一,一直是信息挖掘等領(lǐng)域的研究熱點。在文本分類任務(wù)中,文本特征的提取及處理方法直接影響最終分類系統(tǒng)的分類效果。通過使用群體智能、遷移學習等技術(shù)可以更好的對文本特征進行識別和提取。本文提出了一種使用擴展后的動詞特征進行分類的智能回歸分類方法和一種通過遷移學習使用其他領(lǐng)域知識對缺乏標注的文本進行分類的方法,創(chuàng)新點如下:1.在使用文本表達意見、態(tài)度時,動詞扮演了重要的角色。本文提出了一種通過依存句法分析提取核心動詞作為特征并對動詞特征進行擴展的方法。為了提高分類器的分類效果,該方法對文本中的動詞特征進行了擴展,使用粒子群搜索算法從原始特征空間中尋找有效的特征映射函數(shù),再根據(jù)這些函數(shù)將原始特征從低維空間映射至易于分類的高維空間,進而構(gòu)建更合理的特征表達。2.在對動詞特征進行擴展后,特征維數(shù)較高,本文提出了智能回歸方法作為分類方法對擴展后的動詞特征進行分類。該方法通過粒子群算法搜尋回歸模型的各個參... 

【文章來源】:華南理工大學廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景與意義
    1.2 研究目的
    1.3 主要研究內(nèi)容與組織結(jié)構(gòu)
第二章 文本分類技術(shù)基礎(chǔ)
    2.1 引言
    2.2 文本分類的經(jīng)典機器學習方法
    2.3 基于遷移學習的文本分類方法
    2.4 基于深度學習的文本分類方法
    2.5 詞性特征在文本分類中的提取與應(yīng)用
    2.6 本章小結(jié)
第三章 基于智能回歸的文本分類方法
    3.1 引言
    3.2 構(gòu)建依存句法樹
    3.3 動詞特征
    3.4 動詞詞組的提取方法
    3.5 使用動詞特征進行文本分類
    3.6 實驗與分析
    3.7 本章小結(jié)
第四章 基于遷移學習的文本分類方法
    4.1 文本特征提取和向量化
    4.2 跨語言文本分類模型
    4.3 樞紐詞為動詞的跨語言文本分類模型
    4.4 實驗設(shè)置與結(jié)果分析
    4.5 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻
攻讀碩士學位期間取得的研究成果
致謝
附件


【參考文獻】:
期刊論文
[1]基于多特征的中文文本蘊含識別[J]. 譚詠梅,王志浩.  北京郵電大學學報. 2015(06)
[2]一種基于規(guī)則優(yōu)先級的詞性標注方法[J]. 王廣正,王喜鳳.  安徽工業(yè)大學學報(自然科學版). 2008(04)
[3]基于分類規(guī)則樹的頻繁模式文本分類[J]. 陳曉云,陳袆,王雷,李榮陸,胡運發(fā).  軟件學報. 2006(05)
[4]《統(tǒng)計自然語言處理基礎(chǔ)》[J].   中文信息學報. 2005(03)

碩士論文
[1]英語動詞語義中預(yù)設(shè)問題的研究[D]. 張婷婷.長春理工大學 2010
[2]基于最大熵模型的漢語詞性標注研究[D]. 張磊.大連理工大學 2008



本文編號:3147676

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3147676.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d7f43***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com