電力調(diào)度控制系統(tǒng)中語(yǔ)義解析技術(shù)研究
發(fā)布時(shí)間:2020-08-09 01:20
【摘要】:隨著電網(wǎng)調(diào)度控制規(guī)模的不斷擴(kuò)大,電力相關(guān)企業(yè)積累了大量電力調(diào)度控制過(guò)程產(chǎn)生的數(shù)據(jù),特別是文本數(shù)據(jù)。在電網(wǎng)信息化、智能化建設(shè)及人工智能技術(shù)興起的背景下,如何有效利用這些數(shù)據(jù)成為當(dāng)下研究的熱點(diǎn)。早期出現(xiàn)的信息抽取系統(tǒng)往往依賴(lài)于手工建立的抽取規(guī)則,適應(yīng)性和可擴(kuò)展性較差。近年來(lái),機(jī)器學(xué)習(xí)方法特別是基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法在文本處理方面受到了廣泛關(guān)注。在實(shí)際的電力調(diào)度控制過(guò)程中,系統(tǒng)存儲(chǔ)了大量調(diào)度操作指令、監(jiān)控操作內(nèi)容、開(kāi)關(guān)跳閘處理內(nèi)容、監(jiān)控異常記錄、現(xiàn)場(chǎng)異常處理內(nèi)容等以文本形式的記錄信息,本文將它們統(tǒng)稱(chēng)為電力調(diào)控文本。這些文本主要以?shī)A雜著時(shí)間、數(shù)字、字母以及特殊符號(hào)的中文短文本的形式出現(xiàn),蘊(yùn)藏著豐富的設(shè)備運(yùn)行狀態(tài)、檢修過(guò)程、操作記錄等信息,對(duì)電網(wǎng)的智能化調(diào)度控制大有裨益。但由于上述文本存在著描述的多樣性、近似性、冗余性等問(wèn)題,這些信息還沒(méi)有得到充分的利用。本文以電力調(diào)度控制中的指令票、調(diào)度票、申請(qǐng)單等電力調(diào)控文本為研究對(duì)象,通過(guò)對(duì)電力調(diào)控文本的語(yǔ)義解析,使得計(jì)算機(jī)能夠識(shí)別、提取這些文本中包含的有用信息并將它們轉(zhuǎn)化成通用的、計(jì)算機(jī)可解析的數(shù)據(jù)形式。針對(duì)電力調(diào)控文本,本文提出了適用于電力調(diào)度控制系統(tǒng)的語(yǔ)義解析框架,設(shè)計(jì)了一種基于電力調(diào)度控制領(lǐng)域文本的語(yǔ)義解析方案。本文首先詳細(xì)介紹了電力調(diào)度控制技術(shù)及其發(fā)展?fàn)顩r并對(duì)電力調(diào)控文本進(jìn)行了歸類(lèi)、分析。針對(duì)電力調(diào)控文本的特點(diǎn)建立了包括樣本庫(kù)、物理環(huán)境庫(kù)及術(shù)語(yǔ)庫(kù)在內(nèi)的電力調(diào)控系統(tǒng)領(lǐng)域語(yǔ)料庫(kù),作為訓(xùn)練、測(cè)試樣本及未來(lái)電力調(diào)控環(huán)境規(guī)則學(xué)習(xí)的文本來(lái)源。針對(duì)電力調(diào)控文本制定了分詞標(biāo)準(zhǔn)并建立了包括基礎(chǔ)詞詞典、組合詞詞典在內(nèi)的電力調(diào)控領(lǐng)域詞典,以用于電力調(diào)控文本的分詞過(guò)程。有針對(duì)性的設(shè)計(jì)了包括詞性標(biāo)注、語(yǔ)義成分標(biāo)注、語(yǔ)義模型等標(biāo)注集,作為后續(xù)語(yǔ)義解析的基礎(chǔ)。實(shí)驗(yàn)結(jié)果表明:相對(duì)于通用的中文詞典,本文建立的領(lǐng)域詞典能夠有效提升電力調(diào)控文本分詞的正確率。其次,研究了常用中文文本語(yǔ)義分析方法、工具,探索了它們?cè)陔娏φ{(diào)度控制系統(tǒng)中應(yīng)用的可能性;诔S霉ぞ呓Y(jié)合隱馬爾可夫、條件隨機(jī)場(chǎng)等模型以典型電力調(diào)控指令為文本對(duì)象對(duì)電力調(diào)度控制系統(tǒng)語(yǔ)義解析過(guò)程中分詞、標(biāo)注、語(yǔ)法分析進(jìn)行了實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比分析。結(jié)合條件隨機(jī)場(chǎng)、長(zhǎng)短期記憶網(wǎng)絡(luò)模型等機(jī)器學(xué)習(xí)算法對(duì)電力調(diào)度控制領(lǐng)域文本進(jìn)行了語(yǔ)義解析,對(duì)文本中的有效信息進(jìn)行了提取整合。通過(guò)分析研究常用計(jì)算機(jī)通信數(shù)據(jù)形式特點(diǎn)及電力調(diào)度控制系統(tǒng)語(yǔ)義解析訴求,以JSON格式為基礎(chǔ),設(shè)計(jì)出了可方便的訪問(wèn)與處理的語(yǔ)義解析處理結(jié)果形式,形成計(jì)算機(jī)可識(shí)別分析的結(jié)構(gòu)化數(shù)據(jù)模型。最后,給出了電力調(diào)控文本語(yǔ)義解析框架。結(jié)合自定義領(lǐng)域字典、語(yǔ)料庫(kù)訓(xùn)練了適合于電力調(diào)控文本的語(yǔ)義模型,基于JAVA編程語(yǔ)言在開(kāi)源程序基礎(chǔ)上進(jìn)行開(kāi)發(fā),并編寫(xiě)程序?qū)⑵漭敵鼋Y(jié)果進(jìn)行整理提取生成計(jì)算機(jī)可識(shí)別的通用格式,取得了階段性的可用成果。本文融合語(yǔ)義解析及技術(shù)與電力領(lǐng)域知識(shí),建立了適用于電力調(diào)度控制系統(tǒng)的語(yǔ)義解析框架。實(shí)驗(yàn)表明:本文所提出的語(yǔ)義解析框架應(yīng)用于電力調(diào)控文本中,具有可行性和有效性。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TM73;TP391.1
【圖文】:
電力系統(tǒng)智能調(diào)度是指調(diào)度自動(dòng)化系統(tǒng)能夠自動(dòng)跟蹤電網(wǎng)狀態(tài)變化,輔助調(diào)逡逑控人員了解、掌握電力系統(tǒng)實(shí)時(shí)運(yùn)行狀態(tài),并提供當(dāng)前電網(wǎng)狀態(tài)的分析決策方案,逡逑以保證電網(wǎng)安全穩(wěn)定運(yùn)行。其總體框架思路如圖1邋-1所示。逡逑以實(shí)際電力系統(tǒng)積累的大量電力領(lǐng)域數(shù)據(jù)為基礎(chǔ)進(jìn)行包含模擬信息、數(shù)字信逡逑息、文本信息在內(nèi)的多數(shù)據(jù)的綜合的挖掘分析,以輔助電網(wǎng)模型進(jìn)行感知、預(yù)測(cè)、逡逑分析[8]。值得一提的是,在電力智能調(diào)度控制的決策過(guò)程中以申請(qǐng)單、指令票為逡逑主的電力調(diào)度控制文本承擔(dān)著指令下發(fā)、現(xiàn)場(chǎng)操作記錄、監(jiān)控操作記錄、異常告逡逑警記錄等重要任務(wù),包含了大量有效信息,因此對(duì)于它們的有效解析就成了電力逡逑2逡逑
公用n,控,直流,消失]逡逑[答復(fù),139邋,開(kāi)關(guān),放在,熱備用,狀態(tài)J逡逑圖3-3添加領(lǐng)域詞典的文本分詞結(jié)果逡逑由上圖結(jié)果可以看出,添加自定義詞典后能夠有效識(shí)別出“光字牌”、“#2”、逡逑“公用測(cè)控”、“熱備用”等電力調(diào)度控制領(lǐng)域詞匯。但這僅僅是較為簡(jiǎn)單的短文本,逡逑電力調(diào)度控制領(lǐng)域用到的文本種類(lèi)及書(shū)寫(xiě)形式繁多,分詞標(biāo)準(zhǔn)有時(shí)也會(huì)偶爾沖邐1逡逑突,要對(duì)大量文本進(jìn)行有效的分詞還需要進(jìn)行更加深入的研究。逡逑3.2中文標(biāo)注逡逑中文文本在處理過(guò)程中通常以序列的形式存在,在對(duì)文本序列進(jìn)行詞性等的_逡逑標(biāo)注時(shí)通常會(huì)選擇HMM、CRF等能夠勝任序列標(biāo)注的統(tǒng)計(jì)概率模型。標(biāo)注過(guò)程邋>逡逑'}錚義現(xiàn)幸災(zāi)形撓錁?shù)为输入,输出类藰阒I跡常兜陌鶴幀⒈甑、标注符等字符的邢X義狹斜曜⒔峁。辶x希常玻卞澹齲停汀ⅲ茫遙棋搴嶁灣義隙雜謚形奈謀
本文編號(hào):2786376
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TM73;TP391.1
【圖文】:
電力系統(tǒng)智能調(diào)度是指調(diào)度自動(dòng)化系統(tǒng)能夠自動(dòng)跟蹤電網(wǎng)狀態(tài)變化,輔助調(diào)逡逑控人員了解、掌握電力系統(tǒng)實(shí)時(shí)運(yùn)行狀態(tài),并提供當(dāng)前電網(wǎng)狀態(tài)的分析決策方案,逡逑以保證電網(wǎng)安全穩(wěn)定運(yùn)行。其總體框架思路如圖1邋-1所示。逡逑以實(shí)際電力系統(tǒng)積累的大量電力領(lǐng)域數(shù)據(jù)為基礎(chǔ)進(jìn)行包含模擬信息、數(shù)字信逡逑息、文本信息在內(nèi)的多數(shù)據(jù)的綜合的挖掘分析,以輔助電網(wǎng)模型進(jìn)行感知、預(yù)測(cè)、逡逑分析[8]。值得一提的是,在電力智能調(diào)度控制的決策過(guò)程中以申請(qǐng)單、指令票為逡逑主的電力調(diào)度控制文本承擔(dān)著指令下發(fā)、現(xiàn)場(chǎng)操作記錄、監(jiān)控操作記錄、異常告逡逑警記錄等重要任務(wù),包含了大量有效信息,因此對(duì)于它們的有效解析就成了電力逡逑2逡逑
公用n,控,直流,消失]逡逑[答復(fù),139邋,開(kāi)關(guān),放在,熱備用,狀態(tài)J逡逑圖3-3添加領(lǐng)域詞典的文本分詞結(jié)果逡逑由上圖結(jié)果可以看出,添加自定義詞典后能夠有效識(shí)別出“光字牌”、“#2”、逡逑“公用測(cè)控”、“熱備用”等電力調(diào)度控制領(lǐng)域詞匯。但這僅僅是較為簡(jiǎn)單的短文本,逡逑電力調(diào)度控制領(lǐng)域用到的文本種類(lèi)及書(shū)寫(xiě)形式繁多,分詞標(biāo)準(zhǔn)有時(shí)也會(huì)偶爾沖邐1逡逑突,要對(duì)大量文本進(jìn)行有效的分詞還需要進(jìn)行更加深入的研究。逡逑3.2中文標(biāo)注逡逑中文文本在處理過(guò)程中通常以序列的形式存在,在對(duì)文本序列進(jìn)行詞性等的_逡逑標(biāo)注時(shí)通常會(huì)選擇HMM、CRF等能夠勝任序列標(biāo)注的統(tǒng)計(jì)概率模型。標(biāo)注過(guò)程邋>逡逑'}錚義現(xiàn)幸災(zāi)形撓錁?shù)为输入,输出类藰阒I跡常兜陌鶴幀⒈甑、标注符等字符的邢X義狹斜曜⒔峁。辶x希常玻卞澹齲停汀ⅲ茫遙棋搴嶁灣義隙雜謚形奈謀
本文編號(hào):2786376
本文鏈接:http://www.sikaile.net/kejilunwen/dianlilw/2786376.html
最近更新
教材專(zhuān)著