電信運(yùn)營人員行為分析的研究與設(shè)計
本文選題:用戶行為 + 日志采集。 參考:《東南大學(xué)》2017年碩士論文
【摘要】:隨著科技的發(fā)展,計算機(jī)已經(jīng)深入到我們工作、學(xué)習(xí)和生活中。網(wǎng)絡(luò)給我們帶來便利的同時,也產(chǎn)生了各式各樣的安全問題。為了加強(qiáng)員工在工作中的行為規(guī)范,保證公司的核心資料不被泄漏,現(xiàn)從安全的角度考慮,以Hadoop技術(shù)作為數(shù)據(jù)存儲和處理的技術(shù)框架,對用戶日志進(jìn)行采集和行為審計,從而分析用戶行為是否存在安全隱患,及時作出響應(yīng)。審計的用戶行為主要包括:登錄行為、帳號管理、密碼修改、權(quán)限管理、系統(tǒng)操作行為、網(wǎng)絡(luò)應(yīng)用程序、文件傳送、郵件和文件傳輸協(xié)議。論文從四個方面對用戶的行為進(jìn)行分析和研究:1)審計規(guī)則生成模型設(shè)計:規(guī)則分為規(guī)則頭和規(guī)則選項,并定義了各自的語法。采用Apriori算法挖掘出強(qiáng)關(guān)聯(lián)規(guī)則和管理員定義兩種方式完善規(guī)則庫。針對Apriori算法存在的缺點(diǎn),采用在生成頻繁項集的無用的交易記錄添加標(biāo)記的方法進(jìn)行優(yōu)化,提高關(guān)聯(lián)規(guī)則挖掘效率。2)日志的采集:本文實(shí)現(xiàn)多點(diǎn)分布式數(shù)據(jù)的采集,將主機(jī)數(shù)據(jù)源和網(wǎng)絡(luò)數(shù)據(jù)源有機(jī)的結(jié)合起來。使用Flume和Kafka開源軟件。Flume可定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù)。Kafka實(shí)現(xiàn)對數(shù)據(jù)的緩存,利用主題和分區(qū)實(shí)現(xiàn)數(shù)據(jù)的分類和負(fù)載均衡。3)設(shè)計實(shí)現(xiàn)審計系統(tǒng):基于優(yōu)化的Apriori算法,挖掘出用戶的強(qiáng)關(guān)聯(lián)規(guī)則,生成規(guī)則庫。對采集的基于日志的用戶行為,采用特征匹配、頻率分析、關(guān)聯(lián)分析和關(guān)鍵字分析等方法進(jìn)行行為審計,對存在異常的行為通過郵件的方式將審計結(jié)果發(fā)送給安全管理員,管理員根據(jù)審計結(jié)果的反饋,及時作出決策支持。4)對優(yōu)化的算法和審計系統(tǒng)進(jìn)行實(shí)驗測試:通過改變支持度和日志審計量兩種方式對算法審計的效率進(jìn)行測試,并通過預(yù)置異常測試審計的準(zhǔn)確率,并對審計出的結(jié)果進(jìn)行了有效的分析,得出了改進(jìn)的算法的可行性和系統(tǒng)的穩(wěn)定性。
[Abstract]:With the development of science and technology, computers have penetrated into our work, study and life. The network brings us convenience, at the same time, has also produced various kinds of security problems. In order to strengthen the behavior of employees in the work and ensure that the core information of the company is not leaked, we take Hadoop technology as the technical framework of data storage and processing to collect and audit the user logs from a security point of view. Therefore, the user behavior is analyzed whether there is a security hazard, timely response. The audit user behavior mainly includes: login behavior, account management, password modification, privilege management, system operation behavior, network application, file transfer, mail and file transfer protocol. This paper analyzes and studies the behavior of the user from four aspects: the design of the rule generation model: the rules are divided into rule header and rule options, and their syntax is defined. Apriori algorithm is used to mine strong association rules and administrator definition to improve the rules base. Aiming at the shortcomings of Apriori algorithm, the method of adding tags to useless transaction records that generate frequent itemsets is adopted to improve the efficiency of mining association rules. Will host data source and network data source organic combination. Using Flume and Kafka open source software. Flume can customize all kinds of data senders to collect data. Kafka is used to cache data. The audit system is designed and implemented by using topic and partition to realize data classification and load balancing. 3): based on optimized Apriori algorithm, audit system is designed and implemented. The strong association rules of users are mined and the rule base is generated. To collect the user behavior based on log, we use the methods of feature matching, frequency analysis, association analysis and keyword analysis to audit the behavior, and send the audit results to the security administrator by email. According to the feedback from the audit results, the administrator makes timely decision support. 4) the optimized algorithm and the audit system are tested experimentally: the efficiency of the algorithm audit is tested by changing the support degree and the log audit quantity. Through the accuracy of preset abnormal test audit and the analysis of the audit results, the feasibility of the improved algorithm and the stability of the system are obtained.
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:F626;TP311.13;TP309
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭三強(qiáng);郭燕錦;;大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究[J];科技廣場;2013年02期
2 徐曉菊;;數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用[J];統(tǒng)計與咨詢;2008年03期
3 黃德才;張良燕;龔衛(wèi)華;劉端陽;;一種改進(jìn)的關(guān)聯(lián)規(guī)則增量式更新算法[J];計算機(jī)工程;2008年10期
4 宋旭東;翟坤;高衛(wèi)東;;關(guān)聯(lián)規(guī)則評價指標(biāo)的研究[J];微計算機(jī)信息;2007年12期
5 王員根;李愛鳳;;關(guān)聯(lián)規(guī)則在課程相關(guān)性模式中的研究與應(yīng)用[J];現(xiàn)代計算機(jī);2007年02期
6 黃藝海;胡君;;日志審計系統(tǒng)設(shè)計與實(shí)現(xiàn)[J];計算機(jī)工程;2006年22期
7 楊健兵;;數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的改進(jìn)算法及其實(shí)現(xiàn)[J];微計算機(jī)信息;2006年21期
8 朱意霞;姚力文;黃水源;黃龍軍;;基于排序矩陣和樹的關(guān)聯(lián)規(guī)則挖掘算法[J];計算機(jī)科學(xué);2006年07期
9 程玉勝;鄧小光;江效堯;;Apriori算法中頻繁項集挖掘?qū)崿F(xiàn)研究[J];計算機(jī)技術(shù)與發(fā)展;2006年03期
10 李緒成,王保保;挖掘關(guān)聯(lián)規(guī)則中Apriori算法的一種改進(jìn)[J];計算機(jī)工程;2002年07期
相關(guān)碩士學(xué)位論文 前8條
1 劉暢;基于大數(shù)據(jù)技術(shù)的鐵路運(yùn)輸企業(yè)ERP的應(yīng)用研究[D];北京交通大學(xué);2015年
2 齊恒;面向大數(shù)據(jù)的電信客戶分群模型研究與設(shè)計[D];華北電力大學(xué);2014年
3 張文達(dá);電信用戶行為特征分析[D];電子科技大學(xué);2013年
4 張萌;基于hadoop的網(wǎng)絡(luò)安全日志審計系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2013年
5 寧興旺;基于日志挖掘的網(wǎng)絡(luò)安全審計系統(tǒng)研究與實(shí)現(xiàn)[D];山東師范大學(xué);2010年
6 朱勝奎;基于日志數(shù)據(jù)挖掘的網(wǎng)絡(luò)安全審計技術(shù)研究[D];山東師范大學(xué);2009年
7 王莘;基于數(shù)據(jù)挖掘的審計日志分析技術(shù)研究[D];解放軍信息工程大學(xué);2007年
8 吳海玲;基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法研究[D];河海大學(xué);2007年
,本文編號:1914411
本文鏈接:http://www.sikaile.net/jingjilunwen/xxjj/1914411.html