基于HADOOP的海量錄音文件存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:錄音文件存儲(chǔ) + HDFS; 參考:《電子科技大學(xué)》2014年碩士論文
【摘要】:隨著通信服務(wù)行業(yè)的快速發(fā)展,各企業(yè)的業(yè)務(wù)種類與服務(wù)類別也變得多樣化,用戶與企業(yè)客服人員的互動(dòng)數(shù)量也快速增長(zhǎng)。許多公司的客服壓力也越來(lái)越大,公司為保證服務(wù)人員正常工作,以及防止惡意騷擾電話,同時(shí)為了保證客服人員按照客戶的要求辦理業(yè)務(wù),通常會(huì)對(duì)客服通話進(jìn)行錄音保存。這些錄音文件數(shù)量巨大,而且還處于快速動(dòng)態(tài)增長(zhǎng)中。但是它們對(duì)于公司后期數(shù)據(jù)分析,用于提升員工服務(wù)品質(zhì)管理等非常重要,通常會(huì)長(zhǎng)期保存。傳統(tǒng)的存儲(chǔ)方式處理這些數(shù)據(jù)效率低,工作量大,而且成本高。如何安全有效且低成本的存儲(chǔ)這些數(shù)據(jù)是當(dāng)前迫切需要解決的一個(gè)問(wèn)題。本文主要研究了如何利用多種存儲(chǔ)設(shè)備,構(gòu)建分布式存儲(chǔ)系統(tǒng),用以解決海量錄音文件存儲(chǔ)問(wèn)題。本文分析了國(guó)內(nèi)云儲(chǔ)技術(shù)發(fā)展的現(xiàn)狀,通過(guò)調(diào)研分布式文件系統(tǒng)技術(shù),再結(jié)合海量錄音文件的存儲(chǔ)需求,設(shè)計(jì)并實(shí)現(xiàn)了基于HADOOP的海量錄音文件存儲(chǔ)系統(tǒng)。該系統(tǒng)是以HDFS為存儲(chǔ)基礎(chǔ)開(kāi)發(fā)的一個(gè)海量錄音文件存儲(chǔ)系統(tǒng),系統(tǒng)由客戶端、消息隊(duì)列以及服務(wù)存儲(chǔ)端組成?蛻舳酥饕峁┯押玫挠脩艚换ソ缑,消息隊(duì)列是客戶端與服務(wù)端的紐帶,服務(wù)端實(shí)現(xiàn)了分布式存儲(chǔ)并響應(yīng)客戶端的各種請(qǐng)求。該系統(tǒng)是典型的生產(chǎn)消費(fèi)者模式,客戶端發(fā)送請(qǐng)求到消息隊(duì)列,服務(wù)端處理從消息隊(duì)列獲取的請(qǐng)求并響應(yīng)客戶端。該系統(tǒng)服務(wù)端是可動(dòng)態(tài)擴(kuò)展的,新增服務(wù)端程序時(shí),服務(wù)程序只要監(jiān)聽(tīng)到指定的消息隊(duì)列,就可以接收并處理客戶端的請(qǐng)求。以下介紹從需求到系統(tǒng)實(shí)現(xiàn)的步驟:第一,通過(guò)分析企業(yè)的海量錄音文件存儲(chǔ)的現(xiàn)狀,針對(duì)傳統(tǒng)錄音文件存儲(chǔ)方式的不足,本文進(jìn)行分布式存儲(chǔ)技術(shù)調(diào)研,提出了基于HADOOP的海量錄音文件系統(tǒng)的需求;第二,結(jié)合海量錄音文件存儲(chǔ)的現(xiàn)狀及需求,對(duì)海量錄音文件存儲(chǔ)系統(tǒng)進(jìn)行了詳細(xì)設(shè)計(jì),主要包含用戶權(quán)限鑒定設(shè)計(jì)、錄音文件的上傳下載設(shè)計(jì)、錄音文件管理功能設(shè)計(jì)和錄音文件分享設(shè)計(jì)等;第三,本文對(duì)分布式文件系統(tǒng)的環(huán)境搭建做了詳細(xì)介紹,并實(shí)現(xiàn)了海量錄音文件存儲(chǔ)系統(tǒng),包括用戶權(quán)限鑒定功能實(shí)現(xiàn)、錄音文件的上傳下載功能實(shí)現(xiàn)、錄音文件管理功能實(shí)現(xiàn)和錄音文件的分享功能實(shí)現(xiàn)等?紤]到可移植性及安全性,系統(tǒng)用Java語(yǔ)言開(kāi)發(fā)。本系統(tǒng)分為客戶端、服務(wù)端、數(shù)據(jù)庫(kù)和分布式存儲(chǔ)系統(tǒng)。本系統(tǒng)界面簡(jiǎn)單整潔,方便用戶的使用;第四,對(duì)系統(tǒng)的安全性、文件傳輸效率以及系統(tǒng)的功能做了測(cè)試,在錄音文件存儲(chǔ)方式上,本系統(tǒng)和傳統(tǒng)系統(tǒng)相比,具有更好的安全性能、數(shù)據(jù)傳輸效率也有很大的提升、數(shù)據(jù)的存儲(chǔ)成本也更低。
[Abstract]:With the rapid development of the communication service industry, the business types and service categories of the enterprises have become diversified, and the number of interaction between users and customer service personnel has also increased rapidly.Many companies are also under increasing customer service pressure, to ensure that service personnel work properly, and to prevent malicious harassment of phone calls, and to ensure that customer service personnel do business in accordance with customer requirements, customer service calls are usually recorded and preserved.These audio files are huge in number and still in rapid dynamic growth.But they are important for later data analysis, for improving employee quality management, and are often preserved for long periods of time.The traditional storage method is low efficiency, heavy workload and high cost.How to store these data safely and efficiently and at low cost is an urgent problem.This paper mainly studies how to use a variety of storage devices to build a distributed storage system to solve the problem of massive audio file storage.This paper analyzes the present situation of cloud storage technology in China, designs and implements the storage system of massive audio files based on HADOOP by investigating the distributed file system technology and combining the storage requirements of massive audio files.This system is a massive recording file storage system based on HDFS. The system consists of client, message queue and service storage.The client mainly provides a friendly user interface. Message queue is the link between the client and the server. The server realizes distributed storage and responds to various requests from the client.The system is a typical production consumer mode, the client sends the request to the message queue, the server processes the request from the message queue and responds to the client.The system server is dynamically extensible. When the server program is added, the service program can receive and process the request of the client as long as it listens to the specified message queue.The following are the steps from requirements to system implementation: first, by analyzing the current situation of mass audio file storage in enterprises, aiming at the shortcomings of traditional recording file storage methods, this paper investigates distributed storage technology.This paper puts forward the requirement of mass audio file system based on HADOOP. Secondly, combining with the current situation and demand of mass audio file storage, the paper designs the storage system of mass sound recording file in detail, which mainly includes the design of user authority authentication.Audio file upload and download design, recording file management function design and audio file sharing design. Thirdly, this paper introduces the environment of distributed file system in detail, and realizes the massive audio file storage system.Including the realization of user authority authentication function, audio file upload and download function realization, recording file management function realization and audio file sharing function realization and so on.Considering portability and security, the system is developed with Java language.The system is divided into client, server, database and distributed storage system.The interface of the system is simple and clean, and it is convenient for users to use. Fourthly, the security of the system, the efficiency of file transfer and the functions of the system are tested. In the storage mode of recording files, the system is compared with the traditional system.With better security performance, data transmission efficiency is also greatly improved, data storage costs are lower.
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP333
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王春靖;FAT32的優(yōu)點(diǎn)[J];電腦愛(ài)好者;1998年03期
2 何文才;鄭釗;劉培鶴;杜敏;;一種基于目錄數(shù)據(jù)分離存儲(chǔ)的文件存儲(chǔ)方法的研究與實(shí)現(xiàn)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2014年01期
3 飛雪散花;;手機(jī)文件存儲(chǔ)看我的[J];電腦迷;2012年05期
4 孫有軍;張大興;;海量圖片文件存儲(chǔ)去重技術(shù)研究[J];計(jì)算機(jī)應(yīng)用與軟件;2014年04期
5 ;金剛指——計(jì)算機(jī)文件存儲(chǔ)的保護(hù)神[J];信息安全與通信保密;2001年12期
6 趙躍龍;謝曉玲;蔡詠才;王國(guó)華;劉霖;;一種性能優(yōu)化的小文件存儲(chǔ)訪問(wèn)策略的研究[J];計(jì)算機(jī)研究與發(fā)展;2012年07期
7 周國(guó)安;李強(qiáng);陳新;胡旭;;云環(huán)境下海量小文件存儲(chǔ)技術(shù)研究綜述[J];信息網(wǎng)絡(luò)安全;2014年06期
8 張美芳;電子文件存儲(chǔ)方式的研究[J];數(shù)字與縮微影像;2005年02期
9 陶慧;于守謙;劉夏;;適于測(cè)控系統(tǒng)的文件存儲(chǔ)結(jié)構(gòu)研究[J];計(jì)算機(jī)應(yīng)用與軟件;2010年11期
10 方勇;史躍輝;;淺談減少地形圖電子文件存儲(chǔ)冗余的幾種方法[J];江西測(cè)繪;2006年02期
相關(guān)會(huì)議論文 前6條
1 任勇;朱立谷;張雷;彭建峰;;新型虛擬文件存儲(chǔ)系統(tǒng)的設(shè)計(jì)[A];第15屆全國(guó)信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年
2 李浩;;基于制播分離的文件存儲(chǔ)和傳輸方式的探討[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)五屆二次理事會(huì)暨學(xué)術(shù)年會(huì)論文集(上篇)[C];2010年
3 陳海波;侯建衛(wèi);;針對(duì)海量詳單快速存儲(chǔ)檢索的實(shí)現(xiàn)方法[A];2011年通信與信息技術(shù)新進(jìn)展——第八屆中國(guó)通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2011年
4 陳海波;侯建衛(wèi);;針對(duì)海量詳單快速存儲(chǔ)檢索的實(shí)現(xiàn)方法[A];2011全國(guó)無(wú)線及移動(dòng)通信學(xué)術(shù)大會(huì)論文集[C];2011年
5 袁旦;張智君;;預(yù)覽時(shí)間對(duì)顏色判斷任務(wù)下客體文件存儲(chǔ)的影響[A];第十一屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
6 黃步根;黃政;劉建軍;;SANYO數(shù)碼相機(jī)中被刪除視頻的恢復(fù)[A];第26次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2011年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者 郭平;Isilon擴(kuò)充文件存儲(chǔ)產(chǎn)品線[N];計(jì)算機(jī)世界;2009年
2 本報(bào)記者 郭平;容量與性能 一樣都不能少[N];計(jì)算機(jī)世界;2010年
3 張峰;統(tǒng)一存儲(chǔ) 業(yè)務(wù)連續(xù)[N];網(wǎng)絡(luò)世界;2006年
4 清水 編譯;基于文件存儲(chǔ)大行其道[N];計(jì)算機(jī)世界;2011年
5 本報(bào)記者 郭濤;HCP Anywhere:為HDS內(nèi)容云錦上添花[N];中國(guó)計(jì)算機(jī)報(bào);2013年
6 于翔;讓IT如業(yè)務(wù)般運(yùn)營(yíng)的應(yīng)用路徑[N];網(wǎng)絡(luò)世界;2009年
7 劉一冰;IBM SoNAS專攻高端存儲(chǔ)客戶[N];電腦商報(bào);2010年
8 清水 編譯;云存儲(chǔ):機(jī)遇下暗藏挑戰(zhàn)[N];計(jì)算機(jī)世界;2010年
9 沈建苗;互聯(lián)網(wǎng)存儲(chǔ) 你信得過(guò)嗎[N];計(jì)算機(jī)世界;2007年
10 ;一月 筆類和文件存儲(chǔ)產(chǎn)品關(guān)注度較高[N];消費(fèi)日?qǐng)?bào);2010年
相關(guān)碩士學(xué)位論文 前10條
1 宮海林;支持事務(wù)的文件存儲(chǔ)技術(shù)研究與系統(tǒng)實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年
2 曹挹芬;分布式文件存儲(chǔ)與檢索平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2009年
3 黃斌;并行文件存儲(chǔ)系統(tǒng)關(guān)鍵技術(shù)的研究[D];華南理工大學(xué);2012年
4 蔣浩;分布式文件存儲(chǔ)系統(tǒng)副本管理方法研究[D];浙江大學(xué);2013年
5 張聰萍;錢塘分布式文件存儲(chǔ)系統(tǒng)性能優(yōu)化[D];浙江大學(xué);2011年
6 周峰;互聯(lián)網(wǎng)文件存儲(chǔ)服務(wù)系統(tǒng)研究[D];華中科技大學(xué);2011年
7 鄭釗;?赜(jì)算機(jī)分離式文件存儲(chǔ)的研究[D];西安電子科技大學(xué);2014年
8 廖家趙;面向城軌線網(wǎng)的海量小文件存儲(chǔ)方法的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2015年
9 何娟;基于分布式文件存儲(chǔ)的個(gè)人信息融合系統(tǒng)的研究與實(shí)踐[D];北京郵電大學(xué);2010年
10 江柳;HDFS下小文件存儲(chǔ)優(yōu)化相關(guān)技術(shù)研究[D];北京郵電大學(xué);2011年
,本文編號(hào):1767957
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1767957.html