基于海量冗余網(wǎng)頁(yè)過(guò)濾的Web挖掘技術(shù)研究
[Abstract]:When the intelligent teaching system acquires teaching resources by searching for web keywords, because of the influence of many garbage pages with the same keywords, it is difficult for teaching resources to be quickly excavated from the massive web pages. The traditional keyword search method is influenced by spam web pages, which makes the search amount too large, resulting in a lack of timeliness in the acquisition of intelligent teaching resources. Therefore, this paper puts forward the application of Web information extraction technology in intelligent teaching resource mining. According to the requirements of obtaining teaching resources, the relevant Web pages are obtained in batches, and the Web pages are cleaned by XPath language combined with search requests and the features of web pages' subject information blocks, and then the resources needed for teaching are mined according to the Web text feature model. The simulation results show that this method can effectively overcome the interference of garbage web pages and quickly complete the mining of teaching resources with satisfactory results.
【作者單位】: 北京聯(lián)合大學(xué)師范學(xué)院;
【分類號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 婁德成;姚天f ;;漢語(yǔ)句子語(yǔ)義極性分析和觀點(diǎn)抽取方法的研究[J];計(jì)算機(jī)應(yīng)用;2006年11期
2 史西兵;王浩鳴;;隱馬爾可夫模型解決信息抽取問(wèn)題的仿真研究[J];計(jì)算機(jī)仿真;2010年05期
3 蔣云霞;;基于層次分析法的工程管理專業(yè)方向選擇分析[J];科技通報(bào);2011年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 崔大志;劉影;李媛;;論網(wǎng)絡(luò)社區(qū)評(píng)論情感語(yǔ)義的模糊化[J];大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2010年03期
2 黃瑾娉;蘇庭波;;一種產(chǎn)品評(píng)論信息的意見挖掘技術(shù)研究[J];工業(yè)控制計(jì)算機(jī);2011年06期
3 許璐蕾;;網(wǎng)絡(luò)評(píng)論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
4 談國(guó)新;方一;;突發(fā)公共事件網(wǎng)絡(luò)輿情監(jiān)測(cè)指標(biāo)體系研究[J];華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2010年03期
5 伍星;何中市;黃永文;;產(chǎn)品評(píng)論挖掘研究綜述[J];計(jì)算機(jī)工程與應(yīng)用;2008年36期
6 李娟;張全;賈寧;;中文詞語(yǔ)傾向性分析處理[J];計(jì)算機(jī)工程與應(yīng)用;2009年02期
7 田生偉;禹龍;王宇光;;維吾爾語(yǔ)情感分類算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年36期
8 趙俊芹;楊丹;余淼;陳林;;評(píng)論信息抽取技術(shù)在網(wǎng)絡(luò)貿(mào)易系統(tǒng)平臺(tái)上的應(yīng)用[J];計(jì)算機(jī)科學(xué);2008年04期
9 李維杰;;情感分析與認(rèn)知[J];計(jì)算機(jī)科學(xué);2010年07期
10 李芳;何婷婷;宋樂(lè);;評(píng)價(jià)主題挖掘及其傾向性識(shí)別[J];計(jì)算機(jī)科學(xué);2012年06期
相關(guān)會(huì)議論文 前2條
1 郝博一;夏云慶;鄭方;;OPINAX:一個(gè)有效的產(chǎn)品屬性挖掘系統(tǒng)[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
2 王倩;何婷婷;聞彬;宋樂(lè);張茂元;;基于依存關(guān)系的中文情感要素抽取技術(shù)研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
相關(guān)博士學(xué)位論文 前5條
1 鄧斌;B2C在線評(píng)論中的客戶知識(shí)管理研究[D];電子科技大學(xué);2010年
2 舒江波;面向中文信息處理的復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)研究[D];華中師范大學(xué);2011年
3 胡燕;基于Web信息抽取的專業(yè)知識(shí)獲取方法研究[D];武漢理工大學(xué);2007年
4 黃永文;中文產(chǎn)品評(píng)論挖掘關(guān)鍵技術(shù)研究[D];重慶大學(xué);2009年
5 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 呂韶華;面向中文評(píng)論文本的情感傾向性研究[D];大連理工大學(xué);2010年
2 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學(xué);2010年
3 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學(xué);2010年
4 李海林;網(wǎng)絡(luò)輿情熱點(diǎn)信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學(xué);2010年
5 吳秀梅;基于潛在語(yǔ)義分析和最大熵的中文情感分析研究[D];北京交通大學(xué);2011年
6 張瑞;基于在線評(píng)論的消費(fèi)者品牌認(rèn)知和信任模糊推理研究[D];大連理工大學(xué);2011年
7 黃鑫;基于句法分析的產(chǎn)品評(píng)論挖掘研究[D];北京郵電大學(xué);2011年
8 史麗君;基于特征強(qiáng)化的中文產(chǎn)品評(píng)價(jià)挖掘研究[D];合肥工業(yè)大學(xué);2011年
9 蘇庭波;產(chǎn)品評(píng)論的意見傾向分類技術(shù)研究[D];安徽工業(yè)大學(xué);2011年
10 蔣磊;面向產(chǎn)品評(píng)論的意見挖掘關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 孫春玲,尹貽林,嚴(yán)玲;專業(yè)協(xié)會(huì)對(duì)工程管理學(xué)科人才培養(yǎng)的介入機(jī)制研究[J];高等工程教育研究;2005年05期
2 宋永發(fā),袁永博,吳智敏;國(guó)內(nèi)重點(diǎn)高等院校工程管理專業(yè)本科教學(xué)計(jì)劃比較研究[J];高等建筑教育;2004年03期
3 莫生紅;呂宏芬;李明偉;;層次分析法在市民購(gòu)房決策中的應(yīng)用[J];經(jīng)濟(jì)論壇;2007年19期
4 Thomas L.SAATY;DECISION MAKING - THE ANALYTIC HIERARCHY AND NETWORK PROCESSES (AHP/ANP)[J];Journal of Systems Science and Systems Engineering;2004年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 于薇;;包裝器的自動(dòng)生成方法介紹[J];才智;2009年28期
2 祝偉華;盧熠;劉斌斌;;基于HMM的Web信息抽取算法的研究與應(yīng)用[J];計(jì)算機(jī)科學(xué);2010年02期
3 王立建;尹四清;;基于Web頁(yè)面有效信息抽取的分類方法[J];電腦開發(fā)與應(yīng)用;2010年06期
4 鐘艷花,余偉紅,余永權(quán);Web文本挖掘系統(tǒng)及其關(guān)鍵技術(shù)研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年34期
5 洪流;張巍;肖明軍;蔡慶生;;一種改進(jìn)的基于HMM的信息抽取模型[J];模式識(shí)別與人工智能;2004年03期
6 崔繼馨,張鵬,楊文柱;基于DOM的Web信息抽取[J];河北農(nóng)業(yè)大學(xué)學(xué)報(bào);2005年03期
7 王勝,朱明;基于最大熵馬爾可夫模型的地址信息抽取[J];計(jì)算機(jī)工程與應(yīng)用;2005年21期
8 翟東升,余e,
本文編號(hào):2119759
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2119759.html