大量網(wǎng)絡(luò)游記文本中熱度地名提取方法與實(shí)證研究
本文關(guān)鍵詞:大量網(wǎng)絡(luò)游記文本中熱度地名提取方法與實(shí)證研究,由筆耕文化傳播整理發(fā)布。
【摘要】:探討網(wǎng)絡(luò)游記文本中的地名使用特征及其研究意義,地名使用狀態(tài)的定量特征能夠反映游客對旅游地景觀的認(rèn)知結(jié)構(gòu)與旅游行為的一般過程。在現(xiàn)有中文分詞技術(shù)基礎(chǔ)上,結(jié)合游記文本中的地名使用特點(diǎn),選用ATF*PDF方法計算特征詞匯在整個旅游文本集中使用狀態(tài)的綜合權(quán)重,設(shè)計了一種基于大量網(wǎng)絡(luò)游記文本的熱度地名自動提取方法,為不使用自定義地名庫的旅游地理研究奠定了基礎(chǔ)。以游客點(diǎn)評網(wǎng)游記為樣本的實(shí)驗(yàn)證明,該方法能夠?qū)崿F(xiàn)旅游相關(guān)地名的快速提取,地名使用熱度越高,提取準(zhǔn)確率越高;對地名提取結(jié)果的類型結(jié)構(gòu)分析發(fā)現(xiàn)了自然和人文旅游地游記在詞匯使用方面的共性和差異,指示了旅游文本地名的分布意義及其對旅行過程其他信息解讀的潛在價值,預(yù)示了網(wǎng)絡(luò)游記文本在進(jìn)一步解析旅游者的旅游地認(rèn)知特征和旅游行為過程方面的科學(xué)意義。
【作者單位】: 河北師范大學(xué)資源與環(huán)境科學(xué)學(xué)院;河北省科學(xué)院地理科學(xué)研究所;河北省環(huán)境演變與生態(tài)建設(shè)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 網(wǎng)絡(luò)游記文本 熱度地名 ATF*PDF模型 多樣本集合共現(xiàn)
【基金】:國家自然科學(xué)基金項目(41101105、41171105) 河北省軟科學(xué)研究計劃項目(13406002D) 河北省高校重點(diǎn)學(xué)科建設(shè)項目
【分類號】:F592;F224
【正文快照】: 0引言網(wǎng)絡(luò)游記是旅游者基于自身旅游體驗(yàn)主動發(fā)表在互聯(lián)網(wǎng)中主要描述旅行過程和感受的文本,其相比問卷調(diào)查和訪談更能夠代表游客的真實(shí)態(tài)度[1],可以作為旅游地研究的重要數(shù)據(jù)來源[2]。目前,國內(nèi)外以互聯(lián)網(wǎng)游記文本為數(shù)據(jù)源的旅游地研究越來越多,主要關(guān)注旅游者行為及其對旅游
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉瑜;張毅;田原;薛露露;;廣義地名及其本體研究[J];地理與地理信息科學(xué);2007年06期
2 張雪英;張春菊;閭國年;;地理命名實(shí)體分類體系的設(shè)計與應(yīng)用分析[J];地球信息科學(xué)學(xué)報;2010年02期
3 張春菊;張雪英;朱少楠;徐希濤;;基于網(wǎng)絡(luò)爬蟲的地名數(shù)據(jù)庫維護(hù)方法[J];地球信息科學(xué)學(xué)報;2011年04期
4 王佳果;王堯;;基于NVivo軟件的互聯(lián)網(wǎng)旅游文本的質(zhì)性研究——以貴州黔東南肇興的旅游者文本為例[J];旅游論壇;2009年01期
5 唐順英;周尚意;;文本在游客地方感建構(gòu)中的作用研究——基于曲阜游記的分析[J];地理與地理信息科學(xué);2013年02期
6 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計算機(jī)研究與發(fā)展;2004年08期
7 胡志敏;;基于綜合權(quán)重的多文檔關(guān)鍵詞抽取算法[J];計算機(jī)與數(shù)字工程;2010年06期
8 苗學(xué)玲;保繼剛;;“眾樂樂”:旅游虛擬社區(qū)“結(jié)伴旅行”之質(zhì)性研究[J];旅游學(xué)刊;2007年08期
9 肖亮;趙黎明;;互聯(lián)網(wǎng)傳播的臺灣旅游目的地形象——基于兩岸相關(guān)網(wǎng)站的內(nèi)容分析[J];旅游學(xué)刊;2009年03期
10 黃德根,岳廣玲,楊元生;基于統(tǒng)計的中文地名識別[J];中文信息學(xué)報;2003年02期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 于江德;王希杰;;詞位標(biāo)注漢語分詞技術(shù)詳解[J];安陽師范學(xué)院學(xué)報;2010年05期
2 楊爾弘;;媒體5年詞語使用情況調(diào)查分析[J];北華大學(xué)學(xué)報(社會科學(xué)版);2011年04期
3 付艷;楊冬青;唐世渭;伍偉;王騰蛟;高軍;;基于實(shí)體識別的在線主題檢測方法[J];北京大學(xué)學(xué)報(自然科學(xué)版);2009年02期
4 馬志強(qiáng);周長勝;丁維;楊娜;;校園網(wǎng)搜索引擎的研究與實(shí)現(xiàn)[J];北京機(jī)械工業(yè)學(xué)院學(xué)報;2007年01期
5 劉文華;康海燕;;領(lǐng)域問答系統(tǒng)生成器的研究[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2009年03期
6 李玉森;張雪英;袁正午;;面向GIS的地理命名實(shí)體識別研究[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2008年06期
7 傅鸝;孫堅;付春雷;;基于語義的音樂檢索系統(tǒng)[J];重慶理工大學(xué)學(xué)報(自然科學(xué)版);2011年01期
8 張雪英;朱少楠;徐希濤;;基于Neogeography的中文地名詞典維護(hù)和服務(wù)機(jī)制[J];測繪通報;2012年01期
9 張雪英;朱少楠;張春菊;;中文文本的地理命名實(shí)體標(biāo)注[J];測繪學(xué)報;2012年01期
10 高東平;;基于類型論的漢語分詞系統(tǒng)TTCS[J];重慶理工大學(xué)學(xué)報(社會科學(xué));2011年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李金;宋陽;梁洪;;語言殘障患者醫(yī)療輔助系統(tǒng)設(shè)計[A];第九屆全國信息獲取與處理學(xué)術(shù)會議論文集Ⅱ[C];2011年
2 于江德;王希杰;樊孝忠;;漢語詞法分析中上文和下文孰重孰輕[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 韓冬煦;常寶寶;;基于邊界熵和卡方統(tǒng)計量的多領(lǐng)域適應(yīng)性中文分詞方法[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
4 修馳;宋柔;;基于“大詞”實(shí)例的中文分詞研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
5 余驍捷;邵陽;吳及;王俠;;基于SVM和MMR融和的自動文摘方法[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
6 董俊林;聶偉;楊君英;張春爐;;命名實(shí)體識別與提取分析[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會議論文集[C];2008年
7 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2007年
8 俞鴻魁;張華平;劉群;呂學(xué)強(qiáng);施水才;;基于層疊隱馬爾可夫模型的中文命名實(shí)體識別[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會'2005論文集(下冊)[C];2005年
9 喬春庚;肖詩斌;孫麗華;施水才;;規(guī)則與統(tǒng)計相結(jié)合的案件名稱識別[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
10 張sソ,
本文編號:416091
本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/416091.html