提取方正排版文件廣義元數(shù)據(jù)并生成全文HTML的探索
發(fā)布時間:2017-12-21 03:09
本文關鍵詞:提取方正排版文件廣義元數(shù)據(jù)并生成全文HTML的探索 出處:《中國科技期刊研究》2016年02期 論文類型:期刊論文
更多相關文章: 廣義元數(shù)據(jù) 方正BD排版語言 VB編程軟件 自動全文提取 HTML文件
【摘要】:【目的】實現(xiàn)自動提取科技期刊全文元數(shù)據(jù)并生成HTML文件!痉椒ā恳苑秸虐嫖募䴙閷ο,在可以提取出來文章的標題、摘要等元數(shù)據(jù)的基礎上,將文章的正文內(nèi)容元數(shù)據(jù)化,提出了包含圖、表、公式等的廣義元數(shù)據(jù)概念,并建立了提取圖、表元數(shù)據(jù)的提取規(guī)則,同時將方正排版數(shù)學公式轉化為La Te X表達式。然后利用VB編程軟件編寫了自動提取廣義元數(shù)據(jù)程序并將元數(shù)據(jù)重新組合生成HTML格式的文件!窘Y果】根據(jù)方正BD排版語言的特點,建立的提取規(guī)則能有效提取全文并元數(shù)據(jù)化,最后可直接生成HTML文件!窘Y論】實際應用表明了利用廣義元數(shù)據(jù)生成HTML文件的有效性和可行性。
【作者單位】: 東北大學學報編輯部;
【基金】:遼寧省社會科學規(guī)劃基金資助項目(L12DXW011)
【分類號】:G230.7
【正文快照】: 東北大學學報編輯部,遼寧省沈陽市和平區(qū)文化路三巷11號110819目前,科技期刊的元數(shù)據(jù)[1]主要包含在網(wǎng)刊中提供標題、作者、中英文摘要、關鍵詞及參考文獻等信息,這些信息基本包含了文章的研究內(nèi)容和大致的研究方法以及結果。但是由于信息量偏少,并不能完全體現(xiàn)論文的全部信息,
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 周怡;胡大衛(wèi);段學儉;張世軍;張瑩瑩;章琢之;吳棄疾;;元數(shù)據(jù):數(shù)字出版發(fā)展的根基[J];編輯學刊;2011年05期
,本文編號:1314445
本文鏈接:http://www.sikaile.net/shekelunwen/chubanfaxing/1314445.html
最近更新
教材專著