多語言電子詞典構(gòu)建
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1一個(gè)完整的藏文音節(jié)藏文字序,即藏文字典序,是通過比較各個(gè)位置上的字符的優(yōu)先關(guān)系而確定的
語言障礙地推向市場,除了解決排序語言軟件主要以文字的形式來顯示在對(duì)同一事物的拼寫不同,形狀不同,靠文字來交互,少數(shù)是圖形。即使語這個(gè)問題,表2-1。表2-1不同語言文字的尺寸差別漢語藏語樹贕繴︽纈軹繴︽﹀稱義︽纈羑繳纍﹀,音節(jié)與音節(jié)間用音節(jié)分隔符分開而)是由前加字符、....
圖3-3使用文本編輯器打開ifo文件后顯示的內(nèi)容
期處理的詞條信息采用文本文件存儲(chǔ),具體存儲(chǔ)的格式為:文件設(shè)定詞典信息文件,詞典信息文件中存儲(chǔ)詞典文件的名、詞條數(shù)量信息等字典的基本信息。文本文件編譯成相應(yīng)的字典庫文件,將編譯后的文件提供給足用戶的需要,用戶想要添加自己的詞典,就可以把所需要換成字典可以使用的文件,就可以將自己的詞....
圖3-4詞典庫的整理在Excel表格中整理好的詞庫,最后在形成詞庫文件的時(shí)候,在專用文本編輯器②中編輯,
接著就是第二個(gè)單詞,依次重復(fù)。所有這些單詞,按一定的排序規(guī)則來存儲(chǔ)類似strcasecmp的函數(shù)。3)dict文件格式:dict文件是純粹的數(shù)據(jù)塊,每個(gè)數(shù)據(jù)塊的開始偏移地址和大小件里了。由于idx文件里已經(jīng)有了數(shù)據(jù)長度信息,所以字符串可以不要結(jié)尾的\0塊的類型由.if....
圖4-7多語言詞典取詞結(jié)果
圖4-7多語言詞典取詞結(jié)果碼自動(dòng)檢測(cè)及編碼轉(zhuǎn)換技術(shù)實(shí)現(xiàn)多語言電子詞典中,由于藏文詞庫的編碼采用的是基于Unicod鼠標(biāo)取詞只限定于Unicode編碼的藏文。但是,這樣會(huì)產(chǎn)生一操作過程中,有時(shí)候并不知道所要取詞的文本是何種編碼的藏測(cè)詞庫中沒有相關(guān)釋義的詞。加之目前藏文編碼....
本文編號(hào):3930431
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanxuelw/3930431.html