電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>嵌入式開發(fā)>Locale 詳解

Locale 詳解

2017-11-07 | rar | 0.4 MB | 次下載 | 1積分

資料介紹

locale 詳解
  locale 是國際化與本土化過程中的一個非常重要的概念,個人認為,對于中文用戶來說,通常會涉及到的國際化或者本土化,大致包含三個方面:看中文,寫中文,與 window中文系統(tǒng)的兼容和通信。從實際經(jīng)驗上看來,locale的設(shè)定與看中文關(guān)系不大,但是與寫中文,及window分區(qū)的掛載方式有很密切的關(guān)系。本人認為就像一個純英文的Windows能夠瀏覽中文,日文或者意大利文網(wǎng)頁一樣,你不需要設(shè)定locale就可以看中文。那么,為什么要設(shè)定 locale呢?什么時候會用到locale呢?
  Tags: locale 設(shè)定 原因 解釋
  一、為什么要設(shè)定locale 正如前面我所講的,設(shè)定locale與你能否瀏覽中文的網(wǎng)頁沒有直接的關(guān)系,即便你把locale設(shè)置成en_US.ISO-8859-1這樣一個標(biāo)準(zhǔn)的英文locale你照樣可以瀏覽中文的網(wǎng)頁,只要你的系統(tǒng)里面有相應(yīng)的字符集(這個都不一定需要)和合適的字體(如simsun),瀏覽器就可以把網(wǎng)頁翻譯成中文給你看。具體的過程是網(wǎng)絡(luò)把網(wǎng)頁傳送到你的機器上之后,瀏覽器會判斷相應(yīng)的編碼的字符集,根據(jù)網(wǎng)頁采用的字符集,去字體庫里面找合適的字體,然后由文字渲染工具把相應(yīng)的文字在屏幕上顯示出來。
  在下文本人會偶爾把字符集比喻成密碼本,個人覺得對于一些東西比較容易理解,假如你不習(xí)慣的話,把全文copy到任何文本編輯器,用字符集替換密碼本即可。
  那有時候網(wǎng)頁顯示亂碼或者都是方框是怎么回事呢?個人認為,顯示亂碼是因為設(shè)定的字符集不對(或者沒有相應(yīng)的字符集),例如網(wǎng)頁是用UTF-8編碼的,你非要用GB2312去看,而系統(tǒng)根據(jù)GB2312去找字體,然后在屏幕上顯示,當(dāng)然是一堆的亂碼,也就是說你用一個錯誤的密碼本去翻譯發(fā)給你的電報,當(dāng)然內(nèi)容那叫一個亂;至于有些時候瀏覽的網(wǎng)頁能顯示一部分漢字,但有很多的地方是方框,能夠顯示漢字說明瀏覽器已經(jīng)正確的判斷出了網(wǎng)頁的編碼,并在字體庫里面找到了相應(yīng)的文字,但是并不是每個字體庫都包含某個字符集全部的字體的緣故,有些時候會顯示不完全,找一個比較全的支持較多字符集的字體就可以了。
  既然我能夠瀏覽中文網(wǎng)頁,那為什么我還要設(shè)定locale呢?
  其實你有沒有想過這么一個問題,為什么gentoo官方論壇上中文論壇的網(wǎng)頁是用UTF-8編碼的(雖然大家一直強烈建議用GB2312編碼),但是新浪網(wǎng)就是用GB2312編碼的呢?而Xorg的官方網(wǎng)頁竟然是ISO-8859-15編碼的,我沒有設(shè)定這個locale怎么一樣的能瀏覽呢?這個問題就像是你有所有的密碼本,不論某個網(wǎng)站是用什么字符集編碼的,你都可以用你手里的密碼本把他們翻譯過來,但問題是雖然你能瀏覽中文網(wǎng)頁,但是在整個操作系統(tǒng)里面流動的還是英文字符。所以,就像你能聽懂英語,也能聽懂中文。 最根本的問題是:你不可以寫中文。
  當(dāng)你決定要寫什么東西的時候,首先要決定的一件事情是用那種語言,對于計算機來說就是你要是用哪一種字符集,你就必須告訴你的linux系統(tǒng),你想用那一本密碼本去寫你想要寫的東西。知道為什么需要用GB2312字符集去瀏覽新浪了吧,因為新浪的網(wǎng)頁是用GB2312寫的。
  為了讓你的Linux能夠輸入中文,就需要把系統(tǒng)的locale設(shè)定成中文的(嚴(yán)格說來是locale中的語言類別LC_CTYPE ),例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白這些古里古怪的表達方式。這個外星表達式規(guī)定了什么東西呢?這個問題稍后詳述,現(xiàn)在只需要知道,這是locale的表達方式就可以了。
  二、到底什么是locale? locale這個單詞中文翻譯成地區(qū)或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據(jù)計算機用戶所使用的語言,所在國家或者地區(qū),以及當(dāng)?shù)氐奈幕瘋鹘y(tǒng)所定義的一個軟件運行時的語言環(huán)境。
  這個用戶環(huán)境可以按照所涉及到的文化傳統(tǒng)的各個方面分成幾個大類,通常包括用戶所使用的語言符號及其分類(LC_CTYPE),數(shù)字 (LC_NUMERIC),比較和排序習(xí)慣(LC_COLLATE),時間顯示格式(LC_TIME),貨幣單位(LC_MONETARY),信息主要是提示信息,錯誤信息, 狀態(tài)信息, 標(biāo)題, 標(biāo)簽, 按鈕和菜單等(LC_MESSAGES),姓名書寫方式(LC_NAME),地址書寫方式(LC_ADDRESS),電話號碼書寫方式 (LC_TELEPHONE),度量衡表達方式(LC_MEASUREMENT),默認紙張尺寸大小(LC_PAPER)和locale對自身包含信息的概述(LC_IDENTIFICATION)。
  所以說,locale就是某一個地域內(nèi)的人們的語言習(xí)慣和文化傳統(tǒng)和生活習(xí)慣。一個地區(qū)的locale就是根據(jù)這幾大類的習(xí)慣定義的,這些locale定義文件放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義文件,這些文件都是用文本格式書寫的,你可以用寫字板打開,看看里邊的內(nèi)容,當(dāng)然出了有限的注釋以外,大部分東西可能你都看不懂,因為是用的Unicode的字符索引方式。
  對于de_DE@euro的一點說明,@后邊是修正項,也就是說你可以看到兩個德國的locale: /usr/share/i18n/locales/de_DE@euro /usr/share/i18n/locales/de_DE 打開這兩個locale定義,你就會知道它們的差別在于de_DE@euro使用的是歐洲的排序、比較和縮進習(xí)慣,而de_DE用的是德國的標(biāo)準(zhǔn)習(xí)慣。
  上面我們說到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用戶都知道是系統(tǒng)采用的字符集。
  三、什么是字符集? 字符集就是字符,尤其是非英語字符在系統(tǒng)內(nèi)的編碼方式,也就是通常所說的內(nèi)碼,所有的字符集都放在/usr/share/i18n/charmaps,所有的字符集也都是用Unicode編號索引的。Unicode用統(tǒng)一的編號來索引目前已知的全部的符號。而字符集則是這些符號的編碼方式,或者說是在網(wǎng)絡(luò)傳輸,計算機內(nèi)部通信的時候,對于不同字符的表達方式,Unicode是一個靜態(tài)的概念,字符集是一個動態(tài)的概念,是每一個字符傳遞或傳輸?shù)木唧w形式。就像 Unicode編號U59D0是代表姐姐的“姐”字,但是具體的這個字是用兩個字節(jié)表示,三個字節(jié),還是四個字節(jié)表示,是字符集的問題。例如:UTF-8字符集就是目前流行的對字符的編碼方式,UTF-8用一個字節(jié)表示常用的拉丁字母,用兩個字節(jié)表示常用的符號,包括常用的中文字符,用三個表示不常用的字符,用四個字節(jié)表示其他的古靈精怪的字符。而GB2312字符集就是用兩個字節(jié)表示所有的字符。需要提到一點的是Unicode除了用編號索引全部字符以外,本身是用四個字節(jié)存儲全部字符,這一點在談到掛載windows分區(qū)的時候是非常重要的一個概念。所以說你也可以把Unicode看作是一種字符集(我不知道它和UTF-32的關(guān)系,反正UTF-32就是用四個字節(jié)表示所有的字符的),但是這樣表述符號是非常浪費資源的,因為在計算機世界絕大部分時候用到的是一個字節(jié)就可以搞定的 26個字母而已。所以才會有UTF-8,UTF-16等等,要不然大同世界多好,省了這許多麻煩。
  四、zh_CN.GB2312到底是在說什么? Locale 是軟件在運行時的語言環(huán)境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[。字符集]]。 所以說呢,locale總是和一定的字符集相聯(lián)系的。下面舉幾個例子:
  1、我說中文,身處中華人民共和國,使用國標(biāo)2312字符集來表達字符。 zh_CN.GB2312=中文_中華人民共和國+國標(biāo)2312字符集。
  2、我說中文,身處中華人民共和國,使用國標(biāo)18030字符集來表達字符。 zh_CN.GB18030=中文_中華人民共和國+國標(biāo)18030字符集。
  3、我說中文,身處中華人民共和國臺灣省,使用國標(biāo)Big5字符集來表達字符。 zh_TW.BIG5=中文_臺灣。大五碼字符集
  4、我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字符。 en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
  5、我說德語,身處德國,使用UTF-8字符集,習(xí)慣了歐洲風(fēng)格。 de_DE.UTF-8@euro=德語_德國.UTF-8字符集@按照歐洲習(xí)慣加以修正
  注意不是de_DE@euro.UTF-8,所以完全的locale表達方式是 [語言[_地域][。字符集] [@修正值]
  生成的locale放在/usr/lib/locale/目錄中,并且每個locale都對應(yīng)一個文件夾,也就是說創(chuàng)建了de_DE@euro.UTF-8 locale之后,就生成/usr/lib/locale/de_DE@euro.UTF-8/目錄,里面是具體的每個locale的內(nèi)容。
  五、怎樣去自定義locale 在gentoo生成locale還是很容易的,首先要在USE里面加入userlocales支持,然后編輯locales.build文件,這個文件用來指示glibc生成locale文件。 很多人不明白每一個條目是什么意思。 其實根據(jù)上面的說明現(xiàn)在應(yīng)該很明確了。
下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1TC358743XBG評估板參考手冊
  2. 1.36 MB  |  330次下載  |  免費
  3. 2開關(guān)電源基礎(chǔ)知識
  4. 5.73 MB  |  6次下載  |  免費
  5. 3100W短波放大電路圖
  6. 0.05 MB  |  4次下載  |  3 積分
  7. 4嵌入式linux-聊天程序設(shè)計
  8. 0.60 MB  |  3次下載  |  免費
  9. 5基于FPGA的光纖通信系統(tǒng)的設(shè)計與實現(xiàn)
  10. 0.61 MB  |  2次下載  |  免費
  11. 6基于FPGA的C8051F單片機開發(fā)板設(shè)計
  12. 0.70 MB  |  2次下載  |  免費
  13. 751單片機窗簾控制器仿真程序
  14. 1.93 MB  |  2次下載  |  免費
  15. 8基于51單片機的RGB調(diào)色燈程序仿真
  16. 0.86 MB  |  2次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33564次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21548次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6653次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537796次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191185次下載  |  免費
  13. 7十天學(xué)會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183278次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費