本篇文章給大家談談gbk編碼在線轉換,以及gbk編碼對照表合集對應的知識點,文章可能有點長,但是希望大家可以閱讀完,增長自己的知識,最重要的是希望對各位有所幫助,可以解決了您的問題,不要忘了收藏本站喔。
漢字編碼的轉換過程
包含三個步驟:明確結論+原因+。是將漢字轉化為計算機能夠識別的二進制數字的過程。計算機只能識別二進制數字,而漢字并不是數字,在計算機中需要將漢字轉換為對應的二進制數字才能進行處理。目前最流行的漢字編碼方式是Unicode,它將每個漢字都分配了一個唯一的編碼,這個編碼是由兩個十六進制數字組成的。Unicode編碼又分為UTF-8、UTF-16等多種方式,每種方式都有不同的特點和使用場景。在計算機中處理漢字時,還需要注意編碼方式的選擇和轉換的正確性,否則可能出現亂碼等問題。
gbk是什么意思
GBK編碼是一個漢字編碼標準,全稱《漢字內碼擴展規范》。
中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂。國家技術監督局標準化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函[1995]229號文件的形式,將它確定為技術規范指導性文件,發布和實施。
gbk編碼規則
GBK編碼是GB2312編碼的超集,向下完全兼容GB2312。
GB18030編碼向下兼容GBK和GB2312。
GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換。
GBK,GB2312以及Unicode都既是字符集,也是編碼方式,而UTF-8只是編碼方式,并不是字符集。
centos查看文本文件的編碼格式
如果你需要在Linux中操作windows下的文件,那么你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介紹一下,在Linux中如何查看文件的編碼及如何進行對文件進行編碼轉換。
查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:setfileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那么你可以在
~/.vimrc文件中添加以下內容:
setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
2.enca(如果你的系統中沒有安裝這個命令,可以用sudoyuminstall-yenca安裝)查看文件編碼
$encafilename
filename:Universaltransformationformat8bits;UTF-8
CRLFlineterminators
需要說明一點的是,enca對某些GBK編碼的文件識別的不是很好,識別時會出現:
Unrecognizedencoding
文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:setfileencoding=utf-8
2.enconv轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下
enconv-Lzh_CN-xUTF-8filename
3.iconv轉換,iconv的命令格式如下:
iconv-fencoding-tencodinginputfile
比如將一個UTF-8編碼的文件轉換成GBK編碼
iconv-fGBK-tUTF-8file1-ofile2
Linux文件名編碼轉換
從Linux往windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由于編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。
在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。
首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum-yinstallconvmv
安裝。
下面看一下convmv的具體用法:
convmv-f源編碼-t新編碼[選項]文件名
常用參數:
-r遞歸處理子文件夾
--notest真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list顯示所有支持的編碼
--unescap可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:
convmv-fUTF-8-tGBK--notestutf8編碼的文件名
這樣轉換以后"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)。
注意:不要在NTFS和FAT文件系統中使用此命令,否則可能產生意外結果,如果要在Linux中正確的顯示NTFS和FAT的中文件名,可以通過mount參數來解決,具體方法查看一下man手冊。
gbk漢字編碼查詢
gbk漢字編碼的查詢方法如下:
1.
“命”的GBK編碼為:0xC3,0xFC)
2.
GBK編碼表:B00123456789ABCDEFA啊阿埃挨哎唉哀皚癌藹矮艾礙愛隘B鞍氨安俺按暗岸胺案骯昂盎凹敖熬翱C襖傲奧懊澳芭捌扒叭吧笆八疤巴拔跋D靶把耙壩霸罷爸白柏百擺佰敗拜稗斑E班搬扳般頒板版扮拌伴瓣半辦絆邦幫F梆榜膀綁棒磅蚌鎊傍謗苞胞包褒剝B10123456789ABCDEFA薄雹保堡飽寶抱報暴豹鮑爆杯碑悲B卑北輩背貝鋇倍狽備憊焙被奔苯本笨C崩繃甭泵蹦迸逼鼻比鄙筆彼碧蓖蔽畢D斃毖幣庇痹閉敝弊必辟壁臂避陛鞭邊E編貶扁便變卞辨辯辮遍標彪膘表鱉憋F別癟彬斌瀕濱賓擯兵冰柄丙秉餅炳B20123456789AB
END,本文到此結束,如果可以幫助到大家,還望關注本站哦!