- N +

gbk編碼在線轉換 gbk編碼對照表合集

本篇文章給大家談談gbk編碼在線轉換,以及gbk編碼對照表合集對應的知識點,文章可能有點長,但是希望大家可以閱讀完,增長自己的知識,最重要的是希望對各位有所幫助,可以解決了您的問題,不要忘了收藏本站喔。

漢字編碼的轉換過程

包含三個步驟:明確結論+原因+。是將漢字轉化為計算機能夠識別的二進制數字的過程。計算機只能識別二進制數字,而漢字并不是數字,在計算機中需要將漢字轉換為對應的二進制數字才能進行處理。目前最流行的漢字編碼方式是Unicode,它將每個漢字都分配了一個唯一的編碼,這個編碼是由兩個十六進制數字組成的。Unicode編碼又分為UTF-8、UTF-16等多種方式,每種方式都有不同的特點和使用場景。在計算機中處理漢字時,還需要注意編碼方式的選擇和轉換的正確性,否則可能出現亂碼等問題。

gbk是什么意思

GBK編碼是一個漢字編碼標準,全稱《漢字內碼擴展規范》。

中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂。國家技術監督局標準化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函[1995]229號文件的形式,將它確定為技術規范指導性文件,發布和實施。

gbk編碼規則

GBK編碼是GB2312編碼的超集,向下完全兼容GB2312。

GB18030編碼向下兼容GBK和GB2312。

GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換。

GBK,GB2312以及Unicode都既是字符集,也是編碼方式,而UTF-8只是編碼方式,并不是字符集。

centos查看文本文件的編碼格式

如果你需要在Linux中操作windows下的文件,那么你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介紹一下,在Linux中如何查看文件的編碼及如何進行對文件進行編碼轉換。

查看文件編碼

在Linux中查看文件編碼可以通過以下幾種方式:

1.在Vim中可以直接查看文件編碼

:setfileencoding

即可顯示文件編碼格式。

如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那么你可以在

~/.vimrc文件中添加以下內容:

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。

2.enca(如果你的系統中沒有安裝這個命令,可以用sudoyuminstall-yenca安裝)查看文件編碼

$encafilename

filename:Universaltransformationformat8bits;UTF-8

CRLFlineterminators

需要說明一點的是,enca對某些GBK編碼的文件識別的不是很好,識別時會出現:

Unrecognizedencoding

文件編碼轉換

1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式

:setfileencoding=utf-8

2.enconv轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下

enconv-Lzh_CN-xUTF-8filename

3.iconv轉換,iconv的命令格式如下:

iconv-fencoding-tencodinginputfile

比如將一個UTF-8編碼的文件轉換成GBK編碼

iconv-fGBK-tUTF-8file1-ofile2

Linux文件名編碼轉換

從Linux往windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由于編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。

在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。

首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:

yum-yinstallconvmv

安裝。

下面看一下convmv的具體用法:

convmv-f源編碼-t新編碼[選項]文件名

常用參數:

-r遞歸處理子文件夾

--notest真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。

--list顯示所有支持的編碼

--unescap可以做一下轉義,比如把%20變成空格

比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:

convmv-fUTF-8-tGBK--notestutf8編碼的文件名

這樣轉換以后"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)。

注意:不要在NTFS和FAT文件系統中使用此命令,否則可能產生意外結果,如果要在Linux中正確的顯示NTFS和FAT的中文件名,可以通過mount參數來解決,具體方法查看一下man手冊。

gbk漢字編碼查詢

gbk漢字編碼的查詢方法如下:

1.

“命”的GBK編碼為:0xC3,0xFC)

2.

GBK編碼表:B00123456789ABCDEFA啊阿埃挨哎唉哀皚癌藹矮艾礙愛隘B鞍氨安俺按暗岸胺案骯昂盎凹敖熬翱C襖傲奧懊澳芭捌扒叭吧笆八疤巴拔跋D靶把耙壩霸罷爸白柏百擺佰敗拜稗斑E班搬扳般頒板版扮拌伴瓣半辦絆邦幫F梆榜膀綁棒磅蚌鎊傍謗苞胞包褒剝B10123456789ABCDEFA薄雹保堡飽寶抱報暴豹鮑爆杯碑悲B卑北輩背貝鋇倍狽備憊焙被奔苯本笨C崩繃甭泵蹦迸逼鼻比鄙筆彼碧蓖蔽畢D斃毖幣庇痹閉敝弊必辟壁臂避陛鞭邊E編貶扁便變卞辨辯辮遍標彪膘表鱉憋F別癟彬斌瀕濱賓擯兵冰柄丙秉餅炳B20123456789AB

END,本文到此結束,如果可以幫助到大家,還望關注本站哦!

返回列表
上一篇:
下一篇: