vim的半字节问题?
时间:2004-07-28
来源:互联网
我使用的vim总是有半字问题, 就是在进行中文编辑是, 删除一次只删除半个字即一个字节, 而换行的地方也常常把一个字劈成两半. 请问应该怎样配制?
另外, 我的gvim的中文显示是: 鼠标所到之处一片狼籍, 请问应该怎么办?
谢谢!
另外, 我的gvim的中文显示是: 鼠标所到之处一片狼籍, 请问应该怎么办?
谢谢!
作者: Chowroc 发布时间: 2004-07-28
/etc/vimrc加上一句:
set encoding=euc-cn
set encoding=euc-cn
作者: hupeng923 发布时间: 2004-07-28
请教什么是euc-cn?
作者: War3Gamer 发布时间: 2004-07-28
引用:
1. Codepage的定义和历史 字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为 * 单字节内码 -- Single-Byte character sets (SBCS),可以支持256个字符编码. * 双字节内码 -- Double-Byte character sets)(DBCS),可以支持65000个字符编码.主要用来对大字符集的东方文字进行编码. codepage 指的是一个经过挑选的以特定顺序排列的字符内码列表,对于早期的单字节内码的语种,codepage中的内码顺序使得系统可以按照此列表来根据键盘的输入值给出一个对应的内码.对于双字节内码,则给出的是MultiByte到Unicode的对应表,这样就可以把以Unicode形式存放的字符转化为相应的字符内码,或者反之,在Linux核心中对应的函数就是utf8_mbtowc和utf8_wctomb. 在1980年前,仍然没有任何国际标准如ISO-8859或Unicode来定义如何扩展US-ASCII编码以便非英语国家的用户使用.很多IT厂商发明了他们自己的编码,并且使用了难以记忆的数目来标识: 例如936代表简体中文. 950代表繁体中文. 1.1 CJK Codepage 同 Extended Unix Coding ( EUC )编码大不一样的是,下面所有的远东 codepage 都利用了C1控制码 { =80..=9F } 做为首字节, 使用ASCII值 { =40..=7E { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3F的ASCII值不一定代表ASCII字符. CP932 Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是, Shift-JIS没有包含JIS X 202中定义的5802个汉字. CP936 GBK 扩展了 EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字)到Unicode (GB13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_CN. CP949 UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在C1中 ) CP950 是代替EUC-TW (CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到. 注意: Microsoft采用以上四种Codepage,因此要访问Microsoft的文件系统时必需采用上面的Codepage . 1.2 IBM的远东语言Codepage IBM的Codepage分为SBCS和DBCS两种: IBM SBCS Codepage # 37 (英文) * # 290 (日文) * # 833 (韩文) * # 836 (简体中文) * # 891 (韩文) # 897 (日文) # 903 (简体中文) # 904 (繁体中文) IBM DBCS Codepage # 300 (日文) * # 301 (日文) # 834 (韩文) * # 835 (繁体中文) * # 837 (简体中文) * # 926 (韩文) # 927 (繁体中文) # 928 (简体中文) 将SBCS的Codepage和DBCS的Codepage混合起来就成为: IBM MBCS Codepage # 930 (日文) (Codepage 300 加 290) * # 932 (日文) (Codepage 301 加 897) # 933 (韩文) (Codepage 834 加 833) * # 934 (韩文) (Codepage 926 加 891) # 938 (繁体中文) (Codepage 927 加 904) # 936 (简体中文) (Codepage 928 加 903) # 5031 (简体中文) (Codepage 837 加 836) * # 5033 (繁体中文) (Codepage 835 加 37) * *代表采用EBCDIC编码格式 由此可见,Mircosoft的CJK Codepage来源于IBM的Codepage. |
作者: aaccdd 发布时间: 2004-07-28
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28