论坛
门户
内部优惠
喜欢
话题
VIP会员
搜索
新浪微博
登录
注册
100%
100%
首页
>
操作系统
>
linux技巧
>
linux下将中文文件名文件cp到windows目录下后文件...
回复
« 返回列表
灯火互联
管理员
注册日期
2011-07-27
发帖数
41778
QQ
火币
41290枚
粉丝
1086
关注
100
加关注
写私信
打招呼
阅读:
1662
回复:
0
linux下将中文文件名文件cp到windows目录下后文件名乱码问题的解决
楼主
#
更多
只看楼主
倒序阅读
发布于:2012-10-11 14:49
保存
100%
100%
[]
1
linux中,我的LC_ALL环境是zh_CN.gbk。
当我把中文文件名文件cp到windows的fat32盘下后,重起进入windows后发现文件名全是乱码。
首先
google
,baidu了下,发现都推荐用convmv,这个工具是用perl编写的,确实非常好用的工具,不过在我这里它不适合。
----------------------------------我是华丽的分割线---------------------------------
还是拿具体例子来说话,比如说文件,政治.txt,先说下造成乱码的根本原因,在windows下用winhex查看后,发现,
那些文件名确实是gbk编码,只不过,编码给分开了。
政治,gbk编码 D5FE D6CE ,可是在硬盘上存储的时候却变成了,D500 FE00 D600 CE00。就算没有多出这些00,我自己手动
改成 D5FE D6CE也不可以,因为windows下用的是unicode编码。
----------------------------------我是华丽的分割线---------------------------------
尝试下在linux中用convmv把gbk转成unicode看看,不过之前,先用hexedit看下。
无法转换成unicode,ucs-2le或者utf-16le,因为linux不支持,这个编码的文件名...
结果发现,hexedit不能看文件名,它只是看内容的。
----------------------------------我是华丽的分割线---------------------------------
从linux再在ntfs下面写个文件名看看,是不是也是乱码。
这个发现不是乱码,并且用这个方法成功解决问题。
解决方法:把乱码的文件和文件夹,在linux下,从fat32盘,cp到/root,然后再mv到ntfs盘,就ok了~。
----------------------------------我是华丽的分割线---------------------------------
问题总结:
自己费了好多时间,10几个小时,研究怎么在fat32上面恢复中文,除了手工自己修改外,
在linux下面用convmv怎么都不行。因为linux内置支持utf-8,可是不支持utf-16。
所以在最后执行rename 操作时,识别不了utf-16的文件名而报错。
不过,倒是因为这个问题,我对编码的各种方式和区别,还有转化方法,有了更好的认识~
----------------------------------我是华丽的分割线---------------------------------
原因分析:
在挂载 我的fat32盘时,mount设置了编码方式为gbk. ntfs没有发现用什么设置,
难道这个是原因?再进入linux自己研究下。
喜欢
0
评分
0
最新喜欢:
淘宝天猫隐藏优惠券地址
回复
100%
发帖
回复
« 返回列表
普通帖
您需要登录后才可以回帖,
登录
或者
注册
100%
返回顶部
关闭
最新喜欢