lyjinger 2012-02-02
$mail_title=iconv("UTF-8","GBK","人人3G数据统计系统");
查看文件编码file命令
filetest.sql
test.sql:UTF-8Unicodetext,withescapesequences
功能说明:辨识文件类型。
语 法:file[-beLvz][-f<名称文件>][-m<魔法数字文件>...][文件或目录...]
补充说明:通过file指令,我们得以辨识该文件的类型。
参 数:
-b 列出辨识结果时,不显示文件名称。
-c 详细显示指令执行过程,便于排错或分析程序执行的情形。
-f<名称文件> 指定名称文件,其内容有一个或多个文件名称呢感,让file依序辨识这些文件,格式为每列一个文件名称。
-L 直接显示符号连接所指向的文件的类别。
-m<魔法数字文件> 指定魔法数字文件。
-v 显示版本信息。
-z 尝试去解读压缩文件的内容。
一、利用iconv命令进行编码转换文件内容编码转换
iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件.
用法:iconv[选项...][文件...]
有如下选项可用:
输入/输出格式规范:
-f,--from-code=名称原始文本编码
-t,--to-code=名称输出编码
信息:
-l,--list列举所有已知的字符集
输出控制:
-c从输出中忽略无效的字符
-o,--output=FILE输出文件
-s,--silent关闭警告
--verbose打印进度信息
-?,--help给出该系统求助列表
--usage给出简要的用法信息
-V,--version打印程序版本号
例子:
iconv-futf-8-tgb2312aaa.txt>bbb.txt
这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件.
二、文件名编码转换
现在用linux,原来在windows里的文件都是用GBK编码的.copy到linux下是乱码,文件内容可以用iconv来转换可是好多中文的文件名还是乱码,找到个可以转换文件名编码的命令,就是convmv.
convmv命令详细参数
例如
convmv-fGBK-tUTF-8*.mp3
不过这个命令不会直正的转换,你可以看到转换前后的对比.如果要直正的转换要加上参数--notest
convmv-fGBK-tUTF-8--notest*.mp3
-f参数是指出转换前的编码,-t是转换后的编码.这个千万不要弄错了.不然可能还是乱码哦.还有一个参数很有用.就是-r这个表示递归转换当前目录下的所有子目录.
1. 首先,我得知道这个文件具体采用的是什么样的编码,如果是ISO-8859我将会把它转成UTF-8,其他的ASCII这些都先不做处理,这里可以使用file filename或者是enca iconv