最近写了一个小工具,主要实现自动搜索指定路径下所有文本文件内容,并替换指定字符串,记录下几个容易犯错误的地方。
1,fread读出来的buffer存放到string里,如果要搜索指定的字符串,比如“中华人民共和国”,首先要确定文件的编码格式是什么?根据文件的编码格式,对目标串进行编码转换后,才能用string.find去进行查找。
而如何判断文件的编码格式呢,windows下文本文件一般有两种...
通用规范
文件编码
所有文件都使用无 BOM 的 UTF-8 编码。
缩进
使用4个空格缩进。
Tab 在不同的操作系统下长度可能不同,为了代码在任何情况下都缩进一致要使用空格。
在所有的IDE工具中,都可以设置1个Tab键转换成4个空格,这样就可以敲一个Tab键输出4个空格。
注释
书写注释,方便维护。
注释内容两边要各有一个空格。...
分类:
Web程序 时间:
2015-04-22 00:37:44
阅读次数:
166
iconv -f GBK -t UTF-8 MyView_utf8.java > MyView_utf8.java-f 是从-t 是去注意MyView_utf8.java > MyView_utf8.java 前后不能一样
分类:
系统相关 时间:
2015-04-21 22:28:00
阅读次数:
200
linux相关2008-10-0710:46阅读1392评论0字号:大大中中小小如果你需要在Linux中 操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是 UTF-8。下面介绍一下,在Linux中如何查看...
分类:
系统相关 时间:
2015-04-11 23:58:28
阅读次数:
319
在文件上传之前,我们总想预览一下文件内容,或图片样子,html5 中FileReader正好提供了2种方法,可以在不上传文件的情况下,预览文件内容。图片预览:readAsDataURL(file);文件预览:readAsText();(必须保证文件编码格式与代码编码格式相同,预览中文才不会乱码) ....
文件是永久存储在磁盘等介质上的一主数据。文件的类型分类,按存储方式及结构,可分为顺序文件和随机文件;按文件数据的组织格式,可分为ASCII 文件 和 二进制文件。文件编码: 编码是一个将一组Unicode 字符串转换成一个字节序列的过程,解码是一个反向操作过程,将一个编码字节序列转换成一组Uni.....
假设需要将所有afish目录下的php文件,编码从gb2312转到utf8cd afishfind ./ -type f -name “*.php”|while read line;doecho $lineiconv -f GB2312 -t UTF-8 $line > ${line}.utf8mv...
分类:
系统相关 时间:
2015-04-07 22:58:15
阅读次数:
249
网站出现一个error: err_content_decoding_fail.查了一下,应该是文件编码出问题了。但这两天都很小代码级别的改动,编码的问题一般都是会在覆盖文件的时候才出现。网站用到浏览器缓存的地方是在w3tc里配置的,先去试着关掉。到分站点与管理站点查看,关掉也没用,但w3tc提示有错...
分类:
其他好文 时间:
2015-04-07 09:34:50
阅读次数:
184
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题,Eclipse提供了灵活的设置文件编码格式的选项,我们可以通过设置编码 格式解决乱码问题。在Eclipse可以从几个层面设置编码格式:Workspace、Project、Content Type、File 本文以Eclipse...
分类:
系统相关 时间:
2015-04-06 06:19:58
阅读次数:
134
第一种常见情况
一般来说只要jsp,js文件编码格式一致就可以解决中文乱码的问题
一直以来都是用utf-8的编码方式,包括jsp页面的pageEncoding
如果还有乱码问题,需要考虑一下发布的web应用服务器是什么,我遇到的情况是在开发环境中文乱码,部署到测试机就没有中文乱码,经过反复测试发现其最大区别是
开发环境是用jetty,测试机tomcat
以此方...
分类:
Web程序 时间:
2015-04-03 15:15:31
阅读次数:
399