1,字符编码在Java程序的开发中最常见的是ISO8859-1,GBK/GBK2312,unicode,UTF编码.ISO8859-1:属于单字节编码,最多只能表示0-255的字符范围,主要在英文上应用.GBK/GB2312:中文的国际编码,专门用来表示汉字,是双字节编码,如果在此编码中出现中文,则...
分类:
编程语言 时间:
2014-07-22 23:15:12
阅读次数:
402
$dom?=?new?DOMDocument?(?‘1.0‘,?‘gbk‘?);
????$dom->formatOutput?=?true;
????$comment_str?=?‘?file?create?time:?‘?.?date(‘Y-m-d?H:i:s‘,?time())??.?‘?by?tree....
分类:
Web程序 时间:
2014-07-22 08:34:33
阅读次数:
237
如果你需要在linux下面用到windows下的文件,拷贝上去后经常发现中文显示乱码。。原因是Windows中默认的文件格式是 GBK(gb2312),而Linux一般都是UTF-8。比较繁琐的方法是在windows下用程序把内容转换为utf-8编码...
windows使用gbx(gb2312,gbk,gb18030我也不知道是哪个)对文件名及文件路径进行编码保存。打开文件的函数中使用诸如open(filename.encode(‘gbk‘))可以很好的解决。 #coding:utf8
if __name__ == ‘__main__‘:
...
分类:
编程语言 时间:
2014-07-21 10:16:35
阅读次数:
285
父页面代码: <%@?page?contentType="text/html;?charset=GBK"%>
<html>
<head>
<meta?http-equiv="Content-Type"?content="text/html;?charset=GBK"?/>
<title>new_page_title</title>
<script?type="t...
分类:
Web程序 时间:
2014-07-21 10:09:02
阅读次数:
282
PHP判断字符串是否为中文(或英文)的方法,除了正则表达式判断和拆分字符判断字符的值是否小于128外还有一种比较特别的方法。使用php中的mb_strlen和strlen函数判断方法比较简单:分别使用以上两个函数以当前编码测出字符的返回值,然后比较返回值。返回值相等的为纯英文、纯数字、英数混排;返回...
分类:
Web程序 时间:
2014-07-21 10:02:08
阅读次数:
275
处理平台:linux
1. 中文编码
中文字符常见的编码方式有:gbk, gb2312, gb18030和utf-8。这些都是内码,即字符存储在计算机中的编码方式。
gb2312编码由国家标准总局于1980制定,共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄西里尔字母在内的682个字符。在gb2312编码下,汉字...
分类:
编程语言 时间:
2014-07-19 02:46:06
阅读次数:
937
#coding=gbk'''Created on 2014-5-7'''import os.pathinputPath = './input.txt'outPath = './out.txt'bufferSize = 10inputFile = open(inputPath, 'rb')outFil...
分类:
编程语言 时间:
2014-07-18 20:34:41
阅读次数:
246
最近做了一个项目需要把订单的信息显示出来,并且能够把相关信息放到一个.csv 文件中,下载到浏览器。首先我要说明的是.csv 文件,PHP 有专门的函数去解析该类型的文件,相关函数大家可以去官网查看。注意.csv 文件内容的编码格式是gbk格式的,所以有必要对字符格式进行转码。文件的样式如下。
...
分类:
Web程序 时间:
2014-07-18 11:28:48
阅读次数:
308
在开发过程中,可能会遇到文件编码的转换,虽然说开发工具eclipse可以转换编码,但是有的情况却很不方便。比如,原来文件本身的编码是GBK,现在要转换成UTF-8,如果直接在eclipse中把文件编码修改成UTF-8,恭喜你,是乱码,因为不能直接从GBK到UTF-8进行转换,这时就需要我们手动的来转换编码。下面是一个文件编码转换的工具类。
package com.mikan.stuff;
im...
分类:
编程语言 时间:
2014-07-18 11:20:59
阅读次数:
218