有时候在myeclipse或者eclipse中打开properties文件时会发现其中的中文都是乱码。这是由于当前的properties文件编码格式不支持汉字造成的。当这种情况发生时,我们可以按照以下两种方式更改文件的编码格式即可。方法一可以一次性更改所有项目的properties文件编码格式。方法 ...
分类:
系统相关 时间:
2017-12-14 22:57:44
阅读次数:
316
eclipse中打开含有汉字的properties文件,显示乱码; 保存前为: user.name=对呀 保存后: user.name=\u5BF9\u5440 properties文件编码为ISO8859 1,其实这不是乱码,只是将汉字转化为了ascii字符 我们仔细观察就会发现,字符都是\uxx ...
分类:
系统相关 时间:
2017-12-14 15:52:18
阅读次数:
176
1.字符编码 ASCII码:一个byte=8位,128位中表示英文字母大小写、罗马字符等 GB2312、GBK、GB18030(中国自己的)表示汉字,早起一般移动设备 支持到GB2312 Unicode:万国码,2个byte=16位表示所有字符 UTF-8:可动态变化长度的编码。存英文1byte,中 ...
分类:
编程语言 时间:
2017-12-14 14:54:59
阅读次数:
132
写在前面 元旦三天在家闲着无事,就看了看Linq的相关内容,也准备系统的学习一下,作为学习Linq的前奏,还是先得说说Lambda与匿名方法的知识点。也算是对知识点的查漏补缺吧,也许你会说这没啥大不了的,项目中都在用,但是有些知识,你回头在查看的时候,总会有那么点不一样的收获,这点我是感同身受的,我 ...
前不久看到有的朋友实现对商品名称拼音的录入,发现他的实现方式是手动输入的,―_―#、同志们,福利来了! 本文刚发布时,只写了一个实现方式,使用的是微软的语言包,但是对多音字的效果不怎么理想,甚至个别字会出现很诡异的错误,因此,现在扩展另一个方法,手动实现。 方式一、使用微软语言包 微软为了开发者实现 ...
认识常见编码 GB2312是中国规定的汉字编码,也可以说是简体中文的字符集编码 GBK 是 GB2312的扩展 ,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名 cp936:中文本地系统是Windows中的cmd,默认codepage是CP936,cp936就是指系统里第936号编码格式 ...
分类:
编程语言 时间:
2017-12-13 23:45:11
阅读次数:
282
我们知道,汉字在屏幕上是由于一系列像素点组成的,就好比打印机打印文本一样,上面的字符都是由 一系列的墨点组成的。我们可以选择汉字的字形,大小等,这全都是通过对像素点的操作,来达到这一效果的。 汉字的字形码: 汉字字型码又称汉字字模,用于汉字在显示屏或打印机输出。汉字字型码通常有两种表示方式:点阵和矢 ...
分类:
其他好文 时间:
2017-12-13 15:04:08
阅读次数:
123
主要是pypinyin 包,官网: http://pypinyin.readthedocs.io/zh_CN/master/index.html jieba包,主要是用来分词的,我之前的博文有介绍:http://www.cnblogs.com/dahu-daqing/p/7491343.html 官 ...
分类:
编程语言 时间:
2017-12-12 17:36:17
阅读次数:
274
一、小数 将所有不是数字和小数点的置空,将第一个小数点变为$#$,将所有小数点置空,将$#$变为小数点,将首位小数点置空 二、只能是字母数字和汉字 三、只能是数字 四、日期格式 ...
分类:
其他好文 时间:
2017-12-11 17:11:43
阅读次数:
149
本文为博主原创,未经允许不得转载: 在解析properties文件中的汉字时,在java代码中解析得到的是一个乱码字符,形如图下: 导致乱码原因:由于在jdk中,默认为gbk编码方式进行编码盒接收的,所以导致了乱码, 避免方法,对字符进行utf-8编码,编码方法如下: String value = ...
分类:
其他好文 时间:
2017-12-11 16:12:41
阅读次数:
284