Lucene 4.9 === #基础准备 - 了解常用分词器,选择合适分词器 - 读取文件编码要正确,非TXT文档需要进行特殊处理或特殊工具读取后才进行分词处理 - TextField内容不能保存过长,最大长度是32766个字节 #StringFie...
分类:
其他好文 时间:
2014-07-22 08:31:36
阅读次数:
192
Mysql编码问题 在php页面可以向mysql插入英文字符,但就是不能插入中文字符,在cmd客户端也可从插入,这是困扰我两天的问题。在网上找了很多资料,最终确定了是字符编码这个地方出现了问题,首先要想通过php页面向mysql数据库插入中文字符,则必须要文件编码、代码的编码和mysql的编码保持一...
分类:
数据库 时间:
2014-07-18 16:06:43
阅读次数:
212
在开发过程中,可能会遇到文件编码的转换,虽然说开发工具eclipse可以转换编码,但是有的情况却很不方便。比如,原来文件本身的编码是GBK,现在要转换成UTF-8,如果直接在eclipse中把文件编码修改成UTF-8,恭喜你,是乱码,因为不能直接从GBK到UTF-8进行转换,这时就需要我们手动的来转换编码。下面是一个文件编码转换的工具类。
package com.mikan.stuff;
im...
分类:
编程语言 时间:
2014-07-18 11:20:59
阅读次数:
218
[AS3]as3用ByteArray来对SWF文件编码加密实例参考,简单来说,就是将 swf 以 binary 的方式读入,并对 ByteArray 做些改变,再重新存成 swf 档。这个作业当然也可能应该是由 Server 进行步骤一,随便建立一个 swf 当作要被加密的内容档案,怎么做不管,假设...
分类:
其他好文 时间:
2014-07-07 00:50:00
阅读次数:
348
linux的字符界面默认不支持中文,所以你显示中文和编辑中文往往会是乱码,今天小研究了一下。首先要明白的问题是,乱码问题其实最本质就是编码和解码不符合。 比如你往linux上传了一个中文文件,但是用cat 或者 more去看的时候发现是乱码。这是因为你的中文文件编码可能是utf-8,可能是GBK等等...
分类:
系统相关 时间:
2014-07-06 18:51:55
阅读次数:
250
随着各种ERP系统的使用,各种企业报表,文件,数据的导出,难免会遇到文件编码不兼容的问题,打开的文件全部是乱码,怎么处理?今天在工作中碰到一例从国税系统导出来的数据,全部是乱码,2个用户,在另一个用户的计算机上没啥问题,在第二个用户计算机上就会存在乱码。很诧异。..
分类:
其他好文 时间:
2014-06-27 07:03:06
阅读次数:
181
有一个UTF-8编码的文本文件,用FileReader读取到一个字符串,然后转换字符集:str=new String(str.getBytes(),"UTF-8");结果大部分中文显示正常,但最后仍有部分汉字显示为问号!public static List getLines(String fileN...
分类:
其他好文 时间:
2014-06-21 10:46:29
阅读次数:
276
在zendstudio ide中,导入一个工程后,发现工程里面很多的文件都打上了红色的叉叉,打开这些文件一看,发现只要是有汉字存在的文件,都出现了乱码。按住alt+enter发现,该文件的编码默认为gbk,当你将当前文件编码改为utf8,这个文件就正常了。但是工程中存在很多这样的文件,总不至于一个....
分类:
其他好文 时间:
2014-06-18 23:24:19
阅读次数:
313
新建的properties文件的默认编码是iso-8859-1,所以想读写中文数据,都要转码...
分类:
其他好文 时间:
2014-06-15 15:28:52
阅读次数:
168