Jmeter数据库正常连接,可以正常查询数据,但是当条件为汉字是查询条件无效; 需要在连接配置的Database URL中添加&characterEncoding=utf-8即可; ...
分类:
数据库 时间:
2019-01-03 14:06:49
阅读次数:
234
汉语分词中的基本问题:分词规范,歧义的切分和未登录词的识别 分词规范:(一般也就是指“词”的概念的纠缠不清的问题,),一方面来源于 单字词和词素之间的划界,另一方面就是词和短语(词组)的划界问题 歧义切分问题: 交集型切分歧义:汉字串AJB 其中 AJ,JB同时为词,此时的J 称作交集串 例如:结合 ...
分类:
其他好文 时间:
2019-01-01 15:26:12
阅读次数:
236
``` <?php
/** * PHP 汉字转拼音 [包含20902个基本汉字+5059生僻字] * @author 楼教主(cik520@qq.com) * @version v1.2 * @note 请开启 mb_string 扩展 */
/* 测试用例
$start_time = microt... ...
分类:
Web程序 时间:
2018-12-31 20:26:25
阅读次数:
34856
python基础数据类型考试题 考试时间:两个半小时 满分100分(80分以上包含80分及格) 一,基础题。 1. 简述变量命名规范(3分) 答:(1) 变量为数字,字母以及下划线的任意组合,且不能以数字开头(2) 变量名不宜过长,要具有可描述性 (3) 变量名不能为中文和汉字拼音(4) 默认全大写 ...
分类:
编程语言 时间:
2018-12-29 01:04:40
阅读次数:
229
demo1 Ubuntu16,Python2,且安装过中文语言什么的。 #!usr/bin/python# -*- coding: utf-8 -*-a = "我就是中文啊"print("a:",a)1234 输出就是: ('a:', '\xe6\x88\x91\xe5\xb0\xb1\xe6\x9 ...
分类:
编程语言 时间:
2018-12-28 13:31:30
阅读次数:
302
mysql,发现都是乱码,一堆问号,如下图: 查看mysql编码 需要修改mysql编码,打开/etc/my.cnf 文件 在下边添加如下行 修改后的/etc/my.cnf如下: 再查看如下 已经修改过来了,重启, 再继续查询,能正常显示中文汉字,搞定。 ...
分类:
数据库 时间:
2018-12-27 20:24:50
阅读次数:
197
汉字 word 字节 byte 位 bit 字长是指字的长度 1字节=8位(1 byte = 8bit)1汉字=2字节(1 word = 2 byte) (数据库内储存所占字节可能不一样,MySQL可能占2byte,Oracle可能占3byte) 一个字节的字长是8一个汉字的字长为16 bps 是 ...
分类:
其他好文 时间:
2018-12-27 18:57:21
阅读次数:
127
字符编码:ASCII:占一个字节,只支持英文GBK2312:占两个字节,支持6700+汉字GBKGB2312的升级版:支持21000+汉字Unicode:2-4个字节Unicode作用:直接支持全球所有语言,每个国家可以不再使用之前自己的旧编码,直接使用unicode包含了跟全球所有国家编码的映射关系Unicode解决了字符于二进制的对应关系,由于Unicode对比ASCII编码占用字节增加一倍,
分类:
编程语言 时间:
2018-12-26 16:49:41
阅读次数:
164
字符编码:ASCII:占一个字节,只支持英文GBK2312:占两个字节,支持6700+汉字GBKGB2312的升级版:支持21000+汉字Unicode:2-4个字节Unicode作用:直接支持全球所有语言,每个国家可以不再使用之前自己的旧编码,直接使用unicode包含了跟全球所有国家编码的映射关系Unicode解决了字符于二进制的对应关系,由于Unicode对比ASCII编码占用字节增加一倍,
分类:
编程语言 时间:
2018-12-26 15:52:05
阅读次数:
191
1.常见的中文 \u4e00-\u9fbb 和 \u4e00-\u9fa5 (不包含生僻字) 2.比较广泛的中文汉字。(包含了咱们需要的生僻字 和 不需要的很多字符 比如 中文句号分号逗号、书名号 等等) \u2E80-\uFE4F 3.CJK标点符号 范围:\u3000-\u303F 参考地址:h ...
分类:
其他好文 时间:
2018-12-26 12:54:59
阅读次数:
606