数据库中的 varchar(255) MySQL | ver < 4.1: VARCHAR以字节为单位存储,所以假设全部为常用汉字(UTF-8 3字节编码长度),则VARCHAR(255)共可存放约85个汉字; MySQL | ver >= 4.1: VARCHAR以字符为单位存储,假设输入仍然为常 ...
分类:
数据库 时间:
2019-11-19 11:54:42
阅读次数:
126
Python2和3字符编码的区别 一、字符编码应用之Python 1.1 执行Python程序的三个阶段 (我再强调一遍,执行test.py的第一步,一定是先将文件内容从硬盘读入到内存中) test.py文件内容以gbk格式保存的,内容为: 阶段一:启动Python解释器 阶段二:Python解释器 ...
分类:
编程语言 时间:
2019-11-16 14:21:03
阅读次数:
53
1、字符集与编码 字符集:字符组成的集合,汉字,字母,符号被收录到标准的字符集合 编码:规定每个字符使用一个字节还是多个字节存储,那些字节来存储的规定 术语:字符编码(character encoding),字符映射(character map),字符集(character set)或者代码页(IB ...
分类:
其他好文 时间:
2019-11-16 12:50:07
阅读次数:
102
题意: 输入一个九位整数,输出它的汉字读法(用拼音表示)。 trick: 字符串数组""其实会输出一个空格,而不是什么都不输出,导致测试点0和4格式错误。 代码: #define HAVE_STRUCT_TIMESPEC#include<bits/stdc++.h>using namespace s ...
分类:
其他好文 时间:
2019-11-15 14:28:38
阅读次数:
54
在处理中文数据,经常加入下面的代码: 设置python默认字节流编/解码器按照utf8解码方式,把字节流编/解码为unicode; 具体来说,所起到的作用,可以用下面两个错误来解释: UnicodeEncodeError: 'ascii' codec can't encode characters ...
分类:
编程语言 时间:
2019-11-09 21:38:36
阅读次数:
126
常用的正则表达式 python 非负整数:^\d+$ 正整数:^[0 9] [1 9][0 9] $ 非正整数:^(( \d+)|(0+))$ 负整数:^ [0 9] [1 9][0 9] $ 整数:^ ?\d+$ 非负浮点数:^\d+(\.\d+)?$ 正浮点数 : ^((0 9)+\.[0 9] ...
分类:
其他好文 时间:
2019-11-03 10:43:59
阅读次数:
68
转自:https://www.cnblogs.com/xdyixia/p/9114145.html 1、字符,字符集,字符编码概念 字符:在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息。即一个字符可以是一个中文汉字、一个英文字母、一个阿拉伯数字、一个标点符号等。 字符集: ...
分类:
其他好文 时间:
2019-11-03 10:42:22
阅读次数:
110
1. 当用一个软件(比如Windows记事本或Notepad++)打开一个文本文件时,它要做的第一件事是确定这个文本文件究竟是使用哪种编码方式保存的,以便于该软件对其正确解码,否则将显示为乱码。 一般软件确定文本文件编码方式的方法有如下三种: 检测文件头标识; 提示用户手动选择; 根据一定的规则自行 ...
分类:
移动开发 时间:
2019-11-03 10:30:28
阅读次数:
283
我的工程实践项目为手写汉字识别。用例是关键的需求输入,因此在画用例图前要进行需求识别:确定用例图涉及的系统,Actor,服务(用例)以及它们之间的关联。 << include >> 表示子用例是父用例的一部分,通常强调离开这个特性,父用例无法达成目标或失去意义;<< extend >> 表示子用例是 ...
分类:
其他好文 时间:
2019-11-02 18:14:22
阅读次数:
77
正则表达式基础整理 元字符 代码说明 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 ^ 匹配字符串的开始 $ 匹配字符串的结束 \b 匹配字符串的结束 重复匹配字符 代码说明 * 重复零次或者多次 + 重复一次或者多次 ? 重复零次或者一 ...
分类:
其他好文 时间:
2019-11-02 13:50:36
阅读次数:
84