这几天工作中用到不少字符集,Unicode、utf-8、GB2312等,但是在windows命令行里敲notepad进入文本编辑页面。保存时需要选择编码方式,但是不存在GB,却有ANSI,于是纳闷,回来一查,才恍然大悟:原来在简体中文系统下,ANSI 编码代表 GB2312 编码。 为使计算机支持更 ...
分类:
其他好文 时间:
2020-07-12 16:29:46
阅读次数:
114
1、位(bit) 来自英文bit,音译为“比特”,表示二进制位。位是计算机内部数据储存的最小单位,11010100是一个8位二进制数。一个二进制位只可以表示0和1两种状态(21);两个二进制位可以表示00、01、10、11四种(22)状态;三位二进制数可表示八种状态(23)……。 2、字节(byte ...
分类:
其他好文 时间:
2020-07-12 14:59:04
阅读次数:
125
问题:有时我们用utf-8去接收,结果接收到的是unicode码,这时就需要将unicode转成string列如: <MSG>\r\n<RES>\r\n<RES.1>2020-07-12 10:34:31<\/RES.1>\r\n<RES.2>0<\/RES.2>\r\n<ERR Code=\"00 ...
分类:
其他好文 时间:
2020-07-12 12:35:00
阅读次数:
66
题意 字符串$S$的能量$P(S)$定义为 \[ P(S)=\sum_{i=1}^{n}N_i\times V_i \] $N_i$是满足$S_i=S_j$的下标$j(i<j\le n)$的个数,$V_i$是字符$S_i$的$ASCII$码。 给一个长度为$n$的字符串$s$和一个整数$k$,你可以 ...
分类:
其他好文 时间:
2020-07-11 17:01:48
阅读次数:
54
1:字符集: 一般 主要选择两种: 1:utf8 (看unicode编码区从1 ~ 126就属于传统utf8区,),一般都够用,除非需要存储特殊字符 2:utf8mb4(utf8mb4兼容utf8,且比utf8能表示更多的字符。utf8mb4也兼容utf8 的区,126行以下就是utf8mb4扩充区 ...
分类:
数据库 时间:
2020-07-11 09:25:37
阅读次数:
69
题目复现:https://buuoj.cn/challenges 原理分析: 两个不同编码的Unicode字符可能存在一定的等价性,这种等价是字符或字符序列之间比较弱的等价类型,这些变体形式可能代表在某些字体或语境中存在视觉上或意义上的相似性。 例如baidu.com 和baidu.com 都会被等 ...
分类:
其他好文 时间:
2020-07-11 00:25:36
阅读次数:
125
需求: 1、过滤用户输入中前后多余的空白字符 ' nick2008@email.com ' 2、过滤某windows下编辑文本中的'\r': 'hello world\r\n' 3、去掉文本中的unicode组合符号(音调): tiān xià dì yī 思路: 1、字符串strip(),lstr ...
分类:
其他好文 时间:
2020-07-11 00:07:01
阅读次数:
153
解决:方案1 修改表结构ALTER TABLE `表名` CONVERT TO CHARACTER SET utf8 collate utf8_unicode_ci1方案2 使用 CONVERT 。之前这个表使用的编码不同是有原因的 不能随便更改 于是乎…SELECT d.shopname, c.g ...
分类:
其他好文 时间:
2020-07-10 21:03:12
阅读次数:
85
功能描述: 字符串之间的比较 比较方式: 字符串比较是按字符的ASCII码进行对比 = 返回 0 > 返回 1 < 返回 -1 函数原型: int compare(const string &s) const; //与字符串s比较 int compare(const char *s) const; ...
分类:
其他好文 时间:
2020-07-09 12:34:42
阅读次数:
69