问题描述: 已知字符出现的概率,如何设计为这些字符设计一定长度的位串,使得位串平均长度最短. 前缀码是指,对字符集进行编码时,要求字符集中任一字符的编码都不是其它字符的编码的前缀,而最优前缀码是指平均码长最小的前缀编码。 问题解析: 数据结构:二叉树 哈夫曼树的性质: 1:一共有2n-1个节点,其中 ...
分类:
编程语言 时间:
2020-05-13 09:47:54
阅读次数:
99
字符集选择: 在国内正常都是用【UTF-8】 排序选择:排序一般分为两种:utf_bin和utf_general_cibin 是二进制, a 和 A 会别区别对待. utf8_general_ci 【不区分大小写】,这个你在注册用户名和邮箱的时候就要使用。 utf8_general_cs 【区分大小 ...
分类:
数据库 时间:
2020-05-12 20:44:36
阅读次数:
140
03.常见函数 调用方法: 分类: 1. 单行函数 如:concat、length、ifnull、is null等 1. 字符函数 \ length函数——返回当前参数的字节数 注:若字符集使用的是gbk则一个汉字占2个字节,若是utf8则为3个字节 \ concat函数——拼接字符 \ upper ...
分类:
其他好文 时间:
2020-05-12 16:57:36
阅读次数:
52
1.首先检查 请求编码和后台接受编码是否一致,如果在查看结果树中 请求的中文不是乱码 而添加到后台程序是乱码 一般都是请求和接受编码不一致造成的 2.如果请求是get 请求中有中文 Content encoding 添加任何编码或不填写 均不影响 3.如果是post 请求中有中文 Content e ...
分类:
其他好文 时间:
2020-05-12 14:05:40
阅读次数:
75
字符集 创建文本文件默认使用ANSI,就是系统默认编码方式,中文window系统默认使用GBK编码方式 1. 字节 这是最基本的概念,字节是计算存储容量的一种计量单位,我们知道计算机只能识别1和0组成的二进制位,一个数就是1位(bit),为了方便计算,我们规定8位就是一个字节 2. 字符 字符和字节 ...
分类:
其他好文 时间:
2020-05-12 13:40:40
阅读次数:
59
HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。 ISO-8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 7 比特 ASCII。 ISO-8859-1 的较高部分(从 160 到 255 之间的代码)全都有实体名称。 这些符号中的大多数都可以在不进行实 ...
分类:
Web程序 时间:
2020-05-10 17:35:43
阅读次数:
113
HTML 字符集 如需正确地显示 HTML 页面,浏览器必须知道使用何种字符集。 万维网早期使用的字符集是 ASCII。ASCII 支持 0-9 的数字,大写和小写英文字母表,以及一些特殊字符。 完整的 ASCII 参考手册 由于很多国家使用的字符并不属于 ASCII,现代浏览器的默认字符集是 IS ...
分类:
Web程序 时间:
2020-05-10 17:05:30
阅读次数:
89
Stream 对象 (ADO version 2.5) ADO Stream 对象用于读写以及处理二进制数据或文本流。 Stream 对象可通过三种方法获得: 通过指向包含二进制或文本数据的对象(通常是文件)的 URL。此对象可以是简单的文档、表示结构化文档的 Record 对象或文件夹。 通过将 ...
分类:
其他好文 时间:
2020-05-10 16:42:33
阅读次数:
73
/// /// 国密SM2算法(ECC算法)加密器 /// 签名部分采用SM3算法进行摘要计算 /// public class Sm2Encryptor { /// /// SM2算法默认用户ID,目前开放平台不会使用非默认用户ID /// public const string DefaultU ...
分类:
编程语言 时间:
2020-05-10 01:12:12
阅读次数:
216
spark sql使用自己封装的livy 引擎执行时有丢失数据情况。排查发现livy session页面中的sql有中文乱码。 之后在livy 源码中未找到相关序列化指定字符集的代码。回头排查自己的代码 修改完毕后重新执行 观察livy session中的sql。 果然乱码没了,执行结果集跟spar ...
分类:
Web程序 时间:
2020-05-09 16:39:29
阅读次数:
91