1、Delphi 的 Utf-8 转换 - findumars - 博客园.html https://www.cnblogs.com/findumars/archive/2013/12/26/3492891.html 新版的 Delphi 應該不用這麼麻煩, 據說只要直接在 AnsiString, ...
基本概念 字符[character] 字符代表了字母表中的字符,标点符号和其他的一些符号。在计算机中,文本是由字符组成的。 字符集合[character set] 由一套用于特定用途的字符组成,例如支持西欧语言的字符集合,支持中文的字符集合。字符集合只定义了符号和他们的语意,其实跟计算机没有直接关系 ...
分类:
其他好文 时间:
2017-12-21 22:58:02
阅读次数:
232
NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。 ...
分类:
编程语言 时间:
2017-12-21 17:22:03
阅读次数:
232
tcpdump命令 是一款抓包,嗅探器工具,它可以打印所有经过网络接口的数据包的头信息,也可以使用 w选项将数据包保存到文件中,方便以后分析 语法 tcpdump(选项) 选项 a:尝试将网络和广播地址转换成名称; c:收到指定的数据包数目后,就停止进行倾倒操作; d:把编译过的数据包编码转换成可阅 ...
分类:
系统相关 时间:
2017-12-16 22:05:15
阅读次数:
162
声明Python源码编码方式 在程序的开始写上:# -*- coding: utf-8 -*- # -*- coding: gbk -*- 注: decode是将其它编码方式转换成unicode编码 encode是将unicode编码转换成其它编码方式,如 decode('gbk'): gbk > ...
分类:
编程语言 时间:
2017-12-15 23:32:49
阅读次数:
159
一、随着前端的快速发展,各种技术不断更新,但是前端的安全问题也值得我们重视,不要等到项目上线之后才去重视安全问题,到时候被黑客攻击的时候一切都太晚了。 二、本文将讲述前端的六大安全问题,是平常比较常见的安全问题,当然如果还有其他必要重要的安全问题大家可以帮忙补充: 1、XSS(Cross-Site ...
分类:
其他好文 时间:
2017-12-14 21:18:05
阅读次数:
117
pandas 用法持续总结: 问题1: 需要把表中部分column转换成列,每一个column对应第一列的编码。 方法:melt(...) 参数:df.melt(id_vars=['A'], value_vars=['B']) 说明:指定ID字段,本例中id_vars是第一列编码。 转换前 转换后: ...
分类:
编程语言 时间:
2017-12-13 02:11:40
阅读次数:
207
在使用jquery.qrcode.js这个插件生成二维码的时候发现并不能识别中文。 原因在于:jquery-qrcode是采用charCodeAt()方式进行编码转 换的。 而这个方法默认会获取它的Unicode编码,如果有中文内容,在生成二维码前就要把字符串转换成UTF-8,然后再生成二维码。 解 ...
分类:
Web程序 时间:
2017-12-11 22:13:32
阅读次数:
236
编码:decode:解码:把一种编码转换成unicodeencode:编码:把unicode转换成其他编码gbk -> utf-8 ? xxgbk -> unicode -> utf-8gbk.decode(‘gbk’).encode('utf-8')例子:翻译水平汉语 -> 英语 英语 -> 汉语 ...
分类:
Web程序 时间:
2017-11-30 23:26:23
阅读次数:
241
常常在Linux中操作windows下的文件时,会遇到乱码的情形。常见的比如在Visual Studio 中写的C\C++程序需要放到Linux主机上编译,而程序的中文注释则显示为乱码,比较严重的是由于编码原因,linux上的编译器报错。 这是由于Windows中默认的文件格式是GBK(gb2312... ...
分类:
其他好文 时间:
2017-11-30 13:39:13
阅读次数:
175