1 import xpinyin 2 s = xpinyin.Pinyin() #一个实例化,以后了解 3 print(s.get_pinyin('小小军')) #get_pinyin方法,转出来的拼音,每一个汉字之间默认‘-’连接 4 print(s.get_pinyin('小小军',''))#传... ...
分类:
其他好文 时间:
2018-10-02 17:31:32
阅读次数:
706
将一个汉字序列切分成一个一个单独的词 安装分词模块: pip install jieba 分词在特殊场合的实用性,调用add_word(),把我们要添加的分词加入jieba词库 高效方法:将txt保存的词库一次性导入用户词库中 1、搭建语料库 2、介绍分词来自哪篇文章 使用数据框的遍历方法,得到语料 ...
分类:
编程语言 时间:
2018-10-01 22:12:43
阅读次数:
239
1,平常我们写js正则规则的时候,一般是这样写: 然而,这样写的话,如果abc是一个变量这样就不行,我们需要下面这种写法: 2, 搜索关键字,让关键字标红; ...
分类:
Web程序 时间:
2018-09-30 18:21:37
阅读次数:
394
《计算机组织与体系结构》的难点之一——运算方法和运算器 1.数据的表示方法(简单介绍) 计算机中使用的数据可分成两大类: (1)符号数据:非数字符号的表示(ASCII、汉字、图形等) (2)数值数据:数字数据的表示方式(定点、浮点) 对于十进制与其他进制之间的相互转换方法: 10进制和R进制之间的转 ...
分类:
其他好文 时间:
2018-09-30 18:17:38
阅读次数:
204
//string1.cpp #include int main() { using namespace std; char dog[4]={'d','o','g'}//这是char数组,也即字符数组 char dog1[4]={'d','o','g','\0'}//这是字符串 char sex[8]... ...
分类:
编程语言 时间:
2018-09-30 12:51:26
阅读次数:
141
对于编译出的程序,在 cmd 和 power shell 运行时都不能正确显示汉字。 网上查,可以再命令窗口修改: 1、打开CMD.exe命令行窗口 2、通过 chcp命令改变代码页,UTF 8的代码页为65001 chcp 65001 执行该操作后,代码页就被变成UTF 8了。 在当前窗口的确可以 ...
分类:
其他好文 时间:
2018-09-29 20:21:11
阅读次数:
102
字典是一种非常有用的数据类型,就像我们上学用到的字典,通过笔画和拼音来查找对应汉字的详细解释。 info = { 'stu101':"James", 'stu102':"Alex", 'stu103':"Paul", 'stu104':"Mark" } 字典是无序的 字典的key必须是唯一的,没有重 ...
分类:
编程语言 时间:
2018-09-28 22:11:37
阅读次数:
195
java中一个char型的数据(也就是一个字符)占两个字节。而Java中常用的字符包括数字、英文字母、英文符号、中文汉字、中文符号等,若在字符串中包含里面的多种字符,它们是否都占两个字符呢?答案是否定的。public class CharBytes { public static void main... ...
分类:
编程语言 时间:
2018-09-28 17:39:06
阅读次数:
175
一、IK简介 ElasticSearch(以下简称ES)默认的分词器是标准分词器Standard,如果直接使用在处理中文内容的搜索时,中文词语被分成了一个一个的汉字,因此引入中文分词器IK就能解决这个问题,同时用户可以配置自己的扩展字典、远程扩展字典等。 二、IK安装 1、首先前往GitHub下载安 ...
分类:
其他好文 时间:
2018-09-28 12:50:25
阅读次数:
181
引言:最近在弄一个Vue的入门学习用项目,期间有用到 JavaScript 将中文转成拼音这个功能,这可真是为难人。想到了编码,但是没搞明白怎么将编码和拼音字母啥的联系起来。后来上网查询了才知道。声母韵母搭配的拼音(早就忘记声母韵母了)和中文可以对应起来, 比如: 啊的Unicode编码是 u554 ...
分类:
编程语言 时间:
2018-09-27 01:38:31
阅读次数:
4066