目录 1.中文语料常常遇到编码问题,将任意字符集文件转为utf-8编码 2.将unlabel文件夹中的所有.txt文件合并,每个文件之间空一行 3.随机抽取.txt文件中的60%,20%,5% 4.将已经分好词的文件去掉空格(正则),恢复成文件原来的样子 5.读取excel文件转换成.json文件 ...
分类:
其他好文 时间:
2021-06-04 18:46:36
阅读次数:
0
列表 优点: list可以承载任意数据类型,并且可以存储大量数据 python常用的容器型数据类型。java:数组 列表是有序的,可索引,切片(步长)。 列表可以相加,相乘 缺点: 列表数据关联性不是很强 列表查询速度比较慢 ## 列表的创建 方式一: s1=[123,'qwe',[1,2,3]] ...
分类:
其他好文 时间:
2021-06-04 18:46:14
阅读次数:
0
元组 只读列表(没有增删改,只能读),可以存储大量的数据,可以索引,切片(步长) 经常用于一些不想被别人改动的数据,元组里的元素如果有列表,列表里的元素可以被修改 元组的拆包,分别赋值 元组拆包赋值 a,b=(1,2) #必须与之对应多一个少一个都不行 print(a,b) 元组补充 当元组中只有一 ...
分类:
其他好文 时间:
2021-06-04 18:44:02
阅读次数:
0
线性查找详解 说明 线性查找是最简单的查找算法,即遍历一次数组,将要查找的元素和数组中的所有元素一一比对 如果找到该元素,则返回该元素对应的索引,否则返回-1表示没有找到 线性查找不要求数组是有序的,但是遍历数组耗时较多 一般情况下不建议使用 源码 /** * 线性查找 * 如果在数组中找到该值,则 ...
分类:
其他好文 时间:
2021-06-04 18:43:49
阅读次数:
0
* Official English Documentation: http://nginx.org/en/docs/ * Official Russian Documentation: http://nginx.org/ru/docs/ #==基础配置==# user nginx; #设置运行用户 ...
分类:
其他好文 时间:
2021-06-03 18:04:40
阅读次数:
0
一、GiST索引 是一种平衡的、树状结构的访问方法。它在系统中相当于一个模板,几乎可以实现任意索引模式 可以建立一种可扩展的索引结构,包括数据类型和查询谓词的扩展 GiST接口提供了一个高层的抽象,只要求访问方法的实现者实现被访问数据类型的语义,即可快速为新的数据类型开发索引方法 二、GiST索引组 ...
分类:
其他好文 时间:
2021-06-03 17:47:31
阅读次数:
0
传统的表单操作是每个表单元素一个一个获取值进行提交,这样效率比较低 所以我们有了 表单序列化方法: serialize() 他会智能获取表单内的所有元素,会将 里面的内容序列化到字符串中,然后在用AJAX提交。 简单点说:- 方法用于序列化一组表单元素,将表单的内容编码为用于提交的字符串 例: <b ...
分类:
Web程序 时间:
2021-06-03 17:35:26
阅读次数:
0
一、索引分裂 1. 什么是分裂 在开始介绍之前,我们先来搞清楚什么是索引分裂吧。“索引分裂”就是索引块的分裂,当一次DML事务操作修改了索引块上的数据,但是旧有的索引块没有足够的空间来容纳新修改的数据,那么将分裂出一个新索引块,旧有块的部分数据放到新开辟的索引块上去,这个过程就称为索引块的分裂(IN ...
分类:
其他好文 时间:
2021-06-02 20:50:56
阅读次数:
0
PSP阶段 预计花费时间(小时) 实际花费时间(小时) 计划 3 1.5 明确需求和其他相关因素,估计每个阶段的时间成本 1.5 1 开发 11 9 需求分析 1.5 1 代码规范 1.5 1 具体设计 1.5 1 具体编码 3 2 代码复审 1 2 测试(自测、修改代码、提交修改) 2 3 一、计 ...
分类:
其他好文 时间:
2021-06-02 20:44:51
阅读次数:
0
很多中年朋友大概率学过 socket 通信相关 api, send, recv, listen, connect, accept 等等, 变幻无穷 ... 相关的介绍书籍不乏经典, 有趣例子没完没了. 面对真实的自己, 更多时候是学了等于没学, 一直在门外彷徨 , 买珠还椟于面试. 本文想带门外的程 ...
分类:
其他好文 时间:
2021-06-02 20:42:10
阅读次数:
0