爬虫爬下来的数据,有个字段含有大量脏数据,如图1所示,现在需要提取出“红色框”中的“作者机构名称”。 一开始用的excel,替换、分类、按照模式的快速填充各种都用上了,但是,数据量太大了(有上万条,辛苦机器性能还行)而且你懂得,人工操作肯定有误操作而且分列啥的这些功能适应新不怎么强,结果,弄了小半天 ...
分类:
其他好文 时间:
2016-11-28 00:43:26
阅读次数:
136
经常有程序员来找我讨论要不要辞职,以及现在辞职是不是一个明智之举。这是很严肃的话题,我通常不会轻易发表建议,因为这个决定会对程序员的职业生涯和生活产生非常深远的影响。 很多人想要辞职但是因为怕被贴上“爱跳槽”的标签而裹足不前。从我观察的结果来看,很多程序员趋向于为了所谓的“声誉”而呆在老公司,但是在 ...
分类:
其他好文 时间:
2016-11-26 17:38:09
阅读次数:
120
这是跟在上一篇博文后续内容: ——Swift中相关的属性 存储属性 Swift中的属性分为存储属性和计算属性,存储属性就是Objective-C中的数据成员,计算属性不存储数据,但可以通过计算其他属性返回数据。存储属性可以存储数据,分为常量属性(用关键字let定义)和变量属性(用关键var定义)。 ...
分类:
编程语言 时间:
2016-11-26 14:41:24
阅读次数:
229
包管理器 管理着 javascript 库,并提供读取和打包它们的工具。 npm:npm 是 javascript 的包管理器。官网 Bower:一个 web 应用的包管理器。官网 component:能构建更好 web 应用的客户端包管理器。官网 spm:全新的静态包管理器。官网 jam:一个专注 ...
分类:
编程语言 时间:
2016-11-25 20:37:43
阅读次数:
293
1. Variables (1) Three ways to define variables: 1) val refers to define an immutable variable; 2) var refers to define a mutable variable. 3) lazy va ...
分类:
其他好文 时间:
2016-11-25 17:14:37
阅读次数:
226
原创博文:转载请标明出处:http://www.cnblogs.com/zxouxuewei 最近有不少人询问有关MoveIt!与OMPL相关的话题,但是大部分问题都集中于XXX功能怎么实现,XXX错误怎么解决。表面上看,解决这些问题的方法就是提供正确的代码,正确的编译方法,正确的运行步骤。 然而, ...
分类:
其他好文 时间:
2016-11-23 12:03:58
阅读次数:
878
延迟加载(lazy load)是(也称为懒加载),也叫延迟实例化,延迟初始化等,主要表达的思想就是:把对象的创建延迟到使用的时候创建,而不是对象实例化的时候创建。延迟加载机制是为了避免一些无谓的性能开销而提出来的,这种方式避免了性能的浪费。所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操 ...
分类:
编程语言 时间:
2016-11-23 07:35:35
阅读次数:
288
Inverse是hibernate双向关系中的基本概念。inverse的真正作用就是指定由哪一方来维护之间的关联关系。当一方中指定了“inverse=false”(默认),那么那一方就有责任负责之间的关联关系,说白了就是hibernate如何生成Sql来维护关联的记录!inverse=true -> ...
分类:
Web程序 时间:
2016-11-20 13:20:11
阅读次数:
199
1.什么是延迟初始化 延迟初始化(lazy initialization,即懒加载)是延迟到需要域的值时才将它初始化的行为。如果永远不需要这个值,这个域就永远不会被初始化。这种方法既静态域,也适用于实例域。 最好建议“除非绝对必要,否则就不要这么做”。 2.延迟初始化线程安全的一个策略:同步 延迟初 ...
分类:
编程语言 时间:
2016-11-20 06:09:46
阅读次数:
166
Code Code 参考: http://www.blogjava.net/kenzhh/archive/2013/03/15/357824.html ...
分类:
其他好文 时间:
2016-11-17 01:44:43
阅读次数:
126