码迷,mamicode.com
首页 >  
搜索关键字:python spark 统计    ( 166653个结果
线段树求LIS并统计最长子序列个数
求最长单增子序列(LIS)长度并统计取得最大长度的子序列数。扩展:把LIS换成最长先增后减子序列...
分类:其他好文   时间:2014-05-10 10:09:01    阅读次数:506
生产者消费者 协同程序 python
生成器和普通函数有些区别,比如生成器不用return返回,而用yield来返回一系列元素 除非“召唤”生成器的next(),否则函数体里面不会执行任何代码块,上下文环境保存着。 虽然不需要明确定义__iter__()和next()方法,但是它本身包含这个方法。 当想要结束一个协程时,使用close()方法即可,close会在协程中引发GeneratorExit异常,这时候可以通过try/ex...
分类:编程语言   时间:2014-05-10 09:53:34    阅读次数:317
给图片加ALT属性是个什么意思?有什么好处呢
使用百度统计的seo建议其中一条图片ALT信息“存在没有alt信息的img标签”扣分较多。网站图片中添加ALT对seo有什么好处呢?这是很多初学seo的朋友们都需要询问的问题。alt标签是什么?厦门SEO给大家介绍一下 一种利用图片进行SEO的方法就是在这些图片的img标签中使用alt标签。HTML标签中的alt标签用于显示图片的替换文本信息。alt标签应该是对图片的简短介绍,同时应该尽可能的包...
分类:其他好文   时间:2014-05-10 09:19:34    阅读次数:420
使用__slots__
正常情况下,当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性。先定义class: >>> class Student(object): ... pass ... 然后,尝试给实例绑定一个属性: >>> s = Student() >>> s.name = 'Michael' # 动态给实例绑定一个属性 >>> pr...
分类:其他好文   时间:2014-05-10 09:10:48    阅读次数:331
Pig系统分析(6)-从Physical Plan到MR Plan再到Hadoop Job
从Physical plan到Map-Reduce Plan 注:因为我们重点关注的是Pig On Spark针对RDD的执行计划,所以Pig物理执行计划之后的后端参考意义不大,这些部分主要分析流程,忽略实现细节。 入口类MRCompiler,MRCompilier按照拓扑顺序遍历物理执行计划中的节点,将其转换为MROperator,每个MROperator都代表一个map-reduce j...
分类:其他好文   时间:2014-05-10 08:46:07    阅读次数:366
Trie树基本概念和训练指南
接触Trie树是在选拔赛时候遇到一题目,TLE无数次依然无解,赛后发现字符串统计有一利器名曰“字典树”,后来花了一段时间去写Trie. 什么叫Trie树? Trie树即字典树。 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时...
分类:其他好文   时间:2014-05-07 07:05:09    阅读次数:351
【机器学习算法-python实现】Adaboost的实现(1)-单层决策树(decision stump)
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景      上一节学习支持向量机,感觉公式都太难理解了,弄得我有点头大。不过这一章的Adaboost线比较起来就容易得多。Adaboost是用元算法的思想进行分类的。什么事元算法的思想呢?就是根据数据集的不同的特征在决定结果时所占的比重来划分数据集。就是要对每个特征值都构建决策树,并且赋予他们不同的...
分类:编程语言   时间:2014-05-07 06:48:25    阅读次数:569
Giraph源码分析(八)—— 统计每个SuperStep中参与计算的顶点数目
目的:科研中,需要分析在每次迭代过程中参与计算的顶点数目,来进一步优化系统。比如,在SSSP的compute()方法最后一行,都会把当前顶点voteToHalt,即变为InActive状态。所以每次迭代完成后,所有顶点都是InActive状态。在大同步后,收到消息的顶点会被激活,变为Active状态,然后调用顶点的compute()方法。本文的目的就是统计每次迭代过程中,参与计算的顶点数目。下面附上SSSP的compute()方法:...
分类:其他好文   时间:2014-05-07 06:25:52    阅读次数:415
Python中的循环技术
简单谈谈 Python 中容器的遍历和一下小技巧。 1、遍历单个容器      下面代码遍历一个 List 结构,同样适用于 Tuple、Set 结构类型 >>> x = [1, 2, 3, 'p' , 'y'] >>> for v in x: ...     print(x) ... 1 2 3 p y      遍历字典 Dict 结构也是...
分类:编程语言   时间:2014-05-07 04:12:39    阅读次数:395
python内置的urllib模块不支持https协议的解决办法
Django站点使用django_cas接入SSO(单点登录系统),配置完成后登录,抛出“urlopen error unknown url type: https”异常。寻根朔源发现是python内置的urllib模块不支持https协议。 >>> import urllib >>> urllib.urlopen('http://www.baidu.com') > >>> url...
分类:编程语言   时间:2014-05-07 03:43:55    阅读次数:424
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!