让我们从头说起,首先AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不...
分类:
其他好文 时间:
2015-02-09 21:39:16
阅读次数:
207
中国大数据技术大会首日全体大会上,腾讯数据平台部助理总经理蒋杰发表了题为《大数据处理的规模化与实时化演进 》的演讲。他分享了大数据技术在腾讯的实践,其中包括基于Hadoop的平台TDW、实时数据收集系统TDBank以及基于Storm的流处理系统TRC。同时,蒋杰还透露,腾讯将在12月开源内部的Had...
分类:
其他好文 时间:
2015-02-09 12:47:57
阅读次数:
177
再理解RankNet算法
前面的一篇博文介绍了学习排序算法(Learning to Rank)中的RankNet算法。如下:
http://blog.csdn.net/puqutogether/article/details/42124491
那次的入门对其中的算法流程和基本原理没有深入了解,这次看自动摘要提取算法的时候,里面有一个排序单元,使用到的...
分类:
编程语言 时间:
2015-02-09 11:04:55
阅读次数:
334
This post builds on aprevious post, but can be read and understood independently.As part of my course on statistical learning, we created 3D graphics ...
分类:
其他好文 时间:
2015-02-09 10:43:24
阅读次数:
245
Splunk vs. Sumo Logic vs. LogStash vs. GrayLog vs. Loggly vs. PaperTrails vs. Splunk>Storm英文原文:The 7 Log Management Tools You Need To Know日志管理工具有 Splu...
分类:
编程语言 时间:
2015-02-08 23:02:37
阅读次数:
386
这一篇是整个第五章的精华了,会重点介绍一下Neural Networks的训练方法——反向传播算法(backpropagation,BP),这个算法提出到现在近30年时间都没什么变化,可谓极其经典。也是deep learning的基石之一。还是老样子,下文基本是阅读笔记(句子翻译+自己理解),把书里的内容梳理一遍,也不为什么目的,记下来以后自己可以翻阅用。...
分类:
编程语言 时间:
2015-02-07 23:03:19
阅读次数:
313
稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在90%甚至99%以上。因此我们需要有高效的稀疏矩阵存储格式。本文总结几种典型的格式:COO,CSR,DIA,ELL,HYB。...
分类:
其他好文 时间:
2015-02-07 23:01:37
阅读次数:
301
1、在使用Java API访问之前先在安装有kafka的各个节点启动服务
bin/kafka-server-start.sh config/server.properties &
2、报如下错误
props.put("metadata.broker.list", "storm1:9092,storm2:9092,storm3:9092");
props.put("serializer.cl...
分类:
其他好文 时间:
2015-02-07 18:56:33
阅读次数:
174
本题其实就是storm的wordcout,需要把一个gz压缩的文件读取,并使用storm计算其pv. 样本 数据: 存储为accesslog.gz 我把它加载到我的虚拟机中/mnt/下。 没有使用trident,刚学习最基本的。 所以把spout的数目设定为1. 把文件路径存储在config 的ma...
分类:
其他好文 时间:
2015-02-07 14:25:20
阅读次数:
258
机器学习视野
《10 Machine Learning Experts You Need to Know》最值得关注的10位机器学习专家:Geoffrey Hinton、Michael I Jordan、Andrew Ng、Jeff Hawkins、Yann LeCun、Terry Sejnowski、David M. Blei、Daphne Koller、Zoubin Ghahramani、Seb...
分类:
其他好文 时间:
2015-02-06 20:31:52
阅读次数:
203