Classify the sentiment of sentences from the Rotten Tomatoes dataset
题目链接:https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews
越来越喜欢iPython notebook了。以下所有工作都可以在一个页面上完成,FireFox支持比Chrome...
分类:
其他好文 时间:
2015-01-18 14:25:37
阅读次数:
172
Machine Learning:Neural Network
前言:
Wikipedia上对Neural Network的定义:
In machine learning,artificial neural networks (ANNs) are a family of statistical learning algorithms inspired by
biological...
分类:
Web程序 时间:
2015-01-17 01:17:02
阅读次数:
345
一、StatisticalLearning StatisticalLearning 与Machine Learning到底有什么区别,我至今都糊里糊涂!UNSW Australia的Claude Sammut教授和Monash University Australia的Geoffrey I. W.....
分类:
其他好文 时间:
2015-01-17 01:00:17
阅读次数:
229
Description Pass a year learning in Hangzhou, yifenfei arrival hometown Ningbo at finally. Leave Ningbo one year, yifenfei have many people to meet...
分类:
其他好文 时间:
2015-01-16 23:46:04
阅读次数:
185
topology提交前会先判断集群中是否存在同名作业,如果存在在提交失败,如果没有则会增加集群提交次数SubmittedCount,每次提交成功,该变量都会加1,然后会为该作业分配一个id,生成规则如下:
public static String TopologyNameToId(String topologyName, int counter) {
return topologyNam...
分类:
Web程序 时间:
2015-01-16 20:58:00
阅读次数:
534
Python实现KNN算法
KNN算法的实际用处很多,主要用于分类阶段,是一个基础的分类算法。KNN主要基于距离的计算,一般可以在原始的欧氏空间中计算样本之间的距离。改进版本有:先特征提取到一个更加鉴别的空间中,然后计算距离;或者先使用metric learning度量学习的技术来获得一个鉴别的度量空间,然后计算样本间的马氏距离。
不管怎么说,KNN在很多算法的分类阶段都可以用到,我们这里用python实现KNN。...
分类:
编程语言 时间:
2015-01-16 19:19:41
阅读次数:
233
一个topology包含一或多个spout bolt,spout负责在数据源获得数据并发送给bolt,每个bolt负责做完处理后发给下一个bolt。通常topology的创建是由TopologyBuilder来创建的,该组件会记录包含哪些spout bolt,并做相应验证:各组件是否有id冲突,校验方法如下:
private void validateUnusedId(String id) {
...
分类:
Web程序 时间:
2015-01-16 16:47:39
阅读次数:
335
在前一篇文章中,介绍到了Galaxy的增量计算性质,其state是框架内部管理的,以及与Storm的简单对比。这篇文章将讲述更多Galaxy增量模型的事情,并介绍这套增量模型之上实现的Galaxy SQL和Galaxy Operator,同时会从增量角度对比Spark Streaming。...
分类:
其他好文 时间:
2015-01-16 16:42:07
阅读次数:
652
最近遇到了两起数据库连接数不足的问题, 通常都会预留一些会话增加的情况, 但在一些特殊情况下如连接风暴(logon storm), 如果在监听中没有做rate限流,对数据库来说巨大的冲击可能会导致数据库Hang 或 ora-20 或ora-18 错误。 对于Hang并伴有进程数不足的情况,AWR、A...
分类:
系统相关 时间:
2015-01-16 14:42:04
阅读次数:
344