Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之一,其训练常采用最大似然准则,且为防止过拟合,往往在目标函数中加入(可以产生稀疏性的) L1 正则。但对于这种带 L1 正则的最大熵模型,直接采用标准的随机梯度下降法(SGD)会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...
分类:
其他好文 时间:
2014-06-19 12:01:04
阅读次数:
286
核心目标:Google File System是一个面向密集应用的,可伸缩的大规模分布式文件系统。GFS运行在廉价的设备上,提供给了灾难冗余的能力,为大量客户机提供了高性能的服务。1.一系列前提GFS的系统构建针对其自身使用的特点在传统的分布式系统的基础上又进行了一些创新,基于的前提假设主要包括以下...
分类:
其他好文 时间:
2014-06-19 08:44:16
阅读次数:
261
昨天刚看完BlockingQueue觉得好高级啊,今天扫到1.7就发现了升级版。。。。如果对内容觉得不够充分,可以去看http://www.cs.rochester.edu/u/scott/papers/2009_Scherer_CACM_SSQ.pdf就是作者的论文啦,纯英文。。。比较难啃,但是我...
分类:
编程语言 时间:
2014-06-18 22:07:55
阅读次数:
192
6 月 16 日消息,《纽约时报》网络版发表评论文章认为,自蒂姆·库克(Tim Cook)出任苹果公司 CEO 一直以来,外界一直将其与乔布斯进行比较,因而,经常被指责称毫无创意。不过,库克还是在意自己的方式,一步步的转变着苹果过去的形象。有人认为,乔布斯和库克就像是披头士乐队里的列侬和林戈,是完全不同的风格。
以下是文章主要内容:
上世纪 70 年代初期,美国...
分类:
移动开发 时间:
2014-06-16 22:53:01
阅读次数:
419
这篇论文主要是预测用户在基于位置的社交网络中的下一次签到地点,是ICDM'12年录用的一篇文章。
1.1 论文概要
在这篇文章中,作者首先将位置预测问题阐述为位置排名问题,即把用户所在城市内的所有签到场所作为候选集,然后根据一定的规则将候选集中的场所进行排名。排名的规则所追求的目标就是尽可能的将用户下一次签到地点排在最前面。。。。。
1.2 读后感
优点。。。
缺点。。。
1.3 总结
总之,作为一篇数据挖掘论文被ICDM录用还是够格的。以一种纯数据挖掘的角度(特征提取->模型训练->模型测试)来进行位置预...
分类:
其他好文 时间:
2014-06-15 18:45:29
阅读次数:
203
使用Latex可以排版出漂亮的论文,尤其适合对含有数学公式论文的排版。
下面编写第一Latex源文件,实现对两个数学公式的排版:
新建文件first.tex:
\documentclass{article}
\begin{document}
\begin{equation}
\sqrt{x^2+y^2}
\end{equation}
\begin{equation}
\int_{a}^{...
分类:
其他好文 时间:
2014-06-15 15:13:13
阅读次数:
219
既然我们搞清楚了问题所在,那么,如何针对以上问题提高雅思议论文的写作能力呢?经过长期的教学实践,笔者总结出可供广大中国考生学习和借鉴的方法。(一)增大阅读量。古语道:“读书破万卷,下笔如有神。”写作是语言输出的实践过程,只有达到一定量的输入,才会有源源不断的输出。因此,广大中国的考生们要多读英文报纸...
分类:
其他好文 时间:
2014-06-15 11:57:30
阅读次数:
146
GraphLab是一个面向大规模机器学习/图计算的分布式内存计算框架,由CMU在2009年开始做,这里的内容是基于论文Low, Yucheng, et al. "Distributed GraphLab: A Framework for Machine Learning in the Cloud" ...
分类:
其他好文 时间:
2014-06-15 00:09:58
阅读次数:
326
Spark是一个通用的分布式内存计算框架,本文主要研讨Spark的核心数据结构RDD,及其在内存上的容错,内容基于论文Zaharia, Matei, et al. "Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In...
分类:
其他好文 时间:
2014-06-14 20:42:37
阅读次数:
326
这是一个聒噪的夜晚,如果要给出个原因,可能是因为虽然我觉得西班牙不纯粹,但是怎么也不至于干为人家搭台面自己不唱戏的角色吧..结束以后,我觉得该玩一下素有网络瑞士军刀之称谓的netcat了。虽然瑞士军刀和netcat除了在小而精方面之外并没有必然的联系,但是我还是想扯一通我所了解的瑞士,博客嘛,不是论文,不是测试报告,发散一点没有问题,并且,我觉得将来,跨界将是一个必然的趋势,拥有跨界的能力也是一个...
分类:
Web程序 时间:
2014-06-14 14:08:28
阅读次数:
255