Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之一,其训练常采用最大似然准则,且为防止过拟合,往往在目标函数中加入(可以产生稀疏性的) L1 正则。但对于这种带 L1 正则的最大熵模型,直接采用标准的随机梯度下降法(SGD)会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...
分类:
其他好文 时间:
2014-06-19 12:01:04
阅读次数:
286
Source: http://cpprocks.com/wp-content/uploads/c++11-regex-cheatsheet.pdf
分类:
编程语言 时间:
2014-06-16 00:05:54
阅读次数:
441
在以前的项目中周公曾有解析HTML的情况,当时是采用正则表达式一步步将无关的HTML注释及JS代码部分删除掉,然后再用正则表达式找出需要提取的部分,可以说使用正则表达式来做是一个比较繁琐的过程,特别是对于正则表达式不是很熟悉或者要处理的HTML很复杂的情况下。前一阵子周公还是通过这个办法将http:...
分类:
Web程序 时间:
2014-06-16 00:00:02
阅读次数:
325
运用.NET Framework类来解析HTML文件、读取数据并不是最容易的。虽然你可以用.NET Framework中的许多类(如StreamReader)来逐行解析文件,但XmlReader提供的API并不是“取出即可用(out of the box)”的,因为HTML的格式不规范。你可以用正则...
分类:
Web程序 时间:
2014-06-15 23:23:58
阅读次数:
712
$(function () { $("#txtPhone").focus(function () { $(this).next().show().removeClass("onError").removeClass("onright").addClass("ontan").ht...
分类:
其他好文 时间:
2014-06-15 22:44:27
阅读次数:
346
去除字符串左右两端的空格,在vbscript里面可以轻松地使用 trim、ltrim 或 rtrim,但在js中却没有这3个内置方法,需要手工编写。下面的实现方法是用到了正则表达式,效率不错,并把这三个方法加入String对象的内置方法中去。 写成类的方法格式如下:(str.trim();) ...
分类:
Web程序 时间:
2014-06-15 22:36:15
阅读次数:
283
使用m//匹配//这是m//(模式匹配)的一种简写。同qw//操作一样,可以使用任何成对的分隔符。因此,可以使用m(fred), m, m{fred}, m[fred],或者m,fred,, m!fred!, m^fred^,其它非成对的分隔符也可以不区分大小写:/iif(/yes/i) {#大小写...
分类:
其他好文 时间:
2014-06-15 20:27:15
阅读次数:
278
文本处理工具之二 sed命令详解
sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。
sed命令的语法格式:
sed的命令格式: sed [op...
分类:
其他好文 时间:
2014-06-15 07:49:58
阅读次数:
242