Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之一,其训练常采用最大似然准则,且为防止过拟合,往往在目标函数中加入(可以产生稀疏性的) L1 正则。但对于这种带 L1 正则的最大熵模型,直接采用标准的随机梯度下降法(SGD)会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...
分类:
其他好文 时间:
2014-06-19 12:01:04
阅读次数:
286
Source: http://cpprocks.com/wp-content/uploads/c++11-regex-cheatsheet.pdf
分类:
编程语言 时间:
2014-06-16 00:05:54
阅读次数:
441
文本处理工具之二 sed命令详解
sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。
sed命令的语法格式:
sed的命令格式: sed [op...
分类:
其他好文 时间:
2014-06-15 07:49:58
阅读次数:
242
转载http://luolei.org/regula-expression-simple-tutorial/第一次接触正则表达式是在今年四月的腾讯笔试,当时是一道选择题问如何判断输入的是否是
QQ 号码(即纯数字),当时是蒙了一个答案,菜鸟不会嘛 ╮(╯3╰)╭ 。事后自己倒专门学习了正则表达式,还...
分类:
其他好文 时间:
2014-06-13 18:23:34
阅读次数:
243
1 2 3 4 5 示例-表单校验-涉及的正则校验 6 9 10 11 12 13 88 89 90
用户名称: 91 92 93 输入密码: 94 95 96 确认密码:...
分类:
其他好文 时间:
2014-06-13 15:23:55
阅读次数:
294
Source:
http://cpprocks.com/wp-content/uploads/c++11-regex-cheatsheet.pdf
分类:
编程语言 时间:
2014-06-13 14:57:19
阅读次数:
313
.点号匹配任何单个字符(注:点号在字符组内不算元字符)*星号表示之前的元素出现任意次数或0次?问号前面元素出现0次或1次+加号前面元素出现1次以上-连字符注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围;如果出现在字符组的开头,则只能表示连字符本身^脱字符表示开头。注意:...
分类:
其他好文 时间:
2014-06-12 07:29:36
阅读次数:
215