最近打算深入了解一下机器翻译系统的具体功能模块,以东北大学的Niutrans为蓝本,其用户手册里有一些对其他开源的统计机器翻译系统的介绍,觉得也不错,就简要地记一下发在这里。 Moses:Edinburgh大学SMT小组开发。最新版本的同时支持基于短语的以及基于句法的模型(从短语,规则的提取到解码) ...
分类:
其他好文 时间:
2016-08-07 21:21:16
阅读次数:
161
Clang中包含了非常多的关于抽象语法树(AST)的访问和操作的类和接口。我们程序开发人员可以直接通过继承其中的某些类,重写其中的关键成员方法,从而形成我们自己的对抽象语法树的操作。 那么,首先我们简要介绍几个概念: 抽象语法树(AST):抽象语法树是源代码的抽象语法结构的树状表现形式。树上的每个节 ...
分类:
其他好文 时间:
2016-08-05 00:46:06
阅读次数:
263
SIFT(Scale-Invariant Feature Transform,尺度不变特征转换)在目标识别、图像配准领域具有广泛的应用,下面按照SIFT特征的算法流程对其进行简要介绍对SIFT特征做简要介绍。 高斯金字塔是SIFT特征提取的第一步,之后特征空间中极值点的确定,都是基于高斯金字塔,因此 ...
分类:
其他好文 时间:
2016-08-04 01:24:16
阅读次数:
403
首先简要介绍一下AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一。一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章,让你找出有多少个单词在文章里出现过。要搞懂AC自动机,先得有模式树(字典树)Trie和KMP模式匹配 ...
分类:
编程语言 时间:
2016-08-03 23:44:13
阅读次数:
259
本文将简要介绍TeamTalk开源的过去和现在,为打算研究和采用TeamTalk的同行提供一定程度的参考。文中所涉及内容如有不妥,还请各位看官见谅。 ...
分类:
其他好文 时间:
2016-07-28 14:09:42
阅读次数:
366
本博文主要是CVPR2016的《Single-Image Crowd Counting via Multi-Column Convolutional Neural Network》这篇文章的阅读笔记,以及对人群计数领域做一个简要介绍。...
分类:
Web程序 时间:
2016-07-22 19:09:42
阅读次数:
3848
Web端即时通讯技术因受限于浏览器的设计限制,一直以来实现起来并不容易,主流的Web端即时通讯方案大致有4种:传统Ajax短轮询、Comet技术、WebSocket技术、SSE(Server-sent Events)。本文将简要介绍这4种技术的原理,并指出各自的异同点、优缺点等。 ...
分类:
Web程序 时间:
2016-07-22 19:02:00
阅读次数:
241
1. 前言 Web端即时通讯技术因受限于浏览器的设计限制,一直以来实现起来并不容易,主流的Web端即时通讯方案大致有4种:传统Ajax短轮询、Comet技术、WebSocket技术、SSE(Server-sent Events)。本文将简要介绍这4种技术的原理,并指出各自的异同点、优缺点等。 2. ...
分类:
Web程序 时间:
2016-07-22 12:44:24
阅读次数:
260
最近学习了storm的一些基础知识,感觉storm是一个非常强大的实时流处理系统。对其进行简要介绍如下:STORM
1.什么是storm
Storm是一个开源的,分布式的,可靠的,实时数据流处理系统。类比Hadoop对数据进行批处理,storm对数据进行实时处理。
2.storm的应用场景
Storm的处理速度快吞吐量大,根据Storm官方网站的资料介绍,Storm的一个节点(Intel E...
分类:
其他好文 时间:
2016-07-20 06:42:13
阅读次数:
184
通常当我们谈到开发网站时,主要谈论的是HTML。当然,Web远不只有HTML,我们在Web上用多种格式来发布数据:RSS、PDF、图片等。
到目前为止,我们的注意力都是放在常见 HTML
代码生成上,但是在这一章中,我们将会对使用 Django
生成其它格式的内容进行简要介绍。
Django拥有一些便利的内建工具帮助你生成常见的非HTML内容:
§ RSS/Atom
聚合文件
§ 站...
分类:
Web程序 时间:
2016-07-15 21:19:11
阅读次数:
538