今天发现我们的数据库服务器CRS安装目录突然增大,经过查找发现在crf目录中存在一个非常大的crf文件,通过MOS查找,发现命中Bug20186278,记录一下,以防忘记[grid@smidb11smidb11]$pwd/oracle/app/11.2.0/grid_1/crf/db/smidb11[grid@smidb11smidb11]$ls-ltotal31863680-rw-r-..
分类:
数据库 时间:
2015-09-17 15:19:41
阅读次数:
358
第11章 条件随机场条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可以用于不同的预测问题,本章主要讲述线性链(linear chain)条件随机场在标注问...
分类:
其他好文 时间:
2015-08-28 21:24:31
阅读次数:
1900
最近在用CRF做未登录技能词识别,虽然艰难,但是感觉很爽,效率非常高。(1)数据准备:选取30000行精语料作为训练数据。每一个br作为一条数据。使用已有的技能词典对数据进行无标注分词。(2)训练数据标注:对分词后的语料进行标注。如果某分词结果在技能词典中,则该词作为技能词进行标注;如果某分词结果不...
分类:
其他好文 时间:
2015-08-25 21:11:45
阅读次数:
146
声明:本文主要是基于网上的材料做了文字编辑,原创部分甚少。参考资料见最后。
隐马尔可夫模型(Hidden Markov Model,HMM),最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)以及条件随机场(Conditional Random Field,CRF)是序列标注中最常用也是最基本的三个模型。HMM首先出现,MEMM其次,CRF最后。三个算法...
分类:
其他好文 时间:
2015-07-20 16:23:48
阅读次数:
250
1. Chinese Segmentation Introduction最近两天系统的研究了一下中文分词算法,在这里做个简单的总结。中文分词可以分为(1)基于词典的分词 和(2)非基于词典的分词。
基于词典的分词包括:
* MMSEG
* Forward/Backward matching
* 最小切分非基于词典的分词主要是通过统计学计算概率的方法进行中文分词,例如CRF, is p...
分类:
其他好文 时间:
2015-07-06 16:06:51
阅读次数:
242
一.分词软件简介主流分词软件挑重要的讲,目前的分词软件很多,也比较杂。这里列举一些效果比较好的分词软件。Stanford Word Segmenter (Java,GPL) 老牌美帝斯坦佛大学NLP小组出品nlpbamboo (C++, BSD) PostgreSQL的大大们制作的一个基于CRF++...
分类:
编程语言 时间:
2015-07-01 17:27:55
阅读次数:
301
声明:本文是在《最优化方法》课程中阅读的Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data这篇文章后的总结。CRF由来条件随机场(CRF)这种用来解决序列标注问题的机器学习方法是由John Lafferty于2001年发表在国际机器学习大会ICML上的一篇经典文章所引入,对...
分类:
其他好文 时间:
2015-06-13 23:08:41
阅读次数:
278
preface:在走着走着的道路上,总会有些想法或者总结的念头,便想要记录下来,以备不时之需。ps:卤主搞自然语言处理相关,仅这块有些想法。
一、学好理论基础
卤主等有想法再些。
二、从数据入手,分析数据,看准需要实现的目标
无论科研还是工作,大同小异:做东西。在掌握基本方法(SVM, HMM, CRF, RF, LR等分类,聚类,回归工具)与工具(语言工具python,分...
分类:
其他好文 时间:
2015-06-02 18:03:01
阅读次数:
154
1. 简述 最近要应用CRF模型,进行序列识别。选用了CRF++工具包,具体来说是在VS2008的C#环境下,使用CRF++的windows版本。本文总结一下了解到的和CRF++工具包相关的信息。 参考资料是CRF++的官方网站:CRF++: Yet Another CRF toolkit,网上的很...
分类:
其他好文 时间:
2015-05-13 21:22:31
阅读次数:
139
Belief Propagtion在计算机视觉视觉中有相当广泛的应用,当然这一切离不开MRF、CRF等图模型的使用。
很多视觉问题可以表述成一个能量函数的形式,例如,图像的语义分割或者叫做image parsing问题可以表述成一个能量函数的形式:E(f)=∑ p∈P D p (f p )+∑ (p,q)∈N W(f p ,f q ) \begin{equation}
E(f)=\sum_{p\i...
分类:
其他好文 时间:
2015-05-09 01:20:49
阅读次数:
273