BloomFilter算法,是一种大数据排重算法。在一个数据量很大的集合里,能准确断定一个对象不在集合里;判断一个对象有可能在集合里,而且占用的空间不大。它不适合那种要求准确率很高的情况,零错误的场景。通过牺牲部分准确率达到高效利用空间的目的。 ...
分类:
编程语言 时间:
2016-06-30 01:13:30
阅读次数:
314
一、常见的车牌检测 参见:http://www.docin.com/p-1450061197.html 参见:http://blog.csdn.net/evsqiezi/article/details/7895388 基于边缘检测的车牌定位流程 优点:该方法的定位准确率较高、 反应时间短、 能有效去 ...
分类:
其他好文 时间:
2016-06-28 10:46:50
阅读次数:
192
6.24 AppCan移动开发者大会进入倒计时,报名通道即将关闭! 50多家移动圈服务商将出席此次大会,讯飞开放平台也将作为参展商,为参会者带去前沿的语音技术。参会者可现场体验最新连续语音识别技术,识别准确率超过95%,语音输入速度180字/分,识别结果响应时间≤500ms。 ...
分类:
移动开发 时间:
2016-06-22 15:17:26
阅读次数:
185
Ansj分词
这是一个基于n-Gram+条件随机场模型的中文分词的java实现.
分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上
目前实现了.中文分词. 中文姓名识别 . 用户自定义词典
可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.
源码:https://github.com/NLPchina/ansj_seg...
分类:
其他好文 时间:
2016-06-21 07:34:12
阅读次数:
897
使用python计算分词结果的准确率,召回率和F值 测试文件output.txt格式如下: python代码如下: 1、读入output.txt文件,并建立相应的列名为'character','train','test'的dataframe 【注:使用df.loc添加新行的速度太慢,因而使用列表向d ...
分类:
编程语言 时间:
2016-06-19 14:15:42
阅读次数:
2867
例子某大学一个系,总共100人,其中男90人,女10人,现在根据每个人的特征,预测性别Accuracy(准确率)Accuracy=预测正确的数量需要预测的总数 Accuracy = {预测正确的数量 \over 需要预测的总数} 计算由于我知道男生远多于女生,所以我完全无视特征,直接预测所有人都是男生
我预测所的人都是男生,而实际有90个男生,所以
预测正确的数量 = 90
需要预测的总数 =...
分类:
其他好文 时间:
2016-06-16 11:45:16
阅读次数:
332
语音识别系统 为了方便人们的生活,许多的方面都可以通过语音指令来代替手动输入来执行想要的指令。现在做语音识别的有一些不错的开放平台供我们使用,一家是科大讯飞平台,一家是百度语音平台。我个人比较偏爱科大讯飞,因为科大讯飞的优势在于大 段大段的文字识别上,准确率较高。这正好能符合我输入银行卡号准确无误的 ...
分类:
移动开发 时间:
2016-06-03 21:22:50
阅读次数:
933
1、背景 前文已经简要介绍tesseract ocr引擎的安装及基本使用,其中提到使用-l eng参数来限定语言库,可以提高识别准确率及识别效率。 本文将针对某个网站的验证码进行样本训练,形成自己的语言库,来提高验证码识别率。 2、准备工具 tesseract样本训练有一个官方流程说明,https: ...
分类:
其他好文 时间:
2016-06-03 19:07:33
阅读次数:
909
GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类、回归、排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的。本文尝试一步一步梳理GB、GBDT、xgboost,它们之间有非常紧密的联系,GBDT是以决策树(CART)为基学习器的GB算法,xgboost扩展和改进了GDBT,xgboost算法更快,准确率也相对高一些。
1. Gradient boo...
分类:
其他好文 时间:
2016-05-31 10:39:58
阅读次数:
417
基于汉字字频特征实现99.99%准确率的新闻文本分类器(一) 基于汉字字频特征实现99.99%准确率的新闻文本分类器(二) 基于汉字字频特征实现99.99%准确率的新闻文本分类器(三) 基于汉字字频特征实现99.99%准确率的新闻文本分类器(四) 回顾 上一节中,使用五层神经网络,对抽取出的汉字字频 ...
分类:
其他好文 时间:
2016-05-30 23:12:36
阅读次数:
212