1.什么是数据挖掘 数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现先前未知的有用模式。数据挖掘还可以预测未来观测结果。 VS 信息检索(information retrieval)2.数据挖掘与知识发现 数据挖掘是数据库中知识发现(knowledg...
分类:
其他好文 时间:
2015-03-09 23:56:58
阅读次数:
196
转载请注明出处:
在上一篇blog中介绍过POI检索的使用,本篇blog主要介绍公交信息检索和线路规划的内容。
公交信息检索
实际上,公交信息检索与POI检索、在线建议检索非常相似,也是把你需要检索的信息发送给百度地图服务器,然后解析得到的结果。
一般步骤:
1. 设置检索参数
2. 添加检索结果监听器
3. 发起检索
4. ...
分类:
其他好文 时间:
2015-03-05 01:46:08
阅读次数:
244
http://androidren.com/index.php?qa=307&qa_1=lucene和solr的区别
一、名词
Lucene是一套信息检索工具包,但并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能。
Solr是基于Lucene的搜索界面。提供XML/HTTP 和 JSON/Python/Ruby API,提供搜索入口,点击高亮,缓存...
分类:
Web程序 时间:
2015-02-26 11:41:24
阅读次数:
126
让我们从头说起,首先AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不...
分类:
其他好文 时间:
2015-02-09 21:39:16
阅读次数:
207
做过图像识别、机器学习或者信息检索相关研究的人都知道,论文的实验部分都要和别人的算法比一比。可怎么比,人多嘴杂,我说我的方法好,你说你的方法好,各做各的总是不行——没规矩不成方圆。于是慢慢的大家就形成了一种约定,用ROC曲线和PR曲线来衡量算法的优劣。关于ROC曲线和PR曲线的详细介绍可参考资料:ROC Analysis and the ROC Convex HullTom Fawcett,An ...
分类:
编程语言 时间:
2015-01-27 00:42:47
阅读次数:
271
LDA(Latent Dirichlet Allocation)主题模型是一种用统计进行文本挖掘的方法,它是pLSA(概率潜在语义分析)主题模型基础上加上贝叶斯框架而得到的模型。目前已应用于自然语言处理、计算机视觉、机器学习、信息检索等领域,得到了广泛关注。 LDA模型网上有多个开源代码,...
分类:
其他好文 时间:
2015-01-14 15:31:05
阅读次数:
308
基于Lucene 3.0.11、Lucene简单定义Lucene是高性能、可扩展的信息检索(IR)工具库。向用户提供了简单易用的索引和搜索API,屏蔽了内部复杂而先进的信息检索技术实现过程Lucene仅仅是一个提供搜索功能的类库,你还需要根据实际情况自行完成搜索程序的其他模块(网页抓取、文档处理、服...
分类:
Web程序 时间:
2015-01-13 19:27:01
阅读次数:
126
“连接一切”是微信的最大目标,目前劲敌一直是百度和阿里,昨天,微信新版本的内测界面被曝光,朋友圈搜索和附近商户搜索等新功能,这一强化搜索业务的行为,无疑在信息检索和商务检索两个维度向BA发起新的攻势。 有上加好 目前曝光的微信6.1版本截图显示,新版本微信将加入4项新功能:用户可以通过附件栏发微.....
分类:
微信 时间:
2015-01-11 00:53:22
阅读次数:
349
使用DOS查看Logcat内容:日志等级分类:tag名最好和类名相同:测试与结果:添加tag,用于筛选需要的信息:检索筛选信息:system.out和system.err筛选信息:
分类:
移动开发 时间:
2015-01-09 14:02:39
阅读次数:
173