码迷,mamicode.com
首页 >  
搜索关键字:信息检索    ( 257个结果
机器学习:评价分类结果(ROC 曲线)
一、基础理解 1)定义 ROC(Receiver Operation Characteristic Curve) 定义:描述 TPR 和 FPR 之间的关系; 功能:应用于比较两个模型的优劣; 召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果 ...
分类:其他好文   时间:2018-08-02 02:01:31    阅读次数:243
自然语言处理--TF-IDF(关键词提取)
TF-IDF算法 TF-IDF(词频-逆文档频率)算法是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。该算法在数据挖掘、文本处理和信息检索等领域得到了广泛的应用,如从一篇 ...
分类:编程语言   时间:2018-07-18 20:28:20    阅读次数:1613
(一)信息检索中的排序
总览 搜索引擎的六个核心组件:爬虫、解析、索引、链接关系分析、查询处理、排名 ...
分类:编程语言   时间:2018-07-09 22:25:57    阅读次数:171
《学生宿舍管理系统》日志二
学生宿舍管理系统是学生宿舍管理工作中必不可少的部分,对于宿舍的管理者和学生来说都非常重要,但长期以来传统的手工方式流程比较繁琐,效率相当低。而一个成功的学生宿舍管理系统应提供快速的学生信息检索功能、快捷的办理学生入住、学生退宿流程。当管理员因为学校下达的命令,需要查询某个学生的信息时,打开登录我们学 ...
分类:其他好文   时间:2018-06-23 01:32:47    阅读次数:187
搜索引擎概述之布尔检索
布尔检索是最基础,也是使用最广泛的信息检索模型了。所谓布尔查询就是通过AND、OR、NOT等逻辑操作符将检索词连接起来的查询。 ...
分类:其他好文   时间:2018-06-04 14:27:46    阅读次数:175
1.Lucene简介
1.Lucene简介 Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能 Lucene是开源项目。它是可扩展的,高性能的库用于索引和搜索几乎任何类型的文本, Lucene库提供了所需的任何搜索应用程序的核心业务。索引和搜索 实际上l ...
分类:Web程序   时间:2018-06-02 13:56:58    阅读次数:221
协同过滤推荐
协同过滤推荐基于用户的最近邻推荐思想:给定一个评分数据集以及当前(活跃)用户ID作为输入,找出与当前用户过去有相似偏好的其他用户,这些用户有时被称为对等用户或者最近邻;然后,对当前用户没见过的每个商品p,利用其近邻对p的评分计算预测值。潜在假设:(1)如果用户过去有相似的偏好,那么他们未来也会有相似... ...
分类:其他好文   时间:2018-05-27 23:43:06    阅读次数:173
solr 学习笔记(一)--搜索引擎简介
专门解决大量结构化、半结构化数据、非结构化文本类数据的实时检索问题。 这种实时搜索数据库做不了。 大量结构化、半结构化、非结构化文本类数据的实时搜索 信息检索(如电子图书馆、电子档案馆) 网页搜索 内容提供网站的内容搜索(如 新闻、论坛、博客网站) 电子商务网站的商品搜索 如果你负责的系统数据量大, ...
分类:其他好文   时间:2018-05-20 16:43:45    阅读次数:181
推荐系统-02-评价技术
下面简单通过在测试集上验证错误值 (JAVA) 以下是通过信息检索, 进行多维度的评价模型的优劣度(java) ...
分类:其他好文   时间:2018-05-16 19:50:43    阅读次数:150
Elasticsearch的停用词(stopwords)
1、问题 在使用搜索引擎(Elasticsearch或Solr)作为应用的后台搜索平台的时候,会遇到停用词(stopwords)的问题。 在信息检索中,停用词是为节省存储空间和提高搜索效率,处理文本时自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。停用词大致分为两类。一类是语 ...
分类:其他好文   时间:2018-05-15 10:45:43    阅读次数:2834
257条   上一页 1 ... 5 6 7 8 9 ... 26 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!