码迷,mamicode.com
首页 >  
搜索关键字:信息检索    ( 257个结果
ssh宠物商城管理系统源码+PPT+开题报告+使用说明+论文
下载地址:https://download.csdn.net/download/qq_31293575/18302141 项目介绍 ssh宠物商城管理系统源码+PPT+开题报告+使用说明+论文 主要功能说明: 通过走访、交流、查阅资料等方式,对网上购物有了一定的了解。本系统设计为前台页面和后台管理。 ...
分类:其他好文   时间:2021-05-03 12:51:34    阅读次数:0
程序员做数据分析不能错过的免费电子书有哪些?
程序员书库(ID:OpenSourceTop)编译l链接:https://www.kdnuggets.com/2014/04/9-free-books-learning-data-mining-data-analysis.html数据挖掘,数据分析,这两个名词经常给人的感觉就是高深莫测的,其实,并非如此,再难的知识只要我们花时间去学习和时间,就会发现实际上并没有那么难这个世界上最不缺的就是聪明的人
分类:其他好文   时间:2020-12-23 12:09:08    阅读次数:0
1000亿文本信息,高并发MD5查询,这么大数据量的业务怎么弄?
==星球水友提问==沈老师,你好,想请教一个身份证信息检索的问题。公司有一个每秒5万并发查询的业务,(假设)根据身份证MD5查询身份证信息,目前有1000亿条数据,纯文本存储,前几天看你写LevelDB,请问这个业务能利用LevelDB内存数据库进行存储么?有没有其他优化方案?画外音:LevelDB《内存KV缓存/数据库》。==问题描述完==上一位星球水友问的是36亿日志后台分页查询,紧接着又来了
分类:其他好文   时间:2020-11-10 11:30:25    阅读次数:10
30亿日志,检索+分页+后台展示,你是否遇到过更奇葩的需求?
沈老师,你好,想请教一个数据库查询日志,前台页面显示的问题。需求:(1)按照某些特定检索条件查询日志;(2)通过前台Web页面查询并显示相关日志信息;(3)检索需求包含用户,时间段区间,类型等特定字段;希望做到:(1)查询速度尽可能快;(2)支持分页查询;目前方案:日志信息存储在Oracle中,根据日期对Oracle做了分区处理,每天生成一个分区表,每个分区表中的数据总量大概在1000W左右。在相
分类:其他好文   时间:2020-11-10 11:30:08    阅读次数:11
评价指标
两个排序列表的相似性 在信息检索领域,我们常用MAP、MRR、NDCG来评估排序算法的好坏,然而这些指标依赖人工标注的query与document的相关性档位(relevance level)。当没有此标注数据,或者我们要评估的排序列表跟相关性无关,并且我们刚好有一个待比较的基准列表时,该如何评估它... ...
分类:其他好文   时间:2020-09-15 21:08:54    阅读次数:37
商业智能bi应用程序的环境支持
随着计算机技术的进步,越来越多的数据可以以较低的成本获得和存储。任何在线信息站点或设备都可以收集新的数据,括电子商务网站、RFID标签、网站、电子邮件、博客等。本文从结构化、非结构化和数据类型、数据库、数据挖掘和云数据等方面介绍了商业智能的应用。结构化、非结构化和数据类型:从广义上讲,数据可以分为结构化数据和非结构化数据。随着现代企业内外部数据的快速积累,结构化和非结构化数据对于商业智能的无缝分析
分类:其他好文   时间:2020-08-20 18:38:33    阅读次数:68
TF-IDF
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。 TF-IDF有两层意思,一层是"词频"(Term Frequency,缩写为T ...
分类:其他好文   时间:2020-07-26 01:56:59    阅读次数:77
C# 导出Excel错误
一: 错误信息: 检索 COM 类工厂中 CLSID 为{00024500-0000-0000-C000-000000000046} 的组件失败,原因是出现以下错误:80070005 拒绝访问。 (异常来自HRESULT:0x80070005 (E_ACCESSDENIED))。 错误原因: 网站应 ...
分类:Windows程序   时间:2020-07-19 16:26:31    阅读次数:94
Open-Domain Question Answering 开放域问答
内容源自 https://www.aclweb.org/anthology/2020.acl-tutorials.8.pdf 1描述开放域问题回答(QA)是利用大量不同主题的文献来回答问题的任务,是自然语言处理(NLP)、信息检索(IR)中长期存在的一个问题。 及相关领域(沃海等人,1999年;摩尔 ...
分类:其他好文   时间:2020-06-26 01:05:10    阅读次数:147
Alink漫谈(六) : TF-IDF算法的实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。本文将为大家展现Alin... ...
分类:编程语言   时间:2020-06-05 23:23:35    阅读次数:107
257条   1 2 3 4 ... 26 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!