1.Locality Sensitive Hashing(Shingling+MinHash) (LSH, 局部敏感哈希) 2. Learning to Hash 1.Introduction 很多的网页挖掘问题都可以表述为寻找相似集合: 1. 论文查重; 2. 推荐系统; 2.Finding Si ...
分类:
其他好文 时间:
2019-03-23 13:11:55
阅读次数:
143
冷启动主要分为3类: 1. 用户冷启动:主要解决如何给新用户做个性化推荐的问题。对于新用户,没有行为数据,无法根据历史行为预测其兴趣,从而无法为其做个性化推荐。 2. 物品冷启动:主要解决新的物品推荐给可能对它感兴趣的用户 3. 系统冷启动:在一个新开发的网站上设计个性化推荐系统。 一、利用用户注册 ...
分类:
其他好文 时间:
2019-03-22 00:25:34
阅读次数:
110
一、时间上下文 1. 用户的兴趣是变化的 2. 物品有生命周期 3. 季节效应 系统时间特性的分析 在给定时间信息后,推荐系统从一个静态系统变成了时变系统,而用户的行为数据也变成了时间序列。 二、地点上下文 ...
分类:
其他好文 时间:
2019-03-22 00:16:06
阅读次数:
126
数据仓库DW数据来源:爬虫 日志采集系统 业务数据 财务系统 数据去向:报表系统、用户画像推荐系统、机器学习、风控系统 项目需求分析 ① 数据采集平台搭建② 实现用户行为数据仓库的分层搭建③ 实现业务数据仓库的分层搭建④ 针对数据仓库中的数据进行,留存、转化率、GMV(每天交易额)、复购率、活跃等报 ...
分类:
其他好文 时间:
2019-03-19 01:21:02
阅读次数:
186
《深入浅出Python机器学习》PDF,280页,带书签目录,文字可以复制;配套源代码。 作者:段小手 下载: https://pan.baidu.com/s/1XUs-94n0qKR1F9rS8KNLHw 提取码: dv74 《深入浅出Python机器学习》内容涵盖了有监督学习、无监督学习、模型优 ...
分类:
编程语言 时间:
2019-03-15 00:52:42
阅读次数:
984
《自然语言处理理论与实战》高清PDF,362页,带书签目录,文字可以复制;配套源代码。唐聃等著。 《大数据智能互联网时代的机器学习和自然语言处理技术》PDF,293页,带书签目录,文字可以复制,彩色配图。刘知远等著。 下载: https://pan.baidu.com/s/1waP6C086-32_ ...
分类:
编程语言 时间:
2019-03-14 09:16:15
阅读次数:
1405
一、人工智能之自然语言处理 自然语言处理(Natural Language Processing, NLP),是人工智能的分支科学,意图是使计算机具备处理人类语言的能力。 “处理人类语言的能力”要达到什么效果呢?举个例子!班主任问路班长:“你能把粉笔递过来么?”。这句话有两层意思,第一层:你能不能把 ...
分类:
其他好文 时间:
2019-03-10 16:19:45
阅读次数:
208
一.分析所采用数据的来源有哪些? 1.国家相关部门统计信息主要包括央行、银监会、证监会、国家统计局、政府网、互联网络信息中心发布的数据统计信息(如通过统计局发布的数据得知春运的客流人数) 2.第三方机构统计数据,主要包括天猫大数据、搜数网、统计网、数据堂、淘宝指数、百度指数、艾瑞咨询、知网数据、万方 ...
分类:
其他好文 时间:
2019-02-25 19:02:37
阅读次数:
242
"做中学"之“极客时间”课程学习指导 [TOC] 点击 https://www.mosoteach.cn/ 安装蓝墨云班课,使用班课号“449238”加入,我们一起学习。 Java程序设计 移动平台开发 网络攻防实践 信息安全系统设计基础 信息安全专业导论 极客时间课程列表 Winter.程劭非.重 ...
分类:
其他好文 时间:
2019-02-25 13:26:57
阅读次数:
242
推荐算法相关 [TOC] 推荐系统介绍 What:分类目录、搜索引擎、推荐系统 Why:需要在信息过载、用户需求不明确的背景下,留住用户和内容生产者,实现商业目标 评估指标 准确性 学界:RMSE、MAE、Recall、Precision 业界 头条:阅读 阅读时长 分享/评论 关注/付费 快手:播 ...
分类:
编程语言 时间:
2019-02-12 18:34:05
阅读次数:
286