码迷,mamicode.com
首页 > Web开发 > 详细

大数据实战之千万量级小说网站项目开发(存储、复杂搜索、推荐、分析)

时间:2020-11-04 17:35:23      阅读:34      评论:0      收藏:0      [点我收藏+]

标签:查询   关联   编辑   drive   logs   算法   部分   大数据   数据存储   

大数据实战之千万量级小说网站项目开发(存储、复杂搜索、推荐、分析)

随着时代的发展,小说已经成为了许许多多的人减压放松的目的,一部小说能够被人看到需要经过许许多多的代码和程序的编辑,从小说的存储、热度、排行、分类再到搜索,基于用户以往看过的小说进行的推荐,以及作者更新章节后的实时更新,小说后台对于每本书的热度、喜好程度进行权重的更新,这些都是在小说背后实实在在需要解决的问题。

本次课程就是针对百万小说数据的推荐、热度、内容等进行搜索、推荐、分析的项目.让大家在真实数据的实战中真真正正的掌握大数据存储、搜索及推荐等内容。

一、小说网站架构讲解
1.本项目的背景及目标
2.项目的架构设计
3.项目的架构选型
4.组件的安装

二、千万小说数据索引及存储
1.网站数据详解
2.mysql数据迁移到es
3.logstash配置编写
4.logstash数据迁移
5.小说存储及rowkey设计
6.小说导入javaBean类编写
7.小说数据迁移mr编写
8.数据导入rowkey代码编写
9.mr driver部分编写
10.数据迁移至hbase

三、网站复杂搜索功能实现
1.网站原始代码简介
2.网站搜索功能实现
3.网站添加搜索功能
4.搜索页面结果查看
5.小说搜索分词讲解
6.mapping分词器的添加分词功能
7.代码添加IK分词器
8.小说网站高亮搜索实现
9.拼音搜索功能实现
10.拼音搜索代码修改
11.从es获取小说详情页
12.收藏自增功能实现
13.es的乐观锁
14.小说章节数据迁移
15.小说章节查询功能实现
16.章节详情页搜索
17.网站最近更新小说功能实现
18.网站作品分类聚合展示功能
19.小说月周日热度榜
20.连载、完结top榜单
21.top10作家榜
22.新增作品功能实现

四、小说网站推荐引擎
1.推荐系统概述
2.推荐算法介绍
3.基于内容的推荐
4.基于协同过滤的推荐
5.基于关联规则的推荐

五、网站分析相关
1.小说网站用户数据分析
2.es集群规划讲解
3.es集群监控
4.Hbase监控
5.项目总结

大数据实战之千万量级小说网站项目开发(存储、复杂搜索、推荐、分析)

标签:查询   关联   编辑   drive   logs   算法   部分   大数据   数据存储   

原文地址:https://blog.51cto.com/12762695/2546353

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有
迷上了代码!