一、数据集介绍 该案例描述的是一段时间内客户的订单,预测用户下一次将会买那些订单。 数据集的信息如下: products.csv 商品信息 order_products__prior.csv 订单与商品关系信息 orders.csv 订单信息 aisles.csv 商品所属的具体类别 1、 prod ...
分类:
其他好文 时间:
2020-05-17 15:57:47
阅读次数:
55
1、概述 “Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。 2、原始表 3、简单Group By 示例1 select 类别, sum(数量) as 数量之和 from A gr ...
分类:
数据库 时间:
2020-05-17 09:18:36
阅读次数:
68
FCN与U-Net语义分割算法 图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环,也是 AI 领域中一个重要的分支。语义分割即是对图像中每一个像素点进行分类,确定每个点的类别(如属于背景、人或车等),从而进行区域划分。目前,语义分割已经被广 ...
分类:
编程语言 时间:
2020-05-16 20:29:36
阅读次数:
128
文本分类实现步骤: 1. 定义阶段:定义数据以及分类体系,具体分为哪些类别,需要哪些数据 2. 数据预处理:对文档做分词、去停用词等准备工作 3. 数据提取特征:对文档矩阵进行降维、提取训练集中最有用的特征 4. 模型训练阶段:选择具体的分类模型以及算法,训练出文本分类器 5. 评测阶段:在测试集上 ...
分类:
其他好文 时间:
2020-05-15 00:17:01
阅读次数:
75
基于贝叶斯定理与特征条件独立假设的分类方法 首先基于特征条件独立假设学习输入/输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y, 有监督的学习算法,解决的是分类问题,客户是否流失、是否值得投资、信用等级评定等多分类问题 简单易懂、学习效率高、在某些领域的分类 ...
分类:
其他好文 时间:
2020-05-14 19:50:34
阅读次数:
69
数据仓库设计方案 一.概述 数据仓库的特征在于面向主题、集成性、稳定性和时变性,用于支持管理决策。数据仓库的存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供统一的、规范的数据出口。数据仓库在构建过程中通常都需要进行分层处理。业务不同,分层的技术处理手段也不同。数仓分层的主要原因: 清晰数据 ...
分类:
其他好文 时间:
2020-05-14 15:36:27
阅读次数:
196
一,典型课题研究 RFM模型与客户生命周期分析 二,数据 1,数据源:http://www.tableauhome.com.cn/ 2,字段含义 UseId : 用户id class1 :所属类别1 class2 :所属类别2 code :编号 流水号 产品描述 会员创建日期 销售日期 销售金额 3 ...
分类:
其他好文 时间:
2020-05-13 23:06:13
阅读次数:
228
odoo12 通过一个字段控制另一个Many2one字段的domain 场景:用户在选择产品类别的时候,二级联动到对应产品,就是设置一个搜索范围限制 对于先使用odoo10,再使用odoo12以后,对于同样的功能,差别真的是深有体会,先来说一下12的,毕竟来的都是求知的。 直接看代码: @api.o ...
分类:
其他好文 时间:
2020-05-13 17:19:12
阅读次数:
150
LDA原理 LDA思想 这里的LDA是指Linear Discriminant Analysis,简称LDA,全称线性判别分析。要与自然语言处理领域的LDA(Latent Dirichlet Allocation)隐含狄利克雷分布区分开来。 LDA是一种监督学习降维技术,它的数据集的每个样本是有类别 ...
分类:
其他好文 时间:
2020-05-13 17:17:16
阅读次数:
76
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类是为了确定点的类别,具体有哪些类别是已知的,是监督学习。 聚类是把点成若干类,事先是没有类别的,是一种无监督学习。 监督学习:从正确的例子中学习 无监督学习:缺乏足够的先验知识 2.朴素贝 ...
分类:
编程语言 时间:
2020-05-13 11:47:11
阅读次数:
73