数据挖掘 贝叶斯分类 [toc] 1. 贝叶斯分类器概述 1.1 贝叶斯分类器简介 1.1.1 什么是贝叶斯分类器? 贝叶斯分类器是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类器 1.1.2 朴素贝叶斯分类器 朴素贝叶斯分类器是贝叶斯分类器中最简单,也是最常见的一种分类方法。 ...
分类:
其他好文 时间:
2020-03-30 19:28:36
阅读次数:
90
Task3特征工程 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式: log(1+x1+me ...
分类:
其他好文 时间:
2020-03-28 23:48:19
阅读次数:
127
智慧农业涉及的新技术有很多,比如遥感技术、地理信息系统、GPS全球定位系统、物联网技术、5G高速无线通信、各种传感器技术,通过数据分析和数据挖掘为主的大数据技术以及机器视觉和深度学习的人工智能技术等。
分类:
其他好文 时间:
2020-03-25 10:27:49
阅读次数:
89
1.2.1 赛题概况 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集 ...
分类:
其他好文 时间:
2020-03-25 09:16:08
阅读次数:
81
数据挖掘流程 source 此网址还提供了其他众多涉及数学科学的cheat sheet,非常推荐 算法的选择 source source source SIGAI算法地图 source: sklearn使用 source 此网页也提供了numpy,pandas, matplotlib,PySpark ...
分类:
其他好文 时间:
2020-03-21 17:49:48
阅读次数:
79
上文《报表自动化: 商业智能背后的秘密》主要讲了我认为的如何逐步做到商业智能,通过报表自动化、数据图表化、数据可视化、数据挖掘四步走的方式,逐步的让数据产生价值。 我们主要讲报表自动化,但在这之前我们需要有“大量的数据”支持,多次提到“大量的数据”,这些数据就是指我们各种产品在使用、运行过程中存到数 ...
分类:
其他好文 时间:
2020-03-20 22:03:08
阅读次数:
73
商业智能与报表自动化 首先先说说商业智能与报表自动化。 商业智能是(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。(百度百科) 报表自动化呢?是指将传统的人工整理报表(exc ...
分类:
其他好文 时间:
2020-03-20 22:02:37
阅读次数:
90
k-means中文称为K均值聚类算法,在1967年就被提出 所谓聚类就是将物理或者抽象对象的集合分组成为由类似的对象组成的多个簇的过程 聚类生成的组成为簇 簇内部任意两个对象之间具有较高的相似度,不同簇的两个对象之间具有较高的相异度 相异度和相似度可以根据描述的对象的属性值来计算 对象间的距离是最常 ...
分类:
编程语言 时间:
2020-03-20 10:51:29
阅读次数:
57
Q:python的学习前景 A: python作为时下流行语言可以应用于Python web开发、python网络爬虫、服务器运维、数据挖掘、AI等方面,就业前景非常乐观。 Q:web开发中前端后端如何交互 A: 在项目的时候,我们前后端会大概说一下接口地址,前端请求的参数,后端返回的参数,然后大家 ...
分类:
其他好文 时间:
2020-03-14 13:13:16
阅读次数:
60
随着物联网技术和5G技术的逐步普及,传统的云端集中式处理、数据存储将面临难解的瓶颈和压力。从数据的获取到数据的处理、深度学习,云端必须要在ZT级庞大的数据中进行信息处理、数据挖掘。同时由于网络带宽的限制、高昂的传输成本和较高的响应延时的问题,设备将不堪重负。从云到边,重心正在转移从传统单机本地存储,到企业本地数据中心,再从企业本地数据中心,迁移到云端,现在的趋势从云数据中心迁移到更靠近数据源头的“
分类:
其他好文 时间:
2020-03-14 09:14:02
阅读次数:
62