码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘    ( 2538个结果
大数据分析有什么含义
大数据分析是指对规模巨大的数据进行分析,挖掘数据的有利信息并加以有效利用,将数据的深层价值体现出来。有了大数据分析才能让规模巨大的数据有条有理,正确分类,产生有价值的分析报告,从而应用到各领域中,促进其发展。  有以下五个基本方面,关于大数据分析:  第一、分析可视化  可视化可以直观地显示数据,让数据来说话,让观众听到的结果——不管是对数据分析专家还是一个普通用户,数据进行可视化是数据通过分
分类:其他好文   时间:2020-07-13 15:12:00    阅读次数:156
K-近邻算法
一、概述 k-近邻算法(k-Nearest Neighbour algorithm),又称为KNN算法,是数据挖掘技术中原理最简单的算法。KNN 的工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻 近的k个实例,如果这k个实例的多数属于某个类别,那么 ...
分类:编程语言   时间:2020-07-11 17:13:58    阅读次数:54
12款最好用的数据挖掘工具
数据在当今世界意味着金钱。随着向基于app的世界的过渡,数据呈指数增长。然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式。数据挖掘或“数据库中的知识发现”是通过人工智能、机器学习、统计和数据库系统发现大数据集中的模式的过程。免费的数据挖掘工具包括从完整的模型开发环境如Knime和Orange,到各种用Java、c++编写的库,最常见的是P
分类:其他好文   时间:2020-07-04 09:12:57    阅读次数:975
肿瘤分析数据挖掘及信息解读
肿瘤基础 特点: 疾病,无线增殖 基因相关 细胞进化过程中发展异常,突变积累 概念: germline mutation: 生殖细胞突变 somatic mutation: 体细胞突变,不可遗传 driver mutation 关键突变 passenger mutation 无关紧要 二次打击学说: ...
分类:其他好文   时间:2020-07-01 23:38:46    阅读次数:221
SVM简述
转自他人文章转自:https://blog.csdn.net/v_july_v/article/details/7624837 1 介绍 SVM(Support Vector Machines)——支持向量机是在所有知名的数据挖掘算法中最健壮,最准确的方法之一,它属于二分类算法,可以支持线性和非线性 ...
分类:其他好文   时间:2020-06-30 22:20:55    阅读次数:72
(七)数据精简之(数据值精简和字段的精简)
一、数据精简之数值精简 ?1. 数据值精简的需求 ? 原始数据中存在太细、过于底层的数据数值,对于许多数据挖掘方法而言,将无法从中找出层次较高、趋势导向的知识? 2.类别型数据数值精简 ? 数据一般化(Data Generalization)? 3.连续型数据数值精简 ? 数据离散化(Data Di ...
分类:其他好文   时间:2020-06-29 09:15:26    阅读次数:73
(六)数据精简之(数据记录精简)
数据精简之数据记录精简方法 1.数据记录精简的需求 ? 随着数据表中的数据记录愈来愈多,有两个问题会浮现出来 ? 整个数据挖掘所需的时间将跟着拉长 ? 所有统计的方法通通失效2.数据记录精简对所获得的知识影响 ? 求得之知识可能多少有些误差 ? 然而当数据集合中存在无关、偏差的数据记录时,将数据记录 ...
分类:其他好文   时间:2020-06-28 09:52:05    阅读次数:109
[开源] .Net 使用 ORM 访问 神舟通用数据库(神通)
前言 天津神舟通用数据技术有限公司(简称“神舟通用公司”),隶属于中国航天科技集团(CASC)。是国内从事数据库、大数据解决方案和数据挖掘分析产品研发的专业公司。公司获得了国家核高基科技重大专项重点支持,是核高基专项的牵头承担单位。自1993年在航天科技集团开展数据库研发以来,神通数据库已历经27年 ...
分类:数据库   时间:2020-06-28 09:49:15    阅读次数:90
(二)数据挖掘需要哪些技术
1. 数据挖掘需要哪些基本的技术 统计学知识和技术(Statistical Techniques) 可视化的画图展示技术(Visualization Tchniques):比如可以利用相关软件来画出柱状图、散点图等等 一些常用的数据挖掘技术. KNN K紧邻算法 常用数据挖掘建模技术 2.常用数据挖 ...
分类:其他好文   时间:2020-06-27 17:30:38    阅读次数:77
模块B(数据分析)
一.python问题 问题1:Pandas创建多列函数在jupyter下,需要独立的单元格才能创建成功 问题2:数据挖掘与分析之4分位数 四分位数计算所遇到的问题,怎么利用索引+1来显示numpy内对应的数值? 解决思路:如上图,我们现在已经有了Q3,Q1的位置值(索引值)6 & 2,利用for循环 ...
分类:其他好文   时间:2020-06-25 21:48:50    阅读次数:91
2538条   上一页 1 ... 5 6 7 8 9 ... 254 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!