码迷,mamicode.com
首页 >  
搜索关键字:机器学习 模糊c均值 kmeans    ( 9578个结果
sklearn KMeans在训练集上训练,在预测集上预测
一般在有监督训练中,我们很自然地会用如下模式去预测测试集的分类:(以svm为例) svm.fit(x_train, y_train) y_pred=svm.predict(x_test) 那么无监督训练中是否也可以在一个数据集上训练,然后用训练好的模型直接调用predict()函数在另一个数据集上进 ...
分类:其他好文   时间:2020-09-17 17:12:13    阅读次数:39
机器学习简介
机器学习 机器学习的本质就是借助数学模型理解数据。当给模型装上可以适应观测数据的可调参数时,“学习”就开始了;此时的程序被认为具有从数据中“学习”的能力。一旦模型可以拟合旧的观测数据,那么它们就可以预测并解释新的观测数据。 机器学习的分类 机器学习应用的定性示例 小结 Scikit-Learn 而从 ...
分类:其他好文   时间:2020-09-17 16:48:02    阅读次数:15
李宏毅机器学习之概率归回
概率分布 假设每一个随机变量都符合高斯分布,那么根据已有的数据,就可以得到$\mu$ 和$\sigma$ 的估计值,从而得到其分布函数,然后就可以针对预测数据进行预测,针对多维数据,采用高维高斯分布,每一维度都是独立的,并且都符合高斯分布,计算出每一维度的高斯分布函数,可以得到多维高斯分布函数,然后 ...
分类:其他好文   时间:2020-09-12 21:12:57    阅读次数:40
数据分析,如何解决复杂的企业问题
很多同学表示:从0到1的文章很多,可面对复杂问题,该怎么搭建数据分析思路呢?首先,“复杂”一词在不同等级的数据分析师里含义不同。对小白而言,领导传达命令的时候,有“模型”俩字的就是复杂问题,一听“模型”,新人就开始狂翻《西瓜书》《统计学习》《机器学习》誓要与“模型”血战300回合。而有经验的同学都知道,企业里真正复杂的才不是这些。来看个具体例子:场景:电商行业(纸质书、视频光盘等商品为主),客服领
分类:其他好文   时间:2020-09-07 18:55:40    阅读次数:34
记-机器学习(1)-回归算法
1、什么叫回归算法: 常见的回归算法有: 线性回归、Logistic回归、Softmax回归...... ① 回归算法属于一种有监督学习 ② 回归算法是一种比较常用的机器学习算法,用来建立自变量(x)与因变量(y)之间的关系;从机器学习的角度来讲,用于构建一个算法模型(函数)来做属性(x)与标签(y ...
分类:编程语言   时间:2020-09-03 16:55:20    阅读次数:39
KubeCon 2020 演讲集锦|《阿里巴巴云原生技术与实践 13 讲》开放下载
我们筛选了云原生技术大会上 13 场有代表性的演讲重新编排成书,旨在将阿里巴巴云原生之路上宝贵的经验、理念和思想,提供给广大正在或准备踏上云原生之旅的开发者一些切实有用的参考。
分类:其他好文   时间:2020-09-02 18:11:16    阅读次数:68
如何为机器学习工程设计Python接口
前言为了进行机器学习工程,首先要部署一个模型,在大多数情况下作为一个预测API。为了使此API在生产中工作,必须首先构建模型服务基础设施。这包括负载平衡、扩展、监视、更新等等。乍一看,所有这些工作似乎都很熟悉。Web开发人员和DevOps工程师多年来一直在自动化微服务基础设施。当然,我们可以重新定位他们的工具?不幸的是,我们不能。虽然ML的基础结构与传统的DevOps类似,但它与ML的特殊性足以使
分类:编程语言   时间:2020-09-02 16:55:22    阅读次数:67
【机器学习 Azure Machine Learning】Azure Machine Learning 访问SQL Server 无法写入问题 (使用微软Python AML Core SDK)
问题情形 使用Python SDK在连接到数据库后,连接数据库获取数据成功,但是在Pandas中用 to_sql 反写会数据库时候报错。错误信息为:ProgrammingError: ('42000', "[42000] [Microsoft][SQL Server Native Client 11 ...
分类:数据库   时间:2020-08-28 15:02:00    阅读次数:75
机器学习(3)
一、模型评估与选择 2.2.1留出法 1、直接将数据集划分为两个互斥的集合,即D=sUt,s∩t=空集 2、在s上训练出模型,用t来评估其测试误差 3、s/t的划分尽可能保持数据分布的一致性,至少要保持样本的类别比例相似 4、若s,t中的样本比例差别很大,则误差估计将由训练/测试数据分布的差异而产生 ...
分类:其他好文   时间:2020-08-28 11:48:55    阅读次数:52
10个优秀的数据挖掘工具,一定不要错过
在机器学习的流程中数据挖掘是重要的一环。数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程。今天给大家介绍10个最强的数据挖掘工具,欢迎小伙伴们收藏起来。1.KNIMEKNIME可以完成常规的数据分析,进行数据挖掘,常见的数据挖掘算法,如回归、分类、聚类等等都有。而且它引入很多大数据组件,如Hive,Spark等等。它还通过模块化的数据流水线概念,集成了机器学习和数据挖掘的各种组件,能够
分类:其他好文   时间:2020-08-24 16:32:14    阅读次数:59
9578条   上一页 1 ... 22 23 24 25 26 ... 958 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!