码迷,mamicode.com
首页 >  
搜索关键字:特征工程    ( 223个结果
机器学习(1)数学基础
1.机器学习定义:是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断的学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出 2.机器学习的一般过程:(1)数据收集 》(2)数据清洗 》(3)特征工程 ...
分类:其他好文   时间:2018-09-14 13:56:28    阅读次数:160
决策树(四)决策树调参
引言 在这篇文章中,我们将探讨决策树模型的最重要参数,以及它们如何防止过度拟合和欠拟合,并且将尽可能少地进行特征工程。我们将使用来自kaggle的泰坦尼克号数据。 导入数据 查看缺失值 把Cabin’, ‘Name’ and ‘Ticket’移除,并且填充缺失值,并处理分类型变量。 25%用作测试集 ...
分类:其他好文   时间:2018-09-14 01:04:26    阅读次数:290
机器学习值特征工程
详细内容看下面两位博主大神写的吧 https://www.cnblogs.com/pinard/p/9093890.html https://blog.csdn.net/weishiym/article/details/79629329 ...
分类:其他好文   时间:2018-09-13 22:32:26    阅读次数:175
networkX.core_number(graph)
今天在学习别人特征工程的时候,看到这样一个函数,max_kcore = pd.DataFrame(list(nx.core_number(graph).items()), columns=["qid", "kcore"]),找了半天找不到nx.core_number()函数返回的是什么。 官方文档是 ...
分类:Web程序   时间:2018-09-06 00:08:38    阅读次数:266
文本分类任务简介
文本分类任务框架: 文本→特征工程(决定着模型分类的上界)→分类器(逼近模型的上限)→类别 文本特征提取: 1.经典的文本特征(前人的研究的成熟理论) 2.手工构造新的特征(手工提取,看数据集中是否有好的性特征) 3.用神经网络提取(神经网络仅作为特征提取器来用) 经典的文本特征: TF、TFIDF ...
分类:其他好文   时间:2018-09-03 19:59:04    阅读次数:161
特征工程之离散变量处理
使用sklearn训练模型,只能输入数值型变量。因此需要对数据集中的非数值型离散变量进行处理,非数值型离散变量分为两类:有序型与无序型 一、有序型离散变量处理 什么叫有序型离散变量呢,比如说衣服尺码,M、L、XL;学历:小学、初中、高中、本科;这些都属于有序型变量。 在上图数据表格中,size及cl ...
分类:其他好文   时间:2018-08-29 01:18:19    阅读次数:325
机器学习:项目流程
原文出处:机器学习项目流程 原文作者:wxquare 1. 理解实际问题,抽象为机器学习能处理的数学问题 理解实际业务场景问题是机器学习的第一步,机器学习中特征工程和模型训练都是非常费时的,深入理解要处理的问题,能避免走很多弯路。 2. 获取数据 获取数据包括获取原始数据以及从原始数据中经过特征工程 ...
分类:其他好文   时间:2018-08-24 21:20:07    阅读次数:127
什么是机器学习
零、什么是机器学习利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策解决的问题:未来不确定场景的决策怎么解决问题利用计算机从历史数据中挖出的规律来解决问题机器学习要素主体主体是计算机数据数据量越大,找出的规律越精准规律通过算法,找到规律,机器学习系统利用规律自动生成落地方案一、机器学习的源动力从历史数据中找出规律,把这些规律用到对未来场景的预测与决定;用数据替代专家经济驱动,数
分类:其他好文   时间:2018-08-23 00:18:57    阅读次数:136
利用机器学习实现微信小程序-加减大师自动答题
之前有看到微信小程序《跳一跳》别人用python实现自动运行,后来看到别人用hash码实现《加减大师》的自动答题领取娃娃,最近一直在研究深度学习,为啥不用机器学习实现呢?不就是一个分类问题吗 如何实现自动答题微信小游戏《加减大师》? 思考: 图像识别吗? 如何建立特征工程? 选用什么算法? 一、图像 ...
分类:微信   时间:2018-08-08 00:32:49    阅读次数:319
机器学习算法
1.激活函数: 2.超参数:是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果 3.特征提取: 特征工程:若出现特征为字符串类型则使用独热编码 良好特征具备的特性:1.特征值应以非零值的形式在数据集中多 ...
分类:编程语言   时间:2018-07-26 18:48:57    阅读次数:152
223条   上一页 1 ... 12 13 14 15 16 ... 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!