# -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import matplotlib.pyplot as plt import numpy as np from sklearn.model_s ...
分类:
编程语言 时间:
2020-04-04 22:57:19
阅读次数:
111
经过一周的团队讨论分析,我们给自己的团队选题确定了大致的方向。今天就其中机器学习对文本数据的分析处理简单介绍一下NABCD 1.N: (1)原创用户对文章抄袭问题的反感 (2)低质量文章造成用户不好的体验 2.A: (1)使用机器学习的文本分析算法,对发布的文章进行分析 3.B: (1)实现知识共享 ...
分类:
其他好文 时间:
2020-04-04 20:19:20
阅读次数:
63
Python实现十大经典排序算法 代码最后面会给出完整版,或者可以从 "我的Github" fork,想看动图的同学可以去 "这里" 看看; 小结: 1. 运行方式,将最后面的代码copy出去,直接python sort.py运行即可; 1. 代码中的健壮性没有太多处理,直接使用的同学还要检查检查; ...
分类:
编程语言 时间:
2020-04-04 19:06:02
阅读次数:
78
按照任务类型可分为: 回归模型 :例如预测明天的股价。 分类模型 :将样本分为两类或者多类。 结构化学习模型 :输出的不是向量而是其他 结构。 按照学习理论可分为: 监督学习 :学习的样本 全部 具有标签,训练网络得到一个最优模型。 无监督学习 :训练的样本 全部 无标签,例如 聚类样本。 半监督学 ...
分类:
其他好文 时间:
2020-04-04 16:17:11
阅读次数:
122
简单总结一下机器学习最常见的两个函数,一个是logistic函数,另一个是softmax函数,若有不足之处,希望大家可以帮忙指正。本文首先分别介绍logistic函数和softmax函数的定义和应用,然后针对两者的联系和区别进行了总结。 1. logistic函数 1.1 logistic函数定义 ...
分类:
其他好文 时间:
2020-04-04 09:54:45
阅读次数:
61
数据探索综合指南 苏尼尔·雷( SUNIL RAY) 2016年1月10日 总览 有关数据探索(EDA)的完整教程 我们涵盖了数据探索的几个方面,包括缺失值估算,异常值去除和特征工程的技巧 介绍 没有数据浏览的捷径。如果您处于一种状态,那么机器学习可以使您摆脱每次数据风暴,相信我,事实并非如此。经过 ...
分类:
其他好文 时间:
2020-04-04 09:36:20
阅读次数:
74
在spark ml pipeline的特征提取和转换阶段,有一种transformer可以将机器学习训练数据中常见的字符串列(例如表示各种分类)转换为数值索引列,以便于计算机处理。它就是StringIndexer。它支持的索引范围为[0, numLabels)(不支持的会编码为numLabels), ...
分类:
其他好文 时间:
2020-04-04 09:34:33
阅读次数:
69
本周任务: 1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的P ...
分类:
其他好文 时间:
2020-04-03 13:42:12
阅读次数:
72
随着人工智能、大数据时代的到来,Python这门编程语言也出现在大家的视野之中,更多人都开始关注Python。Python语法易懂、编写简洁,拥有丰富的库,作为人工智能的首选语言,Python是非常值得学习的。那么学Python做爬虫有前途吗?为大家介绍一下。
分类:
编程语言 时间:
2020-04-03 00:56:55
阅读次数:
131
通过实例快速入门Pandas在数据分析, 机器学习中的应用. ...
分类:
其他好文 时间:
2020-04-02 21:03:01
阅读次数:
111