理论部分: 矢量计算 在模型训练或预测时,我们常常会同时处理多个数据样本并用到矢量计算。在介绍线性回归的矢量计算表达式之前,让我们先考虑对两个向量相加的两种方法。 向量相加的一种方法是,将这两个向量按元素逐一做标量加法。 向量相加的另一种方法是,将这两个向量直接做矢量加法。 线性回归的基本要素 模型 ...
分类:
其他好文 时间:
2020-02-14 18:22:13
阅读次数:
90
什么是监督学习、无监督学习、强化学习、弱监督学习、半监督学习、多示例学习?随着机器学习问题不断深入人心,人们也将现实中遇到不同的问题分为不同的学习方式,其中,最基础的应属监督学习,无监督学习和强化学习了。 监督学习(supervised learning):已知数据和其一一对应的标签,训练一个智能算 ...
分类:
其他好文 时间:
2020-02-14 18:04:37
阅读次数:
307
文本预处理 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 读入文本 import collections import re def read_time_machine(): with open('/home/kesci/inp ...
分类:
其他好文 时间:
2020-02-14 11:01:10
阅读次数:
54
本文始发于个人公众号: TechFlow,原创不易,求个关注 上一篇文章我们复习了函数求导的定义和一些常见函数的导数,今天这篇文章我们回顾一下复杂函数的求导方法。先强调一下,今天的文章很重要,想要看懂机器学习各种公式推导,想要能够自己推一推各种公式,函数求导是基础中的基础,在算法这个领域,它比积分要 ...
分类:
其他好文 时间:
2020-02-14 10:56:50
阅读次数:
401
语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为𝑇的词的序列𝑤1,𝑤2,…,𝑤𝑇,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: 本节我们介绍基于统计的语言模型,主要是𝑛元语法(𝑛-gram)。 语言模型 假设序列𝑤1,𝑤2,…,𝑤𝑇中的每个词是 ...
分类:
编程语言 时间:
2020-02-14 10:30:47
阅读次数:
106
似然 这个词害死人啊! 拽什么拽啊,就是 最大可能估计!还有什么极大似然估计。都是坑人的,都一样。 最大似然估计是机器学习领域最为常见的用来构建 目标函数 的方法。 他的核心思想是:根据观测到的结果来预测其中的未知参数。 假设有一枚硬币,它是不均匀的,也就是说出现正面的反面的概率是不同的。假设我们设 ...
分类:
其他好文 时间:
2020-02-13 21:21:07
阅读次数:
100
包含:经典机器学习、深度学习、强化学习、计算机视觉、分布式训练、自动建模、平台 1 . 适用于经典机器学习的工具 一、SciKit-learn star 39.2k fork 19.2k scikit-learn 是一种强大的基于 Python 语言的机器学习算法库(https://scikit-l ...
分类:
其他好文 时间:
2020-02-12 22:32:06
阅读次数:
114
安装各种机器学习包的时候,经常出现无法下载安装包的问题,而导致安装失败。清华的镜像速度很快,下面对本方法进行讲解。 命令法 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple packages 注:把packages替换为安装模块。 配置法 ...
分类:
其他好文 时间:
2020-02-12 13:24:44
阅读次数:
147
本文始发于个人公众号: TechFlow,原创不易,求个关注 在之前的文章当中,我们一起推导了 线性回归 的公式,今天我们继续来学习上次没有结束的内容。 上次我们推导完了公式的时候,曾经说过由于有许多的问题,比如最主要的复杂度问题。随着样本和特征数量的增大,通过公式求解的时间会急剧增大,并且如果特征 ...
分类:
其他好文 时间:
2020-02-12 11:11:10
阅读次数:
84
一、线性回归 1、模型 2、损失函数 3、优化函数-梯度下降 #!/usr/bin/env python # coding: utf-8 import torch import time # init variable a, b as 1000 dimension vector n = 1000 a ...
分类:
其他好文 时间:
2020-02-12 10:53:33
阅读次数:
110