随着数字化技术应用的广泛普及,业界对于软件测试的要求也在持续迭代与增加。当前,越来越多的企业和组织都相继采用了Agile和DevOps之类的软件开发方法,以鼓励和促进测试团队和开发团队之间的紧密协作。根据Gartner的预测:到2020年,IT行业的开发总成本将从3.76亿美元增长至3.87万亿美元 ...
分类:
其他好文 时间:
2020-05-21 19:22:26
阅读次数:
82
import csvimport nltkfrom nltk.corpus import stopwordsfrom nltk.stem import WordNetLemmatizer# 词性pos赋值def get_word_pos(tag): if tag.startswith('J'): r ...
分类:
其他好文 时间:
2020-05-21 16:25:34
阅读次数:
40
准备 查看磁盘的基本信息 !df -hl 1 !pwd 1 我们这里只做最基本的数据处理所以只引入了基本包 另外引入了ti的session后面通过它将数据上传到cos import os, gc import pandas as pd import numpy as np from ti impor ...
分类:
编程语言 时间:
2020-05-21 16:10:20
阅读次数:
140
Rancher+Kubeflow,再也不用担心机器学习的复杂性啦!
Kubeflow可以让机器学习(ML)工程师和数据科学家能够轻松地利用云资产(公有云或本地机房)来处理ML工作负载。本文将详细介绍如何在Rancher上安装Kubeflow,包括前期的集群准备、NFS设置以及如何访问Kubeflow UI。点开文章,轻松扩展机器学习能力!
分类:
其他好文 时间:
2020-05-21 10:19:11
阅读次数:
63
监督学习的数据就是有标签数据,无监督学习的数据就是无标签数据。 有标签的数据应该就是采用有监督学习方式,像线性分类器,神经网络等;无标签的数据采用非监督学习方式,比如聚类等方法。 半监督式学习问题介于监督式和非监督式学习之间。这里有一个好例子如:照片分类,但是只有部分照片带有标签(如,狗、猫和人), ...
分类:
其他好文 时间:
2020-05-21 09:38:17
阅读次数:
275
【摘要】作为公有云的数据底座,大量的应用场景产生的数据都会存储到OBS对象存储服务中,如直播、电商、大数据可视化、机器学习、物联网等。作为公有云的海量存储基础服务, OBS提供了灵活的权限配置功能,解决如共享少部分数据或者数据全部托出等实际应用场景的数据管理诉求。 OBS目前有四种权限管理的方式供大 ...
分类:
其他好文 时间:
2020-05-20 12:22:41
阅读次数:
142
一、什么是K近邻算法? 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源: KNN算法最早是由Cover和Hart提出的一种分类算法. 计算距离公式: 两个样本的距离可以通过如下公式计算,又叫欧式距离。 比如说,a(a1 ...
分类:
编程语言 时间:
2020-05-20 12:17:07
阅读次数:
62
一、线性回归的概念 1.1、定义 线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合。 优点:结果易于理解,计算不复杂。 缺点:对非线性的数据拟合不好。 适用数据类型:数值型和标称型。 1.2、分类 一元线性回归:涉及到的变量只有一 ...
分类:
编程语言 时间:
2020-05-20 12:03:58
阅读次数:
100
一、概率基础 概率定义:概率定义为一件事情发生的可能性,例如,随机抛硬币,正面朝上的概率。 联合概率:包含多个条件,且所有条件同时成立的概率,记作:𝑃(𝐴,𝐵) 。 条件概率:事件A在另外一个事件B已经发生条件下的发生概率,记作:𝑃(𝐴|𝐵) 。P(A1,A2|B) = P(A1|B)P ...
分类:
编程语言 时间:
2020-05-20 12:00:22
阅读次数:
73
Siamese network 孪生神经网络--一个简单神奇的结构 mountain blue 机器学习爱好者 名字的由来 Siamese和Chinese有点像。Siam是古时候泰国的称呼,中文译作暹罗。Siamese也就是“暹罗”人或“泰国”人。Siamese在英语中是“孪生”、“连体”的意思,这 ...
分类:
Web程序 时间:
2020-05-19 14:48:23
阅读次数:
136