安装 jieba jieba 支持三种分词模式: 精确模式:将句子最精确地切开,适合文本分析 全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义 搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词 jieba.cut 方法有三个参数,第一个 ...
分类:
编程语言 时间:
2018-09-09 00:45:24
阅读次数:
207
1.前言:为什么我们要关心模型的bias和variance? 大家平常在使用机器学习算法训练模型时,都会划分出测试集,用来测试模型的准确率,以此评估训练出模型的好坏。但是,仅在一份测试集上测试,存在偶然性,测试结果不一定准确。那怎样才能更加客观准确的评估模型呢,很简单,多用几份测试数据进行测试,取多 ...
分类:
其他好文 时间:
2018-09-07 17:59:18
阅读次数:
638
针对微信转发分享链接等过程中,域名被QQ管家云安全过滤拦截而无法正常浏览, 例如该网页包含诱导分享内容,被多人投诉等。 本平台提供微信域名拦截(停止访问)监测接口服务, 我们的监控系统能快速及时地把已被拦截的域名通知对方,为了灵活性地与第三方平台无缝对接特别地提供专业API接口实时监控着域名的状态, ...
分类:
微信 时间:
2018-09-06 20:03:26
阅读次数:
281
特点 支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 精确模式,试图将句子最精确地切开,适合文本分析; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 支持繁体分词 支持自定义词典 MIT 授权协议 支持三种 ...
分类:
其他好文 时间:
2018-09-06 18:13:24
阅读次数:
1490
代码实现: 结果: 可视化(查看每个预测条件的影响): 分析:鸢尾花的花萼长度在小于6时预测准确率很高,随着长度的增加,在6~7这段中,预测出现较大错误率,当大于7时,预测会恢复到较好的情况。宽度也出现类似的情况,在3~3.5这个范围出现较高错误,因此在训练中建议在训练数据中适量增加中间部分数据的训 ...
分类:
其他好文 时间:
2018-09-04 13:52:33
阅读次数:
205
BurpSuite--Scanner功能 0x00 配置 Scanner有四个选项 Result -- 展示扫描结果 Scan queue -- 显示扫描的队列 Live scanning -- 我们也可以对请求的域、路径、IP地址、端口、文件类型进行控制 Options -- 针对这主动/被动两种 ...
分类:
其他好文 时间:
2018-09-04 00:15:23
阅读次数:
1765
Abstract 设计移动设备上的CNN具有挑战性,需要保证模型小速度快准确率高,人为地权衡这三方面很困难,有太多种可能结构需要考虑。 本文中作者提出了一种用于设计资源受限的移动CNN模型的神经网络结构搜索方法。作者提出将时间延迟信息明确地整合到主要目标中,这样搜索模型可以识别一个网络是否很好地平衡 ...
分类:
Web程序 时间:
2018-09-02 18:38:25
阅读次数:
2704
神经网络相关名词解释 这篇文章的目的是把之前概念理解的名词用公式记忆一下。 1. 正则化 1.0 过拟合 这是正则化主要解决的问题。 过拟合现象主要体现在accuracy rate和cost两方面: 1.模型在测试集上的准确率趋于饱和而训练集上的cost仍处于下降趋势 2.训练集数据的cost趋于下 ...
分类:
其他好文 时间:
2018-09-02 16:06:47
阅读次数:
404
五、精准率和召回率的平衡 Precision-Recall 的平衡 六、精准率-召回率曲线 七、ROC曲线 Receiver Operation Characteristic Curve 描述 TPR 和 FPR 之间的关系 metrics.py 八、多分类问题中的混淆矩阵 我写的文章只是我自己对b ...
分类:
其他好文 时间:
2018-09-01 20:33:37
阅读次数:
172
"练习使用的数据 diabetes.csv" "备用百度网盘地址" 导入要用到的包 输出要被分类的特征列,柱状图可能更加直观 KNN 模型准确率的折线图 线性逻辑回归 准确率的打印以及 图形展示 ...
分类:
其他好文 时间:
2018-08-29 16:56:40
阅读次数:
232