1 机器学习概览 1.1 机器学习定义 计算机程序利用经验E学习任务T,他的性能P会随着经验E不断增长。例如垃圾邮件过滤器,传统的编程技术只是针对指定的关键词(credit card,sale house)进行过滤。如果出现新的关键词保险,则需要更新标记。基于机器学习的垃圾邮件过滤器会自动检测保险关 ...
分类:
其他好文 时间:
2020-03-12 17:14:02
阅读次数:
61
机器学习是什么 给予计算机学习能力,应用场景主要有:垃圾邮件识别,下棋,房价预测等等。 监督学习 监督学习的数据集由正确答案组成, 有回归问题(推测出连续值,如房价),分类问题(推测出离散的输出,如鉴别肿瘤的种类) 无监督学习 数据集没有标签,应用领域如:谷歌同类新闻推送,多DNA的特定相同基因鉴别 ...
分类:
其他好文 时间:
2020-02-29 16:18:12
阅读次数:
77
scalable:可扩展的 end to end :端到端 state of the art:先进 sparsity:稀疏性 sketch:草图 spam:垃圾邮件 malicious attackers:恶意攻击者 defacto:事实上 ...
分类:
其他好文 时间:
2020-02-25 21:49:18
阅读次数:
74
企业邮箱是以企业域名做后缀的邮箱,几乎是企业成立伊始就要配备的工具。对外它能体现公司的品牌和形象,对内它方便对员工信箱进行统一管理。那么如何选择企业邮箱进行注册呢?有以下几点需要考虑:1.安全稳定由于一般用于企业和客户之间的沟通,所以选择企业邮箱时最看重的一点是要安全、稳定,在防病毒、反垃圾邮件方面要做得好。比如ZohoMail,它同时提供免费个人邮箱和企业邮箱,由于很多个人邮箱会被滥用,结果会被
分类:
其他好文 时间:
2020-02-24 22:33:10
阅读次数:
111
前言 睡不着,那就起来学习其实base64模块很早之前用过今天做爬虫的时候有个URL需要用它来编码一下 所以百度又学了一下遇到最大的问题就是python3和python2区别问题 python3的这个不支持直接上字符串纠结了好久。 base64编码 Base64是网络上最常见的用于传输8Bit字节代 ...
分类:
编程语言 时间:
2020-01-22 10:59:24
阅读次数:
80
描述:在Exchange运维中,平时遇到很多用户反馈退信。而Exchange只给你一些错误代码如5505.1.0类似此类代码,让你一脸懵逼。有时候你确定问题所在(如、对方邮件服务器宕机、对方设反垃圾邮件网关导致、等等),却无从验证你的观点,下面给大家介绍一下我的解决步骤,以供各位参考。过程:1、根据退信内容可以看到对方邮件服务器IP地址。Telnet对方邮件服务器25,查看对方服务器或端口是否正常
分类:
其他好文 时间:
2020-01-19 16:30:51
阅读次数:
133
IP地址是每台计算机的唯一标识符,它基本上是一串数字,并以句点分隔。IP地址主要用于定位和识别计算机,这有点像我们人类的视网膜或者指纹。垃圾邮件发送者和黑客通常会代理自己的IP地址,让我们难以识别其真实的IP地址。然而,值得注意的是,IP地址的物理位置不一定是计算机的位置。 Geotool Geot ...
分类:
其他好文 时间:
2020-01-15 11:55:18
阅读次数:
336
在这一章,我们将建立一个垃圾邮件过滤分类模型。我们将使用一个包含垃圾邮件和非垃圾邮件的原始电子邮件数据集,并使用它来训练我们的ML模型。我们将开始遵循上一章讨论的开发ML模型的步骤。这将帮助我们理解工作流程。 在本章中,我们将讨论以下主题: l 定义问题 l 准备数据 l 数据分析 l 构建数据的特 ...
MAPS的全称是Mail Abuse Prevention Systems官方站点是 www.mail-abuse.com他是一个反垃圾邮件组织提供的黑洞列表(Blackhole List)这个列表包含了IP地址和域名信息根据这个列表,邮件服务器可以在接收邮件头时候检查MAPS清单如果是黑名单中的, ...
分类:
其他好文 时间:
2020-01-12 10:11:00
阅读次数:
93
一、概念 1. 布隆过滤器是一个数据结构:bit数组+随机映射函数 2. 作用:高效判断某个元素是否在给定的集合中 3. 缺点:有一定的错误识别率,随着数据量越大,错误识别率越大;并且不容易删除 二、原理 1. 加入元素: a. 使用布隆过滤器中的哈希函数,计算元素的哈希值,可能有多个哈希函数,对应 ...
分类:
其他好文 时间:
2020-01-11 13:06:02
阅读次数:
63