码迷,mamicode.com
首页 >  
搜索关键字:nlp    ( 935个结果
天池nlp文本分类新人赛 Task.1md
赛题解读: https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.6406111aIKCSLV&postId=118252 赛题报名: https://tianchi.aliyun.com/competition ...
分类:其他好文   时间:2020-07-22 01:47:35    阅读次数:92
NLP——天池新闻文本分类 Task1
NLP——新闻文本处理:TASK1 赛题理解与nlp初识 1.数据读取 在竞赛主页下载好数据集利用pandas打开: #coding=utf-8 import pandas as pd #my_font = font_manager.FontProperties(fname="C:\Windows\ ...
分类:其他好文   时间:2020-07-21 23:13:12    阅读次数:112
NLP系列——(一)概述
1、基本原理 S 表示一连串特定顺序排列的词 , ,…, 使用链式法则计算词序列 S 发生的概率 由于上述条件概率过于复杂,因此引入马尔科夫假设 马尔科夫假设:第 I 个词仅与前面的 k 个词有关 取 k=1,将上式简化为 计算 对大量文本进行阅读,并统计得到 在文本中出现的概率 词序列 在文本中出 ...
分类:其他好文   时间:2020-07-21 22:21:39    阅读次数:73
【NLP】RNN、LSTM、GRU
RNN 循环神经网络。像之前的CNN只能处理单独的输入,前一个输入与后一个输入没有关系。但例如NLP中,我们需要前后文的信息。所以RNN应运而生。 标准的RNN中,1)N input -- N output 2)权值共享,W、U、V每个都是一样的。 实际中,这一种结构无法解决所有问题。所以也有了以下 ...
分类:其他好文   时间:2020-07-17 19:40:13    阅读次数:72
《梯度下降法的步长到底怎么确定?》
Nick-Atom AI炼金术士一枚, 主攻推荐/广告/NLP 一张图搞定人生系列: 1, 看趋势(图2) loss往上走甚至产生小山包(黄线) or 下降的特别急(绿线), 后几个epoch没变化, lr过高, 调低。 绿线还可以考虑lr decay loss趋近于线性(蓝线), lr过低, 调高 ...
分类:其他好文   时间:2020-07-17 11:23:42    阅读次数:97
模拟内存计算如何解决边缘人工智能推理的功耗挑战
模拟内存计算如何解决边缘人工智能推理的功耗挑战 How analog in-memory computing can solve power challenges of edge AI inference 机器学习和深度学习已经成为生活中不可或缺的一部分。人工智能(AI)应用通过自然语言处理(NLP ...
分类:其他好文   时间:2020-07-09 13:51:53    阅读次数:76
【百面】01_特征工程
《百面机器学习》这本书真的是太好了,忍不住要记录一下学习过程中的所思所想。文章内容仅做适当摘取和记录,如有所需,请购书!另外,本文中所摘抄的内容,仅是个人认为比较重要的地方(实际上是想学习的内容)。比如NLP有关的东西,实在是打不起兴趣,舍去了... 机器学习是要和数据打交道,数据如何表征?如何将数 ...
分类:其他好文   时间:2020-07-06 10:46:01    阅读次数:62
NLP的文本分析与特征工程
作者|Mauro Di Pietro 编译|VK 来源|Towards Data Science 摘要 在本文中,我将使用NLP和Python解释如何为机器学习模型分析文本数据和提取特征。 自然语言处理(NLP)是人工智能的一个研究领域,它研究计算机与人类语言之间的相互作用,特别是如何对计算机进行编 ...
分类:其他好文   时间:2020-07-02 16:19:36    阅读次数:51
[NLP] Reformer: The Efficient Transformer
1.现状 (1) 模型层数加深 (2) 模型参数量变大 (3) 难以训练 (4) 难以fine-tune 2. 单层参数量和占用内存分析 层参数设置参数量与占用内存 1 layer 0.5Billion 0.5Billion * 4Byte = 2GB embedding layer 64K tok ...
分类:其他好文   时间:2020-07-02 00:27:27    阅读次数:75
NLP中的标识化
作者|ARAVIND PAI 编译|VK 来源|Analytics Vidhya 概述 标识化是处理文本数据的一个关键 我们将讨论标识化的各种细微差别,包括如何处理词汇表外单词(OOV) 介绍 从零开始掌握一门新的语言令人望而生畏。如果你曾经学过一种不是你母语的语言,你就会理解!有太多的层次需要考虑 ...
分类:其他好文   时间:2020-06-28 12:49:22    阅读次数:64
935条   上一页 1 ... 5 6 7 8 9 ... 94 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!