众所周知, 斯坦福大学自然语言处理组 出品了一系列NLP工具包,但是大多数都是用Java写得,对于Python用户不是很友好。几年前我曾基于斯坦福Java工具包和NLTK写过一个简单的中文分词接口: Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器 ,不过用起来也不是很方便。深度学习 ...
分类:
编程语言 时间:
2020-04-15 13:47:31
阅读次数:
191
NLP 1、NLP=NLU+NLG 语义理解 意思生成文本或者语义 NLU:语音/文本->意思 natural language understanding NLG:意思->文本/语音 natural language generation 2、为什么NLP比别的更难?why NLP is hard ...
分类:
其他好文 时间:
2020-04-15 00:14:13
阅读次数:
93
这是一篇翻译,原文是How to Be a Successful PhD Student (in Computer Science (in NLP/ML))http://people.cs.umass.edu/~wallach/how_to_be_a_successful_phd_student.p ...
分类:
其他好文 时间:
2020-04-08 12:20:00
阅读次数:
83
实体嵌入(embedding)目的将表格数据中的分类属性(一个至多个)向量化。1.实体嵌入简介:实体嵌入是主要应用于深度学习中处理表格分类数据的一种技术,或者更确切地说NLP领域最为火爆,word2vec就是在做word的embedding。神经网络相比于当下的流行的xgboost、LGBM等树模型... ...
分类:
其他好文 时间:
2020-04-05 00:32:18
阅读次数:
108
[TOC] 文本表示哪些方法? 基于one hot、tf idf等的bag of words; 基于词向量的固定表征:word2vec、fastText、glove 基于词向量的动态表征:elmo、GPT、bert one hot存在的问题 one hot表征无法反应词与词之间的相关性问题,即语义鸿 ...
分类:
其他好文 时间:
2020-04-04 14:34:28
阅读次数:
216
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户(初学者和高级用户)的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合,这些库使它可以保持活力和高效 ...
分类:
编程语言 时间:
2020-03-31 14:08:00
阅读次数:
95
开篇: 从事NLP方向的工作也有一年了,前前后后也学到了很多东西,但是就是没有整理过,现在从原理和应用的方面将所有知识总结方便复习管理。 一、word2vec word2vec可以说得上是NLP的一个里程碑。将每个单词离散表示,既解决了one-hot的巨大维度,也解决了one-hot的部分语义问题。 ...
分类:
其他好文 时间:
2020-03-30 23:45:00
阅读次数:
180
近年来很多研究将nlp中的attention机制融入到视觉的研究中,得到很不错的结果,于是,论文侧重于从理论和实验去验证self attention可以代替卷积网络独立进行类似卷积的操作,给self attention在图像领域的应用奠定基础 论文: On the Relationship betw ...
分类:
其他好文 时间:
2020-03-30 12:38:24
阅读次数:
252
参考来源:https://www.paddlepaddle.org.cn/documentation/docs/zh/user_guides/nlp_case/label_semantic_roles/README.cn.html 1.源数据介绍 自然语言分析技术大致分为三个层面:词法分析、句法分析 ...
分类:
其他好文 时间:
2020-03-30 09:35:17
阅读次数:
93