ylbtech-汉语-词语-往生:百科 往生是佛教用语,是摆脱过往的恶业业力束缚获得新生之过程,俗称死亡。 当下的业报身命终受生新的业报身,称之为往生新业报身所处世界。 往生法门可令行者脱离恶世,将五浊业报身转为清净法器身,于此善身中闻法修行,积累功德。修行往生法门的利益不仅仅是色身散坏之后,当下即 ...
分类:
其他好文 时间:
2020-02-05 13:28:13
阅读次数:
71
安装jieba:pip install jieba 原理: 基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法 ...
分类:
编程语言 时间:
2020-02-02 19:34:51
阅读次数:
263
jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 ...
分类:
其他好文 时间:
2020-02-02 19:31:12
阅读次数:
108
今天学习自然语言的算法 TF-IDF 算法 :关键词提取 TF-IDF的主要思想就是:如果某个词在一篇文档中出现的频率高,也就是TF高;在语料库中其他的文档中很少出现,就是DF低,也就是IDF高,则认为这个词具有很好的类区分能力。 TF为词频(Term Frequency),表示词t在文档d中出现的 ...
分类:
其他好文 时间:
2020-02-02 00:59:39
阅读次数:
86
在上一节介绍了标记的解析,就相当于识别了一句话里有哪些词语,接下来就是把这些词语组成完整的句子,即拼装标记为语法树。 树(tree) 树是计算机数据结构里的专业术语。就像一个学校有很多年级,每个年级下面有很多班,每个班级下面有很多学生,这种组织结构就叫树。 组成树的每个部分称为节点(Node); 最 ...
分类:
其他好文 时间:
2020-01-28 15:57:39
阅读次数:
110
题目如下: 编程题(请使用C语言或者C++完成以下题目):(基础5分) 中国文化博大精深,从仓颉造字开始,汉字一直流传到了今天。我们在感叹汉字的源远流长时,也不禁感慨,为什么没有一门使用汉字编程的语言? 汉字真的不能编程吗?最近文言文编程火了一把,吾有一數。曰三。名之曰「甲」。这朴实无华的变量定义无 ...
分类:
其他好文 时间:
2020-01-27 15:19:53
阅读次数:
82
该课题来源于UVA中Searching the Web的题目:https://vjudge.net/problem/UVA-1597 按照题目的说法,我对按照特定格式输入的文章中的词语合成字典,以满足后期的快速查找。 针对于字典的合成途径,我利用了STL中的map与set的嵌套形成了一种特定的数据结 ...
分类:
编程语言 时间:
2020-01-23 15:31:40
阅读次数:
113
前提 今天( )在编写 相关代码的时候,从 源码中的 和`GlobalEventExecutor ContextClassLoader Issue`: "ThreadDeathWatcher causes custom classLoader script memory leaks" "Ensure ...
分类:
编程语言 时间:
2020-01-20 09:20:50
阅读次数:
80
负命题及其推理 一、什么是负命题 负命题是否定命题的命题,由支命题和联结项构成。 例1、并非所有书籍都是有价值的。 例2、并非病毒是由细胞构成的。 分析:都属负命题,有对命题进行否定。负命题联结词常用“并非、并不是、是假的、是荒谬的”等词语表示。 负命题的真假取决于支命题的真假。其种类主要包括性质、 ...
分类:
其他好文 时间:
2020-01-16 00:38:16
阅读次数:
106
Mysql数据库的索引和视图详解索引的概念数据库的索引与书籍中的目录类似在一本书中,无需阅读整本书,利用目录就可以快速查找所需信息书中的目录是一个词语列表,其中注明了包含各个词的页码数据库索引在数据库中,索引数据库程序无需对整个表进行扫描,就可以在其中找到所需数据数据库中的索引是某个表中一列或若干列的集合,以及物理标识这些值的数据页的逻辑指针清单索引的作用设置了合适的索引之后,数据库利用葛总快速的
分类:
数据库 时间:
2020-01-10 18:52:14
阅读次数:
94