1、不同类别文本量统计,类别不平衡差异 2、文本长度统计 3、文本处理,比如文本语料中简体与繁体共存,这会加大模型的学习难度。因此,他们对数据进行繁体转简体的处理。 同时,过滤掉了对分类没有任何作用的停用词,从而降低了噪声。 4、上文提到训练数据中,存在严重的样本不均衡问题,如果不对该问题做针对性的 ...
分类:
其他好文 时间:
2019-07-02 16:15:03
阅读次数:
135
"Practice Link" A. gpa 题意: 有$n$门课程,每门课程的学分为$s_i$,绩点为$c_i$,要求最多删除$k$门课程,使得gpa最高。 gpa计算方式如下: $$ \begin{eqnarray } gpa = \frac{\sum s_ic_i}{\sum s_i} \en ...
分类:
其他好文 时间:
2019-06-30 09:42:28
阅读次数:
116
"Practice Link" A. run 题意: 白云每次可以移动$1$米或者$k$米,询问移动的米数在$[L, R]$范围内的方案数有多少。 思路: $dp[i][2]$表示到第$i$米,是通过$1$米的方式过来的还是$k$米的方式过来的,递推即可。 代码: c++ include using ...
分类:
其他好文 时间:
2019-06-30 09:24:52
阅读次数:
108
"Practice Link" J. Different Integers 题意: 给出$n$个数,每次询问$(l_i, r_i)$,表示$a_1, \cdots, a_i, a_j, \cdots, a_n$中有多少个不同的数。 思路: 先分别离线求出$a_1, \cdots a_i$以及$a_j ...
分类:
其他好文 时间:
2019-06-30 09:22:33
阅读次数:
75
"Practice Link" J. Rikka with Nickname 题意: 给出$n$个字符串,要求依次合并两个串$s, t$,满足将$t$合并到$s$中变成$r$,使得$s$是$r$的前缀,并且$t$是$r$的一个子序列。 思路: 动态维护序列自动机,贪心插入即可。 代码: c++ in ...
分类:
其他好文 时间:
2019-06-30 09:16:22
阅读次数:
82
爬楼梯 题目描述在你面前有一个n阶的楼梯,你一步只能上1阶或2阶。请问计算出你可以采用多少种不同的方式爬完这个楼梯。 输入描述:一个正整数n(n<=100),表示这个楼梯一共有多少阶输出描述:一个正整数,表示有多少种不同的方式爬完这个楼梯 题型:动态规划 思路:斐波那契数列 ...
分类:
移动开发 时间:
2019-06-27 11:04:14
阅读次数:
148
数据集为玻森命名实体数据。 目前代码流程跑通了,后续再进行优化。 项目地址:https://github.com/cyandn/practice/tree/master/NER 步骤: 数据预处理: 加载数据: 构建模型: 训练: 预测: 参考: https://zhuanlan.zhihu.com ...
分类:
其他好文 时间:
2019-06-24 09:15:34
阅读次数:
126
给定数字 0-9 各若干个。你可以以任意顺序排列这些数字,但必须全部使用。目标是使得最后得到的数尽可能小(注意 0 不能做首位)。例如:给定两个 0,两个 1,三个 5,一个 8,我们得到的最小的数就是 10015558。 现给定数字,请编写程序输出能够组成的最小的数。 输入格式: 输入在一行中给出 ...
分类:
编程语言 时间:
2019-06-22 17:01:32
阅读次数:
106
With the 2010 FIFA World Cup running, football fans the world over were becoming increasingly excited as the best players from the best teams doing ba ...
分类:
其他好文 时间:
2019-06-19 18:33:40
阅读次数:
79
#ifndef VIRTUALFUNCTION_H #define VIRTUALFUNCTION_H /* *覆盖虚函数的返回值,可以是本类类型的指针或者引用,且父类可转为子类。其他覆盖虚函数,返回类型必须相同,参数类型必须相同,参数类型的顺序必须相同。 */ class virtualFunct... ...
分类:
编程语言 时间:
2019-06-16 14:12:23
阅读次数:
132