本赛题分为三个模块:文字检测、文字识别、命名实体识别。 赛题要求将图片中的所有文字检测并识别出来,并从识别出的文字中提取出企业名称。 文字检测模块 数据准备 ICDAR2019-LSVT数据集,下载并解压后的数据集如下: ~/train_data/LSVT/text_localization └─ ...
分类:
其他好文 时间:
2020-11-19 12:52:24
阅读次数:
10
#object: 查看数据是否大于某个数 #writer: mike #time: 2020,11,12 a <- c(1,2,3,4,5) b <- c(6,7,8,9,2) #构造数据框 data <- data.frame(a,b) #这会返回大于1 的真值表,这个表与原数据集对应 data[ ...
分类:
其他好文 时间:
2020-11-18 12:46:48
阅读次数:
7
1、大数据有哪些特点? valume(大量) velocity(高速) variety(多样) value(低价值密度) 2、什么是大数据? 指无法在一定的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信 ...
分类:
其他好文 时间:
2020-11-16 13:51:20
阅读次数:
9
数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。 数据结构就是相互之间有联系的具有某种组织方式的数据集合。 比如说学生数据可以定义为一个多维的数组,只有这样我们再写增加学生时,才能知道具体增加就是增加一个数组元素并未其赋值。 抽象数据类型( ADT,Abstract Data Type) ...
分类:
其他好文 时间:
2020-11-12 13:36:45
阅读次数:
8
切片(slice)是 Golang 中一种比较特殊的数据结构,这种数据结构更便于使用和管理数据集合。切片是围绕动态数组的概念构建的,可以按需自动增长和缩小。切片的动态增长是通过内置函数 append() 来实现的,这个函数可以快速且高效地增长切片,也可以通过对切片再次切割,缩小一个切片的大小。因为切 ...
分类:
其他好文 时间:
2020-11-11 15:50:01
阅读次数:
5
(一)RDD、DataFream、DataSet 理解 1. RDD理解 (1) RDD定义为弹性分布式数据集合。 MR运算之间数据共享差: MR的计算之间的数据共享只能通过将数据写入外部存储系统。后一步计算需要从外部存储系统中加载进来的方式进行。 Spark 思路相反,设计了一种抽象-RDD(弹性 ...
分类:
其他好文 时间:
2020-11-10 10:31:29
阅读次数:
3
集合List 、Set、Map的区别与联系 一、结构特点 List、Set是存储单列的数据集合,都继承与Collection接口。 Map是存储键值对这样的双列数据的集合,是个独立接口。 List中存储的数据是有序的,可以是重复的。 Set中存储的数据是无序的,且不允许重复。 Map中存储的数据是无 ...
分类:
其他好文 时间:
2020-11-08 17:14:57
阅读次数:
16
运用sklearn进行主成分分析(PCA)代码实现 一、前言及回顾 二、sklearn的PCA类介绍 三、分类结果区域可视化函数 四、10行代码完成葡萄酒数据集分类 五、完整代码 六、总结 一、前言及回顾 从上一篇《PCA数据降维原理及python应用(葡萄酒案例分析)》,我们知道,主成分分析PCA ...
分类:
Web程序 时间:
2020-11-07 16:06:32
阅读次数:
23
基本概念部分,批处理和流处理的区别批处理在大数据世界有着悠久的历史,比较典型的就是spark。批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。批处理模式中使用的数据集通常符合下列特征:(1)有界:批处理数据集代表数据的有限集合(2)持久:数据通常始终存储在某种类型的持久存储位置中(3)大量:批处理操作通常是处理极为海量数据集的唯一方法批处理非常适合需要访问全套记录才能完成的计算工作。例
分类:
其他好文 时间:
2020-11-06 02:26:18
阅读次数:
29
近年来,人工智能 (AI) 在涉及单一模态如语音、自然语言和视觉等领域,取得了重大突破。在单一模态的任务上,如物体识别、语音识别、机器翻译等,AI 系统在特定数据集上的表现水平与人类相当。随着单模态人工智能潜在问题的解决,研究人员意识到更高层次的AI任务往往涉及到跨多种模式的更复杂的信息处理。同时, ...
分类:
编程语言 时间:
2020-11-06 01:43:37
阅读次数:
22