Tika类型检测 Tika支持MIME所提供的所有互联网媒体文件类型。每当一个文件通过Tika检测到该文件,其文件类型。检测的介质类型,Tika内部通过以下机制。 MIME标准 多用途Internet邮件扩展(MIME)标准,用于识别文件类型的最佳标准。这些标准的知识有助于在内部相互作用的浏览器。 ...
分类:
其他好文 时间:
2019-09-27 15:21:35
阅读次数:
82
一、github地址:https://github.com/1371272989/WC.exe 实现功能: 1、-c:统计字符数; 2、-w:统计单词数; 3、-l:统计行数; 4、-a:统计复杂数据(空行、代码行和注释行); 5、-s:递归处理目录下符合条件的文件; 通配符没有全面,只能辨别后缀。 ...
分类:
编程语言 时间:
2019-09-25 22:31:54
阅读次数:
148
太久没用git了,都忘记了git怎么用了,正好最近在Linux学习中涉及到了相关的知识,这里把文件通过git上传到GitHub远程仓库的步骤记录一下 1.首先初始化仓库 2.设置连接远程仓库SSH/HTTP连接路径(这个具体路径直接从GitHub上复制即可) 3.配置用户信息 4.将文件添加到索引 ...
分类:
其他好文 时间:
2019-09-24 10:27:27
阅读次数:
73
1、YUM优化优化基础的yum源文件通过阿里镜像源进行优化:curl-o/etc/yum.repos.d/CentOS-Base.repohttp://mirrors.aliyun.com/repo/Centos-7.repo优化扩展的yum源文件通过阿里镜像源进行优化:wget-O/etc/yum.repos.d/epel.repohttp://mirrors.aliyun.com/repo/e
分类:
系统相关 时间:
2019-09-22 02:05:15
阅读次数:
165
版本:spak2.3 相关源码:org.apache.spark.SparkContext 在创建spark任务时候,往往会指定一些依赖文件,通常我们可以在spark-submit脚本使用--files /path/to/file指定来实现。 但是架构上是通过livy来调spark任务,livy的实 ...
分类:
其他好文 时间:
2019-09-21 16:42:14
阅读次数:
115
Python中一切皆对象。只有对象才能调用方法。文件本身也是一个对象。文件操作流程:打开文件 通过句柄操作文件 关闭文件1.建立对象(文件)open(文件路径),同一目录下,直接写文本的名字2.读文件data=open('小重山','r') .read() 读模式,调用read方法,读取文件内容pr ...
分类:
编程语言 时间:
2019-09-21 12:21:04
阅读次数:
78
假设consul软件安装在电脑ComputerA上,那么需要注册的服务ServiceA1也需要安装在电脑ComputerA上, 一个服务就是一个提供了ip+port(或者域名)的应用程序。 服务: 1、通过consul配置文件或;consul就通过读取配置文件, 2、通过consul提供的http的 ...
分类:
其他好文 时间:
2019-09-20 19:36:59
阅读次数:
89
一、装配Bean就是在xml写一个Bean标签;装配完Bean,还需要读取xml配置文件创建Spring容器来创建对象; 1、new 实现类方式 正常的三种创建Bean容器的方法都可以根据装配的Bean创建的Bean对象; 2、静态工厂模式方式 其中,静态工厂方式不用创建工厂对象,直接类名点静态方法 ...
分类:
其他好文 时间:
2019-09-18 00:28:20
阅读次数:
249
[TOC] 数据库系统解决的问题:持久化存储,优化读写,保证数据的有效性 当前使用的数据库,主要分为两类 文档型,如sqlite,就是一个文件,通过对文件的复制完成数据库的复制 服务型,如mysql、postgre,数据存储在一个物理文件中,但是需要使用终端以tcp/ip协议连接,进行数据库的读写操 ...
分类:
数据库 时间:
2019-09-18 00:18:08
阅读次数:
140
1 背景 用户本地有一份txt或者csv文件,无论是从业务数据库导出、还是其他途径获取,当需要使用蚂蚁的大数据分析工具进行数据加工、挖掘和共创应用的时候,首先要将本地文件上传至ODPS,普通的小文件通过浏览器上传至服务器,做一层中转便可以实现,但当这份文件非常大到了10GB级别,我们就需要思考另一种 ...
分类:
Web程序 时间:
2019-09-16 16:05:57
阅读次数:
119