码迷,mamicode.com
首页 >  
搜索关键字:处理文本    ( 769个结果
C# 正则表达式大全
原文地址:https://www.cnblogs.com/hehehehehe/p/6043710.html 文章导读 正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串。正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法。Regex 类表示不可变 ...
分类:Windows程序   时间:2018-05-24 12:43:28    阅读次数:313
文本处理三剑客之awk
简介 awk是一种处理文本文件的语言,是一个强大的文本编辑工具。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分在进行各种分析处理。 gawk 用法:gawk [options] 'PATTERN{ACTION STATEMENTS}' FILE... gawk [opt ...
分类:其他好文   时间:2018-05-16 22:29:24    阅读次数:136
Elasticsearch的停用词(stopwords)
1、问题 在使用搜索引擎(Elasticsearch或Solr)作为应用的后台搜索平台的时候,会遇到停用词(stopwords)的问题。 在信息检索中,停用词是为节省存储空间和提高搜索效率,处理文本时自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。停用词大致分为两类。一类是语 ...
分类:其他好文   时间:2018-05-15 10:45:43    阅读次数:2834
正则表达式学习汇总
正则表达式是一种工具,用于匹配和处理文本的字符串。正则表达式使用正则表达式语言来实现的。 它的优点是:功能强大,语言简洁。 缺点:不容易识读。 (本篇文章以Eclipse+Java来验证) 在Java中使用正则表达式,需要引入java.util.regex包中的三个类:Pattern类、Matche ...
分类:其他好文   时间:2018-05-14 17:34:18    阅读次数:126
java基础知识回顾-4(方法)
1.什么是java的方法? 在我们的日常生活中,方法可以理解为要做某件事情,而采取的解决办法。 在java中,方法就是用来完成解决某件事情或实现某个功能的办法。 方法实现的过程中,会包含很多条语句用于完成某些有意义的功能——通常是处理文本,控制输入或计算数值。 我们可以通过在程序代码中引用方法名称和 ...
分类:编程语言   时间:2018-05-14 11:46:42    阅读次数:142
正则表达式
定义:一些用来匹配和处理文本的字符串 主要用途:搜索,替换 1. 匹配单个字符 .字符(英文符号)可以匹配任何一个单一的字符、字母、数字、甚至是.本身。但是在绝大多数的正则表达式实现里,不能匹配换行符 \.意思是匹配.本身,而不是任意字符 2. 匹配一组字符 这个主要通过字符集的方式来实现。用[]来 ...
分类:其他好文   时间:2018-05-11 20:18:08    阅读次数:168
第八章 内部字段分隔符IFS、脚本调试DEBUG
第八章内部字段分隔符IFS、脚本调试DEBUG内部字段分隔符内部字段分隔符(internalfieldseparator,IFS)是shell脚本中的一个特殊变量,在处理文本数据时很有用。把单个数据流划分成不同的数据元素的定界符,内部字段分隔符就是用于特定用途的定界符。IFS是存储定界符的环境变量,是shell环境中的默认定界符字符串,默认值为空白字符(换行符、制表符、空格)迭代一个字符串或者CS
分类:其他好文   时间:2018-05-10 18:08:07    阅读次数:123
全文检索-Lucene.net
例子的组件版本 Lucene.Net:3.0.3.0 盘古分词:2.4.0.0 分词例子 分词是核心算法,将完整的句子分词成若干个词或字;同时它只能处理文本信息,非文本信息只能转换成为文本信息,无法转换的只能放弃。 所有供全文搜索的要先写入索引库,索引库可以看成存放数据的数据库 搜索对象建立的时候( ...
分类:Web程序   时间:2018-05-10 00:32:12    阅读次数:189
理解存储引擎
mysql中建立的库 >文件夹 库中建立的表 >文件 生活中我们用来存储数据的文件有不同的类型,每种文件类型对应各自不同的处理机制:比如处理文本用txt类型,处理表格用excel,处理图片用png等。 数据库中的表也应该有不同的类型,表的类型不同,会对应mysql不同的存取机制,表类型又称为存储引擎 ...
分类:其他好文   时间:2018-05-09 21:01:25    阅读次数:440
linux三剑客sed之模式空间与保持空间
patternspace(模式空间)andholdspace(保持空间)(H、h、G、g、x)模式空间:sed处理文本内容行的一个临时缓冲区,模式空间中的内容会主动打印到标准输出,并自动清空模式空间保持空间:sed处理文本内容行的另一个临时缓冲区,不同的是保持空间内容不会主动清空,也不会主动打印到标准输出,而是需要sed命令来进行处理模式空间与保持空间的关系模式空间:相当于流水线,文本行再模式空间
分类:系统相关   时间:2018-05-06 10:32:39    阅读次数:228
769条   上一页 1 ... 23 24 25 26 27 ... 77 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!