今天处理的一个文件里面中文都变成了形如”\xe4..."的十六进制编码,其他字符正常。 大致研究了下发现这些编码三个一组表示一个汉字,由于文本中夹杂着正常符号,我决定用正则匹配方式将三个一组的十六进制码字符串替换为其代表的汉字。 输入文件内容如: 结果为 ...
分类:
编程语言 时间:
2017-12-17 00:17:27
阅读次数:
919
17:40:17,249 ERROR DefaultDispatcherErrorHandler:42 - Exception occurred during processing request: could not initialize proxy - no Session org.hibern ...
分类:
其他好文 时间:
2017-12-16 19:46:16
阅读次数:
228
预备 照张相片 selenium.webdriver可以实现对显示页面的截图: 实际浏览器界面和截图结果 可以发现截图结果是浏览器内当前的显示内容。 让我想想...那只要让需要截图的元素出现在当前页面上,再从得到的截图里再把要的元素截取出来不就好啦? 那问题是怎么才能让当前元素先让我们看见呢? 让提 ...
分类:
其他好文 时间:
2017-12-16 18:44:16
阅读次数:
169
// 判断一个字符串是否都为数字 public boolean isDigit(String strNum) { return strNum.matches("[0-9]{1,}"); } // 判断一个字符串是否都为数字 public boolean isDigit(String strNum) ...
分类:
编程语言 时间:
2017-12-16 14:44:57
阅读次数:
116
Image类 Pillow中最重要的类就是Image,该类存在于同名的模块中。可以通过以下几种方式实例化:从文件中读取图片,处理其他图片得到,或者直接创建一个图片。 使用Image模块中的open函数打开一张图片:>>> from PIL import Image >>> im = Image.op... ...
分类:
编程语言 时间:
2017-12-15 22:36:01
阅读次数:
227
PIL基础操作 打开图片 ? BLUR:模糊滤波 ? CONTOUR:轮廓滤波 ? DETAIL:细节滤波 ? EDGE_ENHANCE:边界增强滤波 ? EDGE_ENHANCE_MORE:边界增强滤波(程度更深) ? EMBOSS:浮雕滤波 ? FIND_EDGES:寻找边界滤波 ? SMOOT ...
分类:
其他好文 时间:
2017-12-15 12:32:54
阅读次数:
183
public static void main(String[] args) { String str = "123我是456张三789的学生"; String regex2 = "\\d{1,}"; Pattern p = Pattern.compile(regex2); Matcher matc... ...
分类:
其他好文 时间:
2017-12-14 22:59:37
阅读次数:
152
使用PIL+pytesseract+tesseract-ocr python版本:3.6.3 tesseract-OCR 版本:3.02.02 ①安装Pillow cmd切换至pip:pip install Pillow ②安装pytesseract pip install pytesseract ...
分类:
编程语言 时间:
2017-12-13 19:59:13
阅读次数:
140
package unit; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Util { // 获取url路径的正则 private static final String URL_REG = ... ...
分类:
Web程序 时间:
2017-12-13 15:07:29
阅读次数:
166
在python3下用PIL做图像处理 Python Imaging Library (PIL)是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。 目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把 ...
分类:
其他好文 时间:
2017-12-13 11:28:31
阅读次数:
291