OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。项 ...
使用Python制作一个简易的OCR图片文字识别工具:键盘上的PrtScr按键+画图工具+百度AI图片识别(账户,调用接口)+python 常见的OCR工具: 1. Microsoft Onenote实在是找不到那个右键 --> copy as text2. Google One Drive对中文的 ...
分类:
其他好文 时间:
2020-01-22 12:42:39
阅读次数:
113
2019刚出校门,初到公司,最大的成就是完成了一个全球抓取数据的系统!简单介绍一下这个项目的实现思路以及在项目中踩过的坑,随时告诫自己以后尽量避免! 历时一个半月还多几天,终于通过交付测试了!项目是从全球范围内,通过Google,Bing,雅虎来抓取数据,由于服务器不是特别的好,并且考虑到会有很多的 ...
分类:
其他好文 时间:
2020-01-22 01:16:02
阅读次数:
312
众所周知,前端近几年闹了一场革命。前端在编程领域也掀起了学习潮。至少在中国,从2013年下半年至今,在搜索指数上,有着爆炸式的增长。可以看下数据:百度指数,Google指数。 一边是日新月异的新知识不断的冲击着前端,一边是各种新人疯狂涌入前端领域。这两股新流冲击下,倒是火了很多技术社区、问答网站,如 ...
分类:
其他好文 时间:
2020-01-21 20:05:07
阅读次数:
79
Node.js简介 Node.js是一个能够在服务器端运行JavaScript的开源代码、跨平台JavaScript运行环境 Node采用Google开发的V8引擎运行js代码,使用事件驱动、非阻塞和异步I/O模型等技术来提高性能,可优化应用程序的传输量和规模 Node大部分基本模块都用JavaSp ...
分类:
Web程序 时间:
2020-01-21 19:40:14
阅读次数:
62
前段时间学习和了解了下Google的开源C++单元测试框架Google Test,简称gtest,非常的不错。 我们原来使用的是自己实现的一套单元测试框架,在使用过程中,发现越来越多使用不便之处,而这样不便之处,gtest恰恰很好的解决了。 其实gtest本身的实现并不复杂,我们完全可以模仿gtes ...
分类:
其他好文 时间:
2020-01-21 00:24:22
阅读次数:
85
写在前面 上篇IaaS-PaaS-SaaS定义中介绍了云计算的3种服务模型: 本文解释这张图的由来,即云服务模型的演进过程 一.表层模型 早在2008年,Microsoft等公司(在此之前还有Amazon、Google)就在探索云服务了。推出Azure时,Microsoft提出了这样的模型图: 用来 ...
分类:
其他好文 时间:
2020-01-20 20:49:53
阅读次数:
79
【web前端】HTML基础 一、BS模式 BS(Browser-Server)模式:顾名思义为浏览器-服务器的意思,对比的话类似我们PC上面浏览器使用的产品即为BS模式产品,例如google doc、各类网站等。 服务端开启一个socke进程 #!/usr/bin/env python # -*- ...
分类:
编程语言 时间:
2020-01-20 19:27:01
阅读次数:
116
In July 2004, Google posted on a giant billboard along Highway 101 in Silicon Valley (shown in the picture below) for recruitment. The content is supe ...
分类:
其他好文 时间:
2020-01-20 09:19:14
阅读次数:
64
3.1 PageRank排名算法 3.1.1 算法概述 PageRank,即网页排名,又称网页级别、Google 左侧排名或佩奇排名 是Google 创始人拉里·佩奇和谢尔盖·布林于1997 年构建早期的搜索系统原型时提出的链 接分析算法,在揉合了诸如Title 标识和Keywords 标识等所有其 ...
分类:
编程语言 时间:
2020-01-19 20:45:18
阅读次数:
130