PHP OCR实战:用Tesseract从图像中读取文字

澳门新葡亰网址 1

本文由码农网 –
邱康原创翻译,转载请看清文末的转载要求,欢迎参与我们的付费投稿计划!

一、为啥需要搭建环境

  为了解决环境不统一问题,所以要搭建这么个玩意儿

Optical Character Recognition (OCR)即光学字符辨识是把打印文本转换成一个数字表示的过程。它有各种各样的实际应用–从数字化印刷书籍、创建收据的电子记录,到车牌识别甚至破解基于图像的验证码。

二、步骤

  Laravel对环境有所要求(不使用Homestead情况下),具体参考官网

  
使用Homestead步骤

澳门新葡亰网址 1

  1. Homestead、VirtualBox、Vagrant

    摘要:

    Laravel
致力于让整个 PHP 开发体验变得愉快, 包括你的本地开发环境。 Vagrant
提供了一种简单,优雅的方式来管理和配置虚拟机。 Laravel Homestead
是一个官方预封装的 Vagrant
box,它为你提供了一个完美的开发环境,而无需在本地机器安装 PHP 、Web
服务器和其他服务器软件。不用担心会搞乱你的操作系统!Vagrant boxes
是一次性的。如果出现问题,你可以在几分钟内销毁并创建 Box! Homestead
可以运行在任何 Windows,Mac,或 Linux 系统,它包括了 Nginx web 服务器,
PHP 7.2,PHP 7.1,PHP 7.0,PHP 5.6,
MySQL,PostgreSQL,Redis,Memcached, Node,以及开发 Laravel
应用程序所需要的东西。——摘自后盾人向军大叔(网站升级中,后期补链接)

Tesseract是一个能实现OCR的开源项目。你能在*Nix系统,Mac系统和Windows系统上运行这个项目,但是只要使用一个库,我们就能在PHP项目中使用它了。本教程的目的是教你如何使用。

澳门新葡亰网址,   1. 1VirtualBox

    VirtualBox 是
Oracle 公司的开源虚拟机软件。VirtualBox
号称是最强的免费虚拟机软件,它不仅功能齐全,而且性能也很优异!VirtualBox
支持大部分流行的系统,如:Mac, Windows, Linux 等。

安装

   1.2Vagrant

    Vagrant
是用来管理虚拟机的工具,支持当前主流的虚拟机系统如
VirtualBox、VMware、AWS 等。Vagrant
的主要作用是提供一个可配置、可移植和复用的软件环境。Vagrant
让你通过编写一个 Vagrantfile
文件来控制虚拟机的启动、虚拟机网络环境的配置、虚拟机与主机间的文件共享,以及启动后自动执行一些配置脚本,如自动执行一个
Shell Script
来安装一些必备的开发工具,如安装配置MySQL、PHP,甚至是自动配置 Nginx
站点。这意味着,在一个多人开发的项目中,你只需要同步 Vagrantfile
文件,就可以保证参与项目的每个人各自的机器上拥有一致的开发环境。
可以在下面网站上搜索需要的vagrant
box

准备

为了让事情变得简单和一致的, 我们将使用虚拟机(本文使用Vagrant)来运行应用程序,这会涉及到安装PHP和Nginx,我们将安装Tesseract来分别演示过程。如果你想自己基于现有Debian-based系统安装Tesseract,你可以跳过下一部分—或者查看the README来获得在其他*nix上,Mac系统或者Windows的安装指导.

   1.3Homestead box

    Homestead是一个官方预封装的
Vagrant box,它为你提供了一个完美的开发环境,而无需在本地机器安装 PHP
、Web 服务器和其他服务器软件。不用担心会搞乱你的操作系统!Vagrant boxes
是一次性的。如果出现问题,你可以在几分钟内销毁并创建
Box!内置软件:Ubuntu 16.04、Git、PHP 7.2、PHP 7.1、Nginx、Apache 、MySQL
……

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章

网站地图xml地图