OpenJDK Tess4j Tesseract环境构建镜像

教程分享 > Docker部署案例 > 博文分享 (19) 2025-08-07 12:28:47

概述

本文接上一篇:Tess4j Linux/Ubuntu需要安装额外依赖程序说明,构建在Linux中可运行Tess4j的环境。

 

Tess4j 4.x 环境构建

Tesseract  4.1.1构建

Tess4j 4.x 依赖Tesseract 4.x,构建比较容易。基于官方OpenJDK17 slim镜像进行构建。Dockerfile 参考如下:

FROM openjdk:17-jdk-slim

# 安装 Tesseract OCR 和 Tess4J 所需的依赖
RUN apt-get update && \
    apt-get install -y --no-install-recommends \
    tesseract-ocr \
    tesseract-ocr-eng \
    tesseract-ocr-chi-sim \
    tesseract-ocr-chi-tra \
    libtesseract-dev \
    libleptonica-dev \
    && rm -rf /var/lib/apt/lists/*

构建命令:(与Dockerfile同目录执行)

docker build -t openjdk:17-slim-tesseract-ocr-4 .

构建完成后即可使用

提示:该方案安装完成后tesseract版本为4.1.1 与Tess4j 4.5.5 已完成了验证,确保可正常使用。

验证

docker run -it --rm --entrypoint /bin/bash your-image-name
tesseract --version
find / -name "libtesseract.so*" 2>/dev/null
ldd $(which tesseract)

Tess4j 5.x 环境构建

Tess4j 5.x 依赖Tesseract 5.x,构建需要源码编译对应版本的Tesseract,比较耗时且需要外网

Tesseract 5.3.3 构建

Dockerfile

VIP资源,登录后查阅

此处内容需要开通会员后查阅(刷新)

登录/注册

以上配置已通过完整的代码测试验证。

Tesseract 5.5.1构建

Dockerfile

# 使用openjdk 17 作为基础镜像
FROM openjdk:17-jdk-slim
# 只需要修改下面的两个环境变量版本即可编译
ENV TESSERACT_VERSION 5.5.1
ENV LEPTONICA_VERSION 1.83.1
# ----其余配置与上一个脚本一致,无语修改,所以下面部分忽略------

 

其他版本

根据上面源码编译脚本,修改环境变量里面的版本可源码构建4.0.0-5.5.1(最新版),需要注意leptonica版本对应关系

leptonica版本对应关系:

  • tesseract 5.3.2 - 5.5.1 对应 leptonica >=1.83.1(推荐:1.83.1)
  • tesseract 5.0.0 - 5.3.1 对应1.83.1>=leptonic >= 1.74.2 (推荐:1.74.2)
  • tesseract 4.x.x(4.x全系版本) 对应 leptonic >= (推荐:1.74.2)

 


相关文章
概述本文接上一篇:Tess4j Linux/Ubuntu需要安装额外依赖程序说明,构建在Linux中可运行Tess4j的环境。 Tess4j 4.x 环境构建T
在执行多次docker-compose build 之后,我们通过命令`docker images`可以看到很多的REPOSITORY 为<none&gtl; 且tag 也是<non...
docker入门使用教程/linux(centos)系统docker制作教程
docker 镜像制作报错 [Warning] IPv4 forwarding is disabled. Networking will not work.问题解决办法
背景Windows版本(Windows 10)docker 默认程序安装到c盘,数据存放于 C:\Users\当前用户名\AppData\Local\Docker\wsl\data\ext4.v...
在本文中,您将学习如何构建用于运行Spring引导应用程序的Docker镜像。我首先给你一个docker的简要概念,然后我们将为我们的spring启动应用程序创建一个docker镜像,并在本地运...
DockerMySQL官方镜像启动默认初始化创建数据库version:"3.8"networks:vRouter:external:true#外部网络services:mysql:image:m...
接上一篇harbor安装,这里讲解如何上传镜像到harbor。因上篇安装的是基于http,所以在上传端的docker需要添加一个配置。情况一没有/etc/docker/daemon.json配置...
docker 常用命令整理(持续更新)docker运行容器资源相关 查看所有运行docker的资源消耗情况docker stats 查看指定运行容器资源消耗情况docker stats 容器ID...
Docker Nodejs 18.20.4 环境编译vue项目 sudo docker run --rm --name node18c -v /your/pro
log4j使用,log4j框架在java编程中还是比较常见的,这里将会讲解通过log4j2的LevelRangeFilter将不同级别log存放不同文件中。
一. Docker-Compose 简介1. Docker-Compose 简介Docker-Compose项目是Docker官方的开源项目,负责实现对Docker容器集群的快速编排。Docke...
Docker 默认工作目录是/var/lib/docker ,某些情况下不够用需要迁移到新的磁盘,非系统盘。则参考下面迁移办法Docker 工作目录相关查看do
不知从何时开始,get.docker.com download.docker.com 在腾讯云已经无法访问了,导致之前分享的在线安装方案间接失效,故此记录国内Ubuntu 安装docker的另一种方法