🔍 图片文字识别(OCR)
本地浏览器跑 tesseract.js,识别中文+英文,图片不上传任何服务器
← 返回首页
🗑 清空
📥 图片输入 {{ imageMeta }}
🖼
点击 / 拖拽图片 / Ctrl + V 粘贴 到这里
支持 JPG / PNG / WEBP / GIF / BMP,建议 ≤ 10MB
{{ imageMeta }}
{{ running ? '识别中…' : '🚀 开始识别' }} 📂 选择图片
{{ stageText }} 用时 {{ elapsed }}
📝 识别结果 {{ resultMeta }}
📋 复制全文 💾 下载 .txt ✂️ 去除多余空白 🔗 合并断行
💡 使用提示
• 第一次识别会下载 tesseract 核心文件(约 4MB)和语言包(中文 1.6MB + 英文 1.9MB),浏览器会自动缓存,之后秒开
• 想要更高识别率:图片越清晰越好,纯文字背景比复杂背景效果好得多,必要时先裁剪只留文字区域
• 识别中文夹杂英文时选 "中文+英文";纯英文文档选 "仅英文",速度更快
• 开启 显示识别框 可以看到每个词的位置,置信度低的位置往往就是识别错的地方
🔒 隐私安全:所有识别在你自己的浏览器里完成(WebAssembly 跑 Tesseract OCR 引擎), 图片不会上传到任何服务器,可放心识别身份证、合同、票据等敏感内容。

图片文字识别

纯前端 OCR 工具,基于 tesseract.js 5.1 + WebAssembly 在浏览器本地识别图片中的文字,图片不上传任何服务器,可放心识别身份证、合同、票据等敏感内容。支持中文(简体)+ 英文混合识别,可自由切换"中英混合""仅中文""仅英文"三种模式(纯英文模式速度更快)。三种输入方式:① 点击选择文件;② 拖拽图片到识别区;③ Ctrl+V 直接粘贴剪贴板图片(截图后即用)。识别过程实时显示进度条与阶段提示(加载引擎 / 下载语言包 / 识别文字),并附用时计数。结果区可直接编辑识别出的文字,提供四种后处理:📋 一键复制全文(http 域已含 execCommand 兜底)、💾 下载 .txt 文件、✂️ 去除多余空白(合并连续空格、删除空行)、🔗 合并断行(智能合并被 OCR 拆散的中文/英文段落)。可选"显示识别框"将每个词的位置画到原图上,按置信度三色标注(绿≥85% / 橙≥60% / 红<60%),一眼定位识别错误。第一次识别会下载 tesseract 核心 wasm(约 4MB)与训练数据(中文 1.6MB + 英文 1.9MB),浏览器自动缓存,之后秒开

本工具由 在线小工具大全 提供,更多 同类工具 可在站内查看。