纯前端 OCR 工具,基于 tesseract.js 5.1 + WebAssembly 在浏览器本地识别图片中的文字,图片不上传任何服务器,可放心识别身份证、合同、票据等敏感内容。支持中文(简体)+ 英文混合识别,可自由切换"中英混合""仅中文""仅英文"三种模式(纯英文模式速度更快)。三种输入方式:① 点击选择文件;② 拖拽图片到识别区;③ Ctrl+V 直接粘贴剪贴板图片(截图后即用)。识别过程实时显示进度条与阶段提示(加载引擎 / 下载语言包 / 识别文字),并附用时计数。结果区可直接编辑识别出的文字,提供四种后处理:📋 一键复制全文(http 域已含 execCommand 兜底)、💾 下载 .txt 文件、✂️ 去除多余空白(合并连续空格、删除空行)、🔗 合并断行(智能合并被 OCR 拆散的中文/英文段落)。可选"显示识别框"将每个词的位置画到原图上,按置信度三色标注(绿≥85% / 橙≥60% / 红<60%),一眼定位识别错误。第一次识别会下载 tesseract 核心 wasm(约 4MB)与训练数据(中文 1.6MB + 英文 1.9MB),浏览器自动缓存,之后秒开