本仓库 Fork 自 PillarsZhang/captcha-cv-ocr
使用 CV (OpenCV) 和 OCR (Tesseract) 进行验证码识别
simplest | grids_and_equations | dots_and_chars | slide_match | ... |
---|---|---|---|---|
- | ... | |||
2348 | 2x6=? | 7RVO | 滑块匹配 | ... |
# use npm, yarn or pnpm
npm add @lzwme/captcha-cv-ocr
因为所需的 OpenCV 支持模块 @u4/opencv4nodejs 体积较大,编译过程复杂,请手动安装,或者参考官方的安装指南:
npm i @u4/opencv4nodejs
const path = require("path");
const { Cvocr, getCodesList } = require("captcha-cv-ocr");
// 获取支持的验证码识别类型列表
const codesList = getCodesList();
console.log('codes:', codesList);
(async () => {
// mode 表示验证码的种类
let mode = "simplest";
const cvocr = new Cvocr(mode);
// 其中的 num: 1 表示需要启动的 OCR Worker 数(多线程)
await cvocr.init([{ num: 1 }]);
// 支持文件地址、Base64、Buffer形式
let ans = await cvocr.recognize("test/example/simplest.jpg"));
console.log("ans:", ans)
process.exit(0);
})()
通过启动本地 server 服务的方式,可以提供 http 接口调用能力。示例:
# 默认启动 3000 端口
node ./node_modules/@lzwme/captcha-cv-ocr/index.js
或通过调用 createServer
方法自行启动:
const { createServer } = require('@lzwme/captcha-cv-ocr');
createServer({ port: 3000 });
然后即可通过 post
请求的方式使用。示例(基于 fetch API,可在 Node.js 环境或 chrome 控制台直接调用):
async function httpOcrTest() {
const body = {
mode: 'simplest',
// 验证码图片
base64: '',
// slide_match 模式的底图
originalBase64: '',
};
const result = await fetch('http://localhost:3000/ocr', {
method: 'post',
body: JSON.stringify(body),
headers: { 'Content-Type': 'application/json' }
}).then(d => d.json());
console.log(result);
}
第三种验证码(dots_and_chars
)识别改为用 sharp 和纯 JavaScript 的 CV 算法来实现,方便在树莓派上运行,但效率相比前两者很低。
docker pull lzwme/captcha-cv-ocr:latest
docker run -d -p 3600:3600 lzwme/captcha-cv-ocr
git clone https://github.com/lzwme/captcha-cv-ocr
cd captcha-cv-ocr
npm install
# 约等于安装为全局模块
npm link
npm test
simplest | grids_and_equations | dots_and_chars |
---|---|---|
2348 | 2x6=? | 7RVO |
codes下的文件夹对应着不同种类的名字(自行命名),你可以参照已有的模板与API创建新的识别库,来适配其他各种验证码。
- @u4/opencv4nodejs 依赖安装及编译
- opencv4nodejs
- @u4/opencv4nodejs
- tesseract.js
- 主页 | https://tesseract.projectnaptha.com/
- Github | https://github.com/naptha/tesseract.js
- API | https://github.com/naptha/tesseract.js#docs
- 第三种验证码如果进行训练识别效果会更好
- sharp
- Github | https://github.com/lovell/sharp
- API | https://sharp.pixelplumbing.com/api-constructor
- 另外吐槽:只有编辑图像的基础功能,而且体验不是很理想需要绕过bug
- ./lib/fakeOpenCV
- 个人仿照 OpenCV 重写了一些图像算法
C++ / Python 的 OpenCV 海量资料也非常有帮助, 相应的函数基本都能在 opencv4nodejs 的 API 文档 里找到。