自动化测试同学的福音来了！通过DdddOcr可以非常方便的识别登陆验证码！

DdddOcr，其由Sml2h3与 kerlomz 共同合作完成，通过大批量生成随机数据后进行深度网络训练而得，我们可以使用她提供的api，对登录校验码进行识别，能够解决在自动化测试过程中登录需要获取验证码的场景。备注：对于简单的数字和字母组合的校验码识别率还是非常好的，大家可以查看文章中的测试结果。

测试开发Kevin

803人浏览 · 2024-09-05 09:02:07

测试开发Kevin · 2024-09-05 09:02:07 发布

介绍

项目底层支持

本项目基于dddd_trainer 训练所得，训练底层框架位pytorch，ddddocr推理底层抵赖于onnxruntime，故本项目的最大兼容性与python版本支持主要取决于onnxruntime。

环境支持

安装

命令

pip install ddddocr

安装目录说明

ddddocr

├── MANIFEST.in

├── LICENSE

├── README.md

├── /ddddocr/

│ │── __init__.py 主代码库文件

│ │── common.onnx 新ocr模型

│ │── common_det.onnx 目标检测模型

│ │── common_old.onnx 老ocr模型

│ │── logo.png

│ │── README.md

│ │── requirements.txt

├── logo.png

└── setup.py

代码中使用

import ddddocr
ocr = ddddocr.DdddOcr()
with open("识别的图片路径", 'rb') as f:
     img_bytes = f.read()
res = ocr.classification(img_bytes)
print('ocr:' + res)

关于ddddocr与playwright结合实现web登录的代码实现，可以参考文章：

playwright+DdddOcr实现带校验码的web登录（附源码）_playwright +ddddocr 滑块验证码-CSDN博客

测试结果

针对不同的验证码进行了测试，测试结果如下，给大家提供一下参考（当然验证码设计的易用性和安全性是很难平衡的，这个需要各位同学自行决策）

150张样本图片，识别出149张，可以说完全破解

测试字母（统一进行字母小写处理）+数字组合的验证码，150张样本图片，识别出130张

测试字母（统一进行字母小写处理）+数字组合+阴影和背景色变化的验证码，150张样本图片，识别出102张

测试字母（统一进行字母小写处理）+数字组合+阴影和背景色变化和干扰线的验证码，150张样本图片，识别出65张

测试数字+干扰线的验证码，150张样本图片，识别出99张

测试字母（统一进行字母小写处理）+数字组合+鱼眼的验证码，70张样本图片，识别出0张，但是这种验证码人也很难分辨

我的每一篇文章都希望帮助读者解决实际工作中遇到的问题！如果文章帮到了您，劳烦点赞、收藏、转发！您的鼓励是我不断更新文章最大的动力！

技术共进，成长同行——讯飞AI开发者社区

更多推荐

【AI+教育】AI如何重塑教育：阿里云2025教育行业应用白皮书深度解读！大模型应用

讯飞AI开发者社区

践行国家“人工智能+”战略，容联云助力某消金“客服智能体”落地

例如，无论客户提出“提前还款”或“早点还”， Virtual Agent都可快速理解其意图，并准确提供还款金额、流程及渠道等信息，实现“听得懂、答得准”，目前已顺利在该消金公司承接85%日常咨询，客户满意度提升近30%。容联云坐席代理Virtual Agent拥有大模型上下文理解、基于语义理解的信息修正等能力，覆盖贷款账户的各类操作，如提现失败、转账失败等问题的咨询，能根据接口返回的相关原因，结合

讯飞AI开发者社区

AI大模型RAG技术全面解析：从入门到精通，小白也能轻松掌握！

RAG（检索增强生成）技术结合信息检索与生成式AI，解决大语言模型的幻觉、知识滞后和领域知识缺乏等问题。通过从知识库检索相关上下文，再基于此生成回答，显著提升答案准确性、时效性和可解释性。文章详解了RAG的核心组件（检索器、生成器、知识库）和系统架构，为构建高效RAG系统提供全面指导。在人工智能飞速发展的当下，大语言模型（LLM）凭借强大的生成能力，在各个领域大放异彩。但你是否遇到过这样的问题：当