发布者:大恒图像 发布时间:2026-06-18 分享:
什么是HALCON Deep OCR
HALCON Deep OCR是一种基于深度学习的光学字符识别技术,它让机器视觉向人类的阅读能力又迈进了一步。相较于传统OCR识别算法,Deep OCR不受文字方向、字体以及明暗反差的影响,同时兼顾字符定位能力,使识别结果更为稳定和可靠。
Deep OCR的核心优势
文本定位+识别:可直接输入整张图片,实现文本定位和识别的结果同时输出
字符自动分组,实现完整词汇识别
全场景鲁棒性:支持任意方向、任意极性(黑底白字 / 白底黑字)、变形文字等
提供基于海量图像数据的预训练模型;针对特殊应用场景,也可通过使用自定义数据重新训练Deep OCR模型,对检测能力和识别效果进行进一步提升
HALCON 26.05进一步提升 Deep OCR落地能力&易用性
在许多OCR应用中,空格除了单纯的视觉分隔符,很多时候还能够承载重要信息。例如,读取有效期、批次编码或格式规范的产品标签时,都需要保留正确的空格。
在HALCON 26.05 版本优化了空格适配能力,识别结果会在对应位置保留空格,为用户呈现更完整、贴合原始样式的文本内容。

代码解析
以半导体行业最常见的 SEMI Font字符识别为例:

参考代码:
* AI²加速
UseFastAI2Devices := 'false'
get_inference_dl_device (UseFastAI2Devices, DLDevice)
* 创建句柄
create_deep_ocr ([], [], DeepOcrHandle)
* 设置硬件
set_deep_ocr_param (DeepOcrHandle, 'device', DLDevice)
* 读图
read_image (Image, './Image/SEMI')
* 识别文本内容
apply_deep_ocr (Image, DeepOcrHandle, 'auto', DeepOcrResult)
* 获取结果
get_dict_tuple (DeepOcrResult, 'words', Words)
get_dict_tuple (Words, 'word', RecognizedWord)
输出结果包含:完整字符串、带方向的文本框、单个字符置信度、关联得分热度图,方便后续结果校验和异常处理。

常见疑问
Q:Deep OCR是否需要额外购买深度学习模块?
A:Deep OCR属于OCR模块,不需要额外加订深度学习模块;
Q:必须用 GPU 才能运行吗?
A: CPU也可正常运行;GPU可进一步加速推理速度,适合对速度要求更高的场景;
Q:支持识别中文字符吗?
A:默认支持拉丁字母、数字及常见标点,如需中文可通过Deep Learning Tool进行自定义训练实现;
实例效果图


地址:北京市海淀区苏州街3号大恒科技大厦北座12层
邮箱:sales@daheng-imaging.com