ALPR unconstrained 论文阅读总结和讨论

look for papers for alpr contributer : leoluopy

欢迎提issue.
欢迎watch ，star，实时讨论前沿分享
欢迎加入分享：联系微信：leoluopy

Overview

来自ECCV2018，提出了一个整套车牌检测，分割，字符识别方案。【很多论文只是这个pipeline其中一部分】
目前大多数方案对于车牌的识别假设车牌正对，或者倾斜角不大。本文提出了WPOD-Net解决车牌倾斜。
本文提供了，倾斜数据、手工标注数据集及合成数据方法（训练集：196张手标数据集） [ 测试集： 102 张困难倾斜数据集。]
性能上，特定场景和商业持平，非限定场景超过商业系统。
独立测试集表现出强泛化能力。

结构综述【pipeline 总体流程】

第一步：车辆检测YOLOV2
第二步：WPOD-Net 车牌检测，及车牌矫正（本文重点贡献）
第三步：OCR 车牌识别（它是巴西车牌，我们这里不关注）

WPOD-Net 处理流及网络结构

RESIZE 预处理

resize已经检测出的车辆
在resize图片采用了如下思路：

在车牌无倾角时，往往车牌有足够的像素用于车牌识别，但是车辆照片有倾斜度时，车牌和车辆比例会减小不少，这不利于车牌的提取。基于此，作者使用此思路来提高，在车辆照片有角度时，放大图片，以放大车牌像素。而在车辆照片像素本来就很大时，采用了Max=608做了相应的缩小。

一句话说明：生成参考小的边长，计算缩放比例，随后缩放并补像素满足被16（或其他网络步长）整除

参考代码【以下代码是公式的实现】：

双* 号是指数操作

双冒号代表list中取元素位置和步长。

同时，代码中做了对16可整除的对齐操作（为适配后面WpodNet卷积）

WPOD-Net 结构

WPOD-Net 是一个全卷积网络，可以输入任意尺寸的图片（但是需要能整除16），最后生成Ns/16 的特征图。特征图上每个点八个通道tensor如下：

（m,n,8） : m,n 是特征图长宽，有车牌confidence ，无车牌confidence ， 6个二维仿射变换参数。

网络如上图所示，总共由21个卷积层组成，14个卷积层在resblock中，所有的卷积核都为3x3.他们都使用了RELU作为激活函数，只有在仿射变换参数的激活中采用了LINEAR（f(x)=x）。网络一共有4个最大池化层，也就是输入图片缩放尺度为:16.

WPOD-Net Loss 设计

全局loss由两部分构成，有无对象置信度loss和仿射变换参数loss。如上图所示。

置信度loss采用类似于SSD中对数loss的设计方法见下图：
仿射变换loss由两部分组成

总体loss设计思路，利于仿射参数和特征图格子，通过仿射变换和平移构造单位尺度车牌，对等相减实现loss设计。

Tmn：其中q是基于原点的单位矩阵。

Tmn： max(v, 0) 是仿射变换数学性质中保证没有异常的镜像和旋转。

Tmn： v3,v4,v5,v6 负责形状变换，v7，v8是bias负责少量平移

Amn：其中p是gt，是标注车牌的8个点。

Amn: Ns 是缩放因子，如果网络是4层最大池化，Ns = 2 ** 4 = 16

Amn: m和n是原图经过特征提取后得到的特征图cell。

Amn: a 是经验参数，目的是将按照特征图比例缩放和平移后的车牌形状能更加贴近缩放到单位矩阵尺寸的车牌大小。

WPOD-Net 数据增广及训练方法

训练样本很多，但是标注不多，标注一共只有196张，采用真实图像增广和合成图像，以及合成图像增广的方法增加样本集合。
采用的数据处理方法：
- rectification基于标注将倾斜的车牌直接利用仿射变换拉为平面上，此数据增广在困难倾斜车牌样本中增加18个点的准确率提升。。
- 缩放车牌长宽比到【2-4】之间用以适应不同尺寸的车牌区域。
- 平移并缩放和截取使得车牌成为图像的中心。
- 缩放车牌的宽度到 40px - 208px。这点设计和loss中a的取值密切相关。
- 随机3D角度旋转
- 50%机会进行镜像处理
- 车牌中心进行在 208 x 208 px 区域内限制移动
- 以车牌为中心进行208 x 208 裁剪
- HSV空间颜色轻微调整

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

alpr.md

alpr.md

ALPR unconstrained 论文阅读总结和讨论

Overview

结构综述【pipeline 总体流程】

WPOD-Net 处理流及网络结构

RESIZE 预处理

WPOD-Net 结构

WPOD-Net Loss 设计

WPOD-Net 数据增广及训练方法

整体系统结果对比

Files

alpr.md

Latest commit

History

alpr.md

File metadata and controls

ALPR unconstrained 论文阅读总结和讨论

Overview

结构综述 【pipeline 总体流程】

WPOD-Net 处理流及网络结构

RESIZE 预处理

WPOD-Net 结构

WPOD-Net Loss 设计

WPOD-Net 数据增广及训练方法

整体系统 结果对比

结构综述【pipeline 总体流程】

整体系统结果对比