我们正在使用 google Vision ocr 来收集收据中的文本。
在某些情况下,收据上有一些垂直书写的文本,例如增值税信息等。
问题是,谷歌视觉仅有效地读取主方向(例如水平方向)的文本,并丢弃在同一收据中以垂直方向而不是水平方向写入的所有文本。
是否需要设置一个参数来告诉谷歌视觉也获取垂直方向的文本?
我在网上放了一个示例,其中包含两个方向的文本图像。
https://drive.google.com/file/d/0B8kZz-q27lGGSUl5V3RjXzBLNnc/view?usp=sharing https://drive.google.com/file/d/0B8kZz-q27lGGSUl5V3RjXzBLNnc/view?usp=sharing
从 g-vision 识别的文本:水平文本行
我期望被识别的文本:水平文本行
垂直文本行
我知道这是迟到的回应,也许将来有人会从中受益......
您可以通过在应用检测器之前进行框架旋转来强制检测器仅识别垂直文本,如下所示:
在 CameraSource 的 setRotation() 方法中。写:
outputFrame = new Frame.Builder()
.setImageData(mPendingFrameData,
mPreviewSize.getWidth(),
mPreviewSize.getHeight(),
ImageFormat.NV21)
.setId(mPendingFrameId)
.setTimestampMillis(mPendingTimeMillis)
.setRotation(mRotation)
.build();
mRotation = 2; (for vertical text direction from bottom to top)
mRotation = 1; (for vertical text direction from top to bottom)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)