光学字符识别(OCR)

OCR是指对图片中的文字进行查找、提取、识别的一种技术。
一般步骤:
文字检测、文字识别
评估指标
拒识率(召回率)、误识率、识别速度、稳定性
CTPN
步骤:
检测文本:16像素小区域,每个proposal(提议)使用10个锚点高度在11-273之间(0.7).细粒度的文本提议
利用RNN连接多个proposal。使用双向LSTM利用前后两个方向的信息对proposal进行连接
边沿细化。
缺陷:针对极小尺度文本检测有遗漏,对非文本的水平的检测效果并不好。
SegLink  segment和link
(x,y,w,h,
文字识别技术
CRNN (CNN + RNN) +CTC
网络结构:

特征提取
将特征图拉伸成特征向量
序列标注
转录
除掉重复值,修改错误值,误差使用前向算法进行反向传播,应用随时间反向传播(BPTT)进行计算
网络训练
使用随机梯度下降(SGD)进行训练。梯度由反向传播算法计算。




全部评论
看不懂,好高深啊
点赞 回复 分享
发布于 2022-10-24 14:38 山西

相关推荐

02-08 20:56
已编辑
南京工业大学 Java
在等offer的比尔很洒脱:我也是在实习,项目先不说,感觉有点点小熟悉,但是我有点疑问,这第一个实习,公司真的让实习生去部署搭建和引入mq之类的吗,是不是有点过于信任了,我实习过的两个公司都是人家正式早搭好了,根本摸不到部署搭建的
点赞 评论 收藏
分享
评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客企业服务