咨询热线

4008-888-888

新闻资讯
您当前的位置:主页 > 新闻资讯 >

捕鱼达人游戏界面素材_机器学习笔记041 | 机器学习的流水线和资源分配

发布时间:2019-08-14  点击量:
更多

一个复杂的机械进建体系是若何组合起去的呢?机械进建的资本应当若何分派呢?

上面我们经由过程图片光教字符辨认(photo optical character recognition,Photo OCR)技巧去举行一个简略的先容捕鱼达人游戏界面素材

1 机械进建流前线(machine learning pipeline)

甚么是 Photo OCR 呢?

例若有那样的一个图片:

我们念要辨认出去个中的一些字符,并剖析其寄义:

谁人过程便是 Photo OCR qq游戏捕鱼达人

举个例子,如果能够辨认街途径牌上的疑息,汽车没有便能够自动导航了么?那便是 Photo OCR 的个中一个应用捕鱼达人游戏规则

谁人过程当中,实在需要办理三圆面的题目现金游戏捕鱼达人

笔墨侦测(Text detection):

字符朋分(Character segmentation):

字符辨认(Character recognition):

具体去道,便是我们有一副图象,传收给笔墨侦测体系,辨认出笔墨以后,将笔墨朋分成自力的字符,然后对单个字符举行分类辨认。

那样一个过程,被称为机械进建流前线(machine learning pipeline) :

2 滑动窗心(Sliding Windows)分类器

那末笔墨是怎样被检测出去的呢?

正在此之前,我们先看看一个行人检测的例子。

行人的宽下比年夜抵是相似的,比方我们有一些些 82 × 36像素的图片:

经由过程那些数据,我们能够练习出去一个分类体系,辨认哪些是行人:

图中的绿框是怎样找到那些个行人的呢?

滑动窗心(Sliding Windows)圆法,实在便是经由过程那样一个从左到左、从上往下滑动的绿色的窗心,检讨个中的目标是没有是符合要供,比方是没有是为行人:

如果谦足,则举行标记。

固然,谁人绿框的巨细和每次滑动的间隔,是能够设置的。

相似的,对笔墨的检测,我们也要先经由过程数据练习出去一个笔墨辨认的模子:

然后我们对我们需要辨认的图片:

应用滑动窗心去辨认哪些是笔墨,并做出标记,比方下图中标记为红色的部门:

下一步便是将红色部门周边也设置为红色,那样我们便获得了连绝的数据:

对笔墨去道,宽度应当比下度要年夜,以是我们会挑选到白框的部门:

也便是侦测到了那些笔墨:

玻璃门上的笔墨因为太小,大概便出有被辨认到了:

下一步,便是经由过程滑动窗心,辨认字符之间的间隔。我们能够经由过程那样的样本练习字符朋分模子:

然后经由过程滑动窗心检讨笔墨,如果符合要供,便将每个字符朋分开去:

最后便是字符的分类了辨认了。

3 人造数据

念要让机械进建到达比较下的准确率,年夜量的数据是必没有可少的。

那末我们从那里获得那末多的练习数据呢?

对字符辨认去道,实在非常简略,上面我们将道道人造数据的两种圆法。

没有过有一面需要提醉:正在造造年夜量数据之前,尾先保证我们有一个低误好的分类器,没有然的话,即使获得了年夜量的数据,算法的表现依然没有克没有及有效的进步。

圆法一:野生分解

现正在的计算机仄日有很多种字体库,我们能够很沉易收集到一些字体:

然后经由过程增加背景、隐约、等比例缩放、扭转等操做圆法,野生分解一些字体的图片:

您会发明那和实正在的数据实在少短常相似的:

圆法两:删加乐音

我们挑选一个实正在的样本,然后增加一些乐音,经由过程那样的圆法能够扩年夜练习集。

比方一个样本 A ,经由野生的变形和扭曲,便能够变成 16 钟新的样本:

需要留意的是,我们处置后的成果,应当是现真相况下大概出现的,没有然的话便间隔实正在数据太远了。

5 上限剖析(Ceiling Analysis)

正在开辟机械进建体系时,最宝贵的资本是开辟者的时间。

如果我们开辟好了一个 Photo OCR 体系,发明准确度只要 72% ,效果没有如人意。

那末我们应当若何去改擅呢?

对谁人流前线上的组件,哪一个圆框才最值得化时间呢?

我们没有克没有及光凭直觉去行事,而应当经由过程数据去断定,把时间花正在那里性价比最下。

假定每个组件皆能够完好完成,然后看正在谁人完好完成的情况下,体系整体的猜测准确率是多少。

比方笔墨侦测(Text detection),应当辨认出去 4 块,但是实际上那里出有被辨认出去:

但是我们能够野生干涉,把那里辨认出去。

又比方,字符辨认(character recognition)的时刻,把 I 辨认成了 1,我们也能够野生干涉去假定到达了完好完成的效果。

那末每个部门的完好完成,能够给体系整体带去多年夜的提降呢?

隐然,从上图能够看出去,笔墨检测(Text detection)借有 17% 的可提降空间,而字符朋分只要 1% 的可提降空间。

一样的时间和粗力,您是更乐意花正在那 17% 的提降空间上,借是那 1% 的提降空间上呢?

那实在便是上限剖析(Ceiling Analysis)要告知我们的工作。

文章提早宣布正在公寡号:行一之路

地址: 电话:4008-888-888 邮箱:4008-888-888
技术支持:sue ICP备案编号:苏ICP123456798