灵感来自大脑的视觉皮质新的AI彻底颠覆CAPTCHA的

来源:https://www.80088005.com 作者:社会科学 人气:184 发布时间:2019-01-03
摘要:计算机算法在识别模式,比如特定的动物或人脸,可以让软件自动对大图像集进行分类。但是我们来依靠一些计算机或许还做的并不完美。算法不能将他们的图像识别与语义意义相匹配

  计算机算法在识别模式,比如特定的动物或人脸,可以让软件自动对大图像集进行分类。但是我们来依靠一些计算机或许还做的并不完美。算法不能将他们的图像识别与语义意义相匹配,所以今天你可以通过要求他们挑选出识别的图像来确保人的事物。并且算法在识别熟悉的图像是否被歪曲或嵌入噪声方面做得不是很好,这也使得我们依赖于基于文本的CAPTCHAs,用于验证人类与Web服务交互的扭曲文本。

  或者我们至少依赖他们。在今天的“ 科学”杂志上,一个名为Vicarious AI的湾区启动机构描述了他们创建的一种能够进行最少训练并轻松处理CAPTCHAs的算法。它还包括管理一般文本识别。他们通过研究哺乳动物视觉皮层如何处理图像所获得的信息,对AI的结构进行了建模。

  在视觉皮层中,不同组的神经元识别像边缘和表面的特征(而其他的则识别运动,这在这里并不所有真正相关)。但是,不是将场景或对象作为这些部分的集合来查看,所以神经元开始彼此通信,通过接近来确定哪些特征是单个对象的一部分。当建立和识别对象时,场景是基于对象而不是单个特征分层构建的。

  这种基于对象的分类的结果是,即使它们处于不同的方向或部分模糊,也可以识别相似的特征集合,只要可见的特征具有相同的相对取向即可。这就是为什么我们仍然可以承认个别传导信号,如果它们是颠倒和逆向的,并且被淹没在嘈杂的背景下。为了尝试模仿大脑的方法,团队创建了他们所谓的递归皮质网络或RCN。关键步骤是识别轮廓,定义对象的边缘以及内部结构的特征。另一组研究小组拉出表面特征,例如由这些轮廓定义的表面的平滑度。这些识别的属性的集合根据物理接近度被分组到池中。这些池然后建立与其他池的连接,并传递消息以影响对方的功能选择,创建连接的功能组。

  通过类似的过程分组构建相关特征组。这些树的顶部是可以是对象的连接特征的集合(研究人员将其称为“对象假设”)。要使用对象集合解析整个场景,RCN经历了一轮消息传递。RCN为每个假设创建一个分数,并重新排列最高排名的分数,以根据同一场景中的其他假设来评估它们,确保它们都占据连续的2D空间。一旦对象假设已经进行了几轮的选择,尽管尺寸和方向适度变化,但它通常可以识别其对象。

  测试的显着之处在于其效率。当研究人员决定解决reCAPTCHA时,他们简单地将一些例子与其计算机上可用的字体集进行了比较。在格鲁吉亚字体上作为一个合理的近似,他们显示了RCN五个例子,每个部分旋转所有的大写和小写字母。在字符级别,这足以提供超过94%的字母识别精度。这加起来解决了三分之二的reCAPTCHA。人的精确度为87%,如果软件可以以一百分之一的精度进行管理,则从安全角度来看,该系统被认为是无用的。

  这不只是reCAPTCHA。该系统以类似的准确性管理BotDetect系统,雅培和贝宝系统具有57%的准确性。唯一的区别是使用的字体和一些手动调整的几个参数,可以调整不同系统中的变形和背景噪声。相比之下,与RCN的260个单独角色图像相比,其它神经网络需要大约50,000个解决CAPTCHAs进行训练。如果安全服务改变其字符串的长度或改变其使用的失真,则通常必须重新训练那些神经网络。

  为了使RCN适应实际图像中的文本,团队提供了关于字母的共同出现和使用词频的信息以及分析几何的能力。最终以最高表现的模式击败了约1.9%。再次,并不是一个巨大的成就,但这个系统的管理远远少于测试值 ,领先的竞争对手已经训练了790万张图像,与RCN的1406相比。毫不奇怪,RCN的内部数据表示比其竞争对手要小很多。

  这个效率是一个问题,因为它会降低必须清除的硬件条,以克服各种网站的主要安全功能。

  总体来说,这可能是AI的一大步。与Go-playing软件一样,这不是一般化的AI。虽然识别字符非常好,但它并不知道它们的内在自主空间,它不能将它们转换为其他语言,并且不会根据其标识进行任何操作。但是RCN表示,AI不需要完全从实际的智慧中抽象出来 , 我们通过学习真正的大脑获得的见解可以用于使我们的软件更有效。、一直以来,AI一直在推出更强大的硬件,更深层次的管道和更大的数据集。研发人员表明,回到AI的原始灵感可能不是一个坏主意。

https://www.80088005.com/shehuikexue/99.html

最火资讯