深度系统官网是哪个一眼看清高科技深度分解人为智能工夫脉络

| 发布者:admin

  现在技术突破方向是通过建立知识图谱与事物组合图谱,试图将现实世界的景象与知识组织起来。当然,这仅仅是第一步,只有将其与自然语言解析、视觉解析结合到一起时,再结合大数据统计,才能实现真正的突破。

  现在有非常多的大公司在做人工智能方面的研究,包括Google、IBM、Facebook、Apple、百度等,也有数不尽的小型创业团队进入,使得人工智能方面变得热闹非凡。每一家公司都有自己的研究思路,也取得了不同程度的进展,比如百度李彦宏就透露,百度大脑已经相当于2~3岁小孩的智力水平,而按照我们对自己人工智能系统的模拟测试结果,可以达到12岁中学生的智力水平,大幅度领先百度深度学习研究院。下边在不泄露技术机密的前提下,简要分享我们人工智能系统的设计思路与背后基于的原理。

  在介绍人工智能之前,我们首先来简单认识一下“文字”。在人类看来,文字是人类约定创造的视觉形式,可以说文字是一个视觉系统,它以最简单方式将视觉场景图案再现,并且富有便于口语声音表达的特点,因而更加清晰,可以反复阅读,可以突破时间和空间的限制。

  更准确的说,文字使人类突破口语受到时间和空间的限制,把时空的影像变化转码成视觉可见的符号系统,并通过书面语的方式传承下来,使后人能通过间接的文字想象出画面,了解历史和学习技术经验,从而提高自己的智慧,发展科学技术,并最终促使人类能进入有历史记录的文明社会。

  在了解完文字后,我们再来简单的看一下自然语言(文字)与计算机编程语言之间的区别。显然,自然语言是更高级的编程语言,其每一个字都有特定的含义,在现实世界中映射非常庞大视觉影像,并且具备较高容错率的特点,而现有的计算机编程语言是简单的命令序列与逻辑组合,本质上说,这两者之间差别巨大。

  由于在计算机语言的内在逻辑无法映射到现实事物,于是在计算机看来,文字是人类用来记录语言的符号系统,仅仅是符号,没有任何意义。于是,当计算机识别到“树”这个字时,它没有任何“树”真实样子、信息的概念与数据,也就无法理解“树”这个字的真正含义。

  其实,这也说明计算机和现实的接口没有打通,所以,人工智能的关键环节即为帮助计算机将符号与真实视觉影响之间建立联系,即补全每一个词语背后的真实对象数据,填补计算机文字符号与现实影像数据之间的鸿沟。

  现在技术突破方向是通过建立知识图谱与事物组合图谱,试图将现实世界的景象与知识组织起来。当然,这仅仅是第一步,只有将其与自然语言解析、视觉解析结合到一起时,再结合大数据统计,才能实现线、人工智能发展限制因素的误解

  虽然基于现有计算机发展人工智能技术仍旧面临或多或少的限制,但将其归结于计算性能、编程方式等原因,显然是不正确的,因为这些都可以基于现有技术来解决,下边依次简要说明。

  许多人认为,虽然现在处于科技发达的互联网时代,但现有计算机的计算能力非常有限,如果要完成自然语言解析这种高海量计算的工程,或许只能依靠超级计算机、量子计算机、光子计算机、生物工程计算机等更先进的技术解决。其实这种想法是不对的,因为自己不能找到解决人工智能的解决方案,而将其归咎于现有硬件性能低下,是一种错误的逻辑。虽然计算能力的提升有助于更简单的解决人工智能问题,但计算能力并非限制人工智能发展的核心问题,而且计算能力可以靠大规模服务器集群有效解决。

  许多人认为,现有的计算机语言仅仅是简单的命令序列与逻辑集合,而自然语言解析所需要的编程方式注重的是视觉、听觉、嗅觉、触觉、味觉等为一体的编程体制,因此其并不适合解决自然语言与人工智能方面的问题,这也就意味着如果想高效的实现人工智能技术,最好开发出全新的编程模式,开发一款全新的计算机架构。

  虽然IBM公司已经发布了基于人脑特征的全新计算架构,号称基于此的新生态系统将为市场带来高参数化的神经模型,能形成类人脑计算的基础信息处理单位,以及具备对空间、时间和多模态化环境的识记、感知,或者是做出行动的能力,从而让下一代应用在感知、行为和认知方面的效率堪比人脑,但这种计算架构仍不成熟,在现实使用过程中,仍面临非常多的技术问题。

  深度学习的原理是通过多层次的学习而得到对于原始数据的不同抽象层度的表示,进而提高分类和预测等任务的准确性。即针对某一个“事物”,对于其图像(或物体、声音、嗅觉、触觉、味觉)进行参量分解与组合,然后通过大量同类事物来重复操作,从而验证每种参量(或参量组合)重要性(或层次性),最终获得一组识别该事物识别数据包的一种机制。

  深度学习整个训练过程非常简单,以机器学会在图片上识别狗为例,我们不需要人为事先给出狗的特征定义,只需要提供足够的相关图片,用以划上一个大致的识别边界,然后机器将所看到的图像或图片分解成10亿多个不同的参量,对这些参量的层次、权重进行概率统计,并将这些参量按照其可能性进行各种“组合”,并对这些组合的层次、权重进行概率统计,并最终形成识别数据包。

  深度学习是一向基于信息提取的技术,但产生人工智能需要的基础“数据识别”,仍需要搭配另一套技术体系,即三维建模相关技术,这是因为现实世界中的事物大多是三维的,因此在“数据识别包”提取的过程中,需要基于三维真实的事物。

  然而,深度学习与三维建模等技术仅仅是针对某一元素进行深入分析的工具,能够针对某一事物分层次的提取其特征库,并能够基于此识别其它景象是否存在这一事物,这仅仅属于“知识单元”模型中的一个必要部分。

  将众多知识单元组合在一起,并挖掘不同知识单元之间的关联属性,以此为基础使知识单元之间建立深入而广泛的关联,最终形成一张庞大的、具有广泛联系的知识单元关系网,这张网就是知识图谱。

  知识单元聚合成知识图谱的过程并非是简单的加法过程,而是一个2的N次方的相乘过程,这个过程中能找到许多归类的同类项,从而使它们之间建立较为广泛的简单联系。

  举个简单的例子,菊花、油菜花、桃花、荷花、迎春花、葵花、石榴花、梅花、槐花、玫瑰这十种花,如果按照颜色的角度来看,通过寻找同类项,其中,颜色偏向黄色的花为迎春花、桃花、油菜花、梅花、菊花、葵花等,颜色偏向红色的有荷花、石榴花、玫瑰花。如果按照开花的季节来看,春季开花的有迎春花、油菜花、桃花、槐花,夏季开花的有荷花、葵花、石榴花、玫瑰,秋天开花的有菊花,冬天开花的有梅花。以类似的方法,可以在彼此之间建立非常多的关联。

  知识图谱可以说是在“量化世界”,让以前模糊的世界变得更加清晰,这也是人类文明进步的关键一步,曾经人类发明了语言文字,用户符号代表世界上各种事物,进而加以认识与区分,知识图谱是在这个基础上的巨大创新,从而达到量化世界的效果,让整个世界都进入数据化时代。

  “事物组合图谱”是以知识图谱为基础建立的另一个异常庞大的知识库,甚至说是比“知识图谱”大100倍的知识体系,这个东西是人工智能的另一个基础。

  知识图谱是通过深度学习等方法,搭建起基于视觉数据包、三维模型、语言符号、深层关系等为一体的知识单元,但在真实的视觉识别、自然语言解析过程中,知识图谱在很多方面都存在数据不足的特点,为了弥补这个缺陷,我们需要深度挖掘事物之间的关联,以获得更加丰富的数据,这也就意味着“事物组合图谱”的诞生。

  人每关注一个事物或场景(多个事物的组合),大脑都会对相关事物进行一次记录,记忆程度取决于相关参量的记录次以及记忆时间,着重记录那些(或事物的组合)出现概率高的事物景象,而对于那些不经常出现的事物(或事物的组合),记忆中的特征也将随着时间的流逝而逐渐减弱,这说明人是根据景象出现次数、时间的远近、事物组合特点等来决定记忆与权重。

  有人会产生疑问,这世界上有上亿个事物主体,上亿个事物按照平均10个组合在一起,也就是C10个组合,即10亿的十次方,最终的结果是1080次方,这是一个天文数字,现在计算量不可完成的。

  以前很难准确的了解某一个人,但是在人工智能大数据统计分析的情况下,这个解决起来就太简单了。以某一事物为主体,通过大量的数据进行分析,按照概率相关程度进行统计,可以很快得出与这一事物关系最近的一系列相关事物。

  比如,以学生群体为例,可以很快得出99%的学生,每天早晨起床、洗刷、吃饭、上课、午休、上课、放学回家、吃饭、洗刷、睡觉……,因此,很容易判定“周一上午十点它们大多数都在上课”。如果以单个学生为例,通过汇总这个学生的所有生活信息,可以很快分析出这个学生的所有生活习性、爱好、思维方式,以及可能的行为等等。

  在知识图谱的基础上,进行相关“事物组合”的概率分析,是努力去构建一个更复杂、庞大的且基于全人类的知识系统,其核心主要基于三点:

  在自然语言解析的那部分,我们说到“当一个句子还原成一个语境后,会出现非常多的语义可能,并通过语境限制因素与大规模数据统计来获取定向语义”,但有一点需要提出的,那就是当基于不同的解析方向、内容类型时,最终会出现不同的解析语义,从而形成种类繁多的面向特定知识的语境解析引擎,这就像不同的人看同一场景“一株玫瑰花枝上开着一朵玫瑰花”,最终得到的却是不同的结果,有的人说“花中有刺”,而有的人却说“刺中有花”,其实从本质上讲,他们看到的场景是一样的,但是后续的思维加工、思维计算过程却不一致,因为他们在思维计算过程中分别强调了不同的因素,前者强调了“刺”,而后者强调了“花”。因此在后期,将针对特定人群,推出特定的组合概率识别引擎,以提升分析的成功率。

  “视觉解析引擎”是基于知识图谱和事物组合图谱的数据,按照一定的分析方法对视觉范围内的事物进行解析的系统,通过“视觉识别引擎”对场景内事物的逐一识别,以及事物之间的组合分析,最终全部理解视觉场景信息的一种技术。

  具体来说,通过深层学习来构建可视化知识图谱,并通过知识图谱的多层特征体制来分析图片中的事物,进而我们可以解析出场景中的所有事物(不一定都准确),由于在同一类场景中,不同事物形成的组合往往具有相互限制的作用(事物组合数据),因此我们可以通过这种限制作用(事物组合数据)来分析事物,最终全部解析场景信息的一种技术,这一过程涉及到了大量基于数据的推理判断。

  视野场景中具有众多事物,这些事物之间往往具有相互联系,甚至部分事物可以构成一个组合,或者说这些事物往往以组合的方式出现,比如茶杯中的热水与冒出的热气,因此可以通过它们之间的组合在一起的概率非常高,而其它可能性却非常低,可以通过这种模式来分析事物。再比如说,一个人在一个秤上秤体重,我们很容易想到的是这个人在称体重,而不是这个人在观察这个秤是否美观,是不是容易坏,它多贵,因为前一种可能性出现的概率要远高于后者。

  一般而言,分析场景的含义,都是通过同类场景的相似性来理解预测现在所面对的场景的,从而理解场景所表达的真实意义。

  人类所有的交流都是基于事实的、能够真实感受到的事物来进行的,当机器解析自然语言时,也需要将其转成事实的、能够真实感受到的事物。因此,“语境解析引擎”主要是将语言还原成一幅真实的图画,并基于“知识图谱”、“事物组合图谱”对其进行深度解析的一种技术。

  任何一幅语境图画所展现的内容都是无穷多的,这无穷多的可能会带来成千上万种语义可能,通过将语境所有事物按照可能性组合在一起,对这种事物组合的类似场景进行分析,来获取最有可能表达的那种语义,并最终获取某一语句表达的真实语义。

  一位刚学会骑自行车的姑娘,因有急事飞驶在郊外的大马路上。这时,她发现前面有个老人在路边散步,她心里很慌乱,便在背后大声叫道:“老大爷,站一下,请站住别动!”老人随即站住,没有回头,只等姑娘过去。但不幸得很,姑娘三歪两歪一下子撞在老人身上,老人摔倒了。老人爬起来说:“我说你让我站住干什么,原来你是要瞄准呀!”

  基于“知识单元”、“知识图谱”、“事物组合图谱”、“视觉解析引擎”、“语境解析引擎”等技术,已经能够完美搭建基于自然语言的庞大数据库,并能够以极高准确率识别自然语言,可以说,这已经为真正实现人工智能搭建了良好的基础,但这仅仅是整个“人工智能”技术体系中的一部分,鉴于本文篇幅,剩下的那部分将在后续的文章中展现给大家。

  taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

  作为一个自然语言领域的研究人员,对作者作为非专业研究人员,也没做过多年大量实验的情况下,能把人工智能的本质理解到这个深度,表示不可思议。这些内容的方向与当今的人工智能研究主流并不很一致,能这样系统完整地分析人工智能的主要瓶颈问题,并提出很多学界主流没有给与足够关注的要点,对于一个作家来讲,实在是难能可贵。

  作为一个自然语言领域的研究人员,对作者作为非专业研究人员,也没做过多年大量实验的情况下,能把人工智能的本质理解到这个深度,表示不可思议。这些内容的方向与当今的人工智能研究主流并不很一致,能这样系统完整地分析人工智能的主要瓶颈问题,并提出很多学界主流没有给与足够关注的要点,对于一个作家来讲,实在是难能可贵。

2 我喜欢