听懂人类说话这件事 谷歌花了多少心思?

  互联网公司,尤其是以搜索技术见长的互联网公司,在“听懂人话”这件事上都会下上不少的功夫,毕竟搜索技术最终仍然是为了人类能够更快更方便地得到信息应运而生。几十年的计算机发展历程中,电子设备已经能够通过既定的人机交互设备很好地理解人类的意思并执行相应操作,但在语音输入及语音识别方面,无论是谷歌还是别的公司,仍然和人类正常的沟通有一定的距离。

1

  为什么会导致这样的情况,笔者认为原因是多样的。首先,自然语境当中蕴含着语言学、逻辑推理和使用习惯等多方面需要理解的内容。而就现在的计算机程序来说,这些规律是复杂而又持久变化着的,这使得计算机在理解和判断的层面上需要更长的时间,没有办法做到即时的传达。有朋友可能会说现在的人工智能可能可以解决这样的一个问题,但以现在手机上常见的语音助手为例,其本质仍然是一个依赖大数据进行资料检索的一个程序,并不是真正意义上的人工智能。要知道可以通过图灵测试的人工智能,这世界上只有一个,而且测试结果还不一定被承认呢。

2_1

  不过,虽然前景还是比较迷茫,但老话说得好,只要思想不滑坡,方法总比问题多。作为搜索引擎行业的老大,谷歌决定依靠自己在大数据方面的优势,开始建立一个“伪人工智能”,说白了就是要建立一个听得懂大家说话且给出合理反应的机器人。在这前面微软小冰借助bing的支持,加上人性化的对答设置,干得还算可以,那么谷歌究竟要怎样做才能追上来呢?

3_1

  首先,谷歌充分利用了其不务正业的传统,在加拿大国庆日当天,联合加拿大著名啤酒品牌“加拿大人”(Canadian)的制造商Molson进行了一次营销活动。这冰箱在外形上与普通冰箱无异,甚至带有一丝复古风,通红的箱体顶部配有枫叶标志(加拿大国旗国徽)。乍眼一看,这冰箱没多少亮点嘛,只是凑近看的时候才发现居然配备了谷歌语音识别API,并且可以识别多达40种不同的语言。当你通过6种不同的语言说出“我是加拿大人”的时候,冰箱就会自动打开,里面的啤酒就可以随意让你喝。这台冰箱在充分帮助Molson完成营销的同时也展示了谷歌在语音识别技术上面的优势所在。

4

  如果你觉得这还不足以呈现出谷歌在“听懂人话”上面的努力的话,那么接下来这个项目应该会让你满足。谷歌最新的人工智能系统不同于传统的“聊天机器人”(指的就是当年QQ的聊天机器人,只会抓取关键词去搜索),并不是基于人工编程或者对世界的假设,而是能够对语言和对话进行分析,根据上下文来与人类进行沟通。该系统使用的是庞大的机器神经网络,近似于人脑的神经元网络。在这几年计算机能力不断发展的情况下,机器神经网络已经能够识别人脸和发布在社交网络的照片对象,识别语音和实时翻译不同语言。除此之外,谷歌还将人机对话这种复杂性的场景当作是一种机器学习的方法,可以通过电影对白进行培训,也可以通过过去的电话聊天记录进行培训。虽然这种聊天机器人只是出于概念阶段,但是谷歌位于伦敦的研发部门DeepMind已经开发出能够自主玩视频游戏的人工智能技术了,相信人工智能聊天机器人不会太遥远。

5_1

  将两则新闻结合,我们可以了解到,谷歌的思路可以看作是两方面情况的结合:一方面谷歌在提升自家语音识别技术的准确度,为识别完整的语段不断努力,这是达成“听懂人话”的首要条件;另一方面,依靠移动互联网作为带头的高速网络,谷歌依赖自家数据库达成了对于自然语境的更佳解读,从而实现了对于语段的正确理解,最终实现了能够自然对答的结果。

  在图灵测试也逐渐被质疑,人工智能发展似乎多少有些停滞不前的时候,谷歌这种曲线救国的方式未免不是一个可取的办法。人工智能的意义之一便是让我们通过智能化的信息检索提供功能提升我们的工作生活效率,这样看来谷歌的方法也是没有问题的。不过,我们仍然能够希望在未来体验到如同与人沟通的人工智能,让人工智能为我们的生活出谋划策。

最热讨论