打开主菜单

萌娘百科 β

图灵测试

大萌字.svg
萌娘百科欢迎您参与完善本条目☆Kira~

可以从以下几个方面加以改进:

  • 该属性萌娘添加希望
欢迎正在阅读这个条目的您协助编辑本条目。编辑前请阅读Wiki入门条目编辑规范,并查找相关资料。萌娘百科祝您在本站度过愉快的时光。
图灵测试
基本资料
萌属性名称 图灵测试
萌属性别称 高智能型AI姬
萌属性类别 其它类
相关萌属性 AI姬人造人
Folder Hexagonal Icon.svg 拥有此特征的角色

图灵测试是是艾伦·图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。也是ACGN作品中大部分AI姬所具有的隐含萌属性。

本条目可以视为对同名思想实验的萌化重演绎版,也可以视为同名萌属性的介绍。

目录

原测试简介

图灵测试是图灵提出的一个关于机器人的著名判断原则。

如果说现在有一只姬器人,其运算速度非常快、记忆容量和逻揖单元的数目也超过了人脑,而且还为这台电脑编写了许多智能化的程序,并提供了合适种类的大量数据,使这台电脑能够做一些人性化的事情,如简单地听或说。回答某些问题等。那么,我们是否就能说这台姬器人(所具有的AI)具有思维能力了呢?

为了检验一台机器是否能合情理地被说成存在思想[1],人工智能的始祖艾伦·图灵提出了一种称作“图灵试验”的方法。

此方法和操作的大概内容如下:被测试的有一个人,另一个是声称自己有人类智力的AI姬。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘),向被测试人问一些问题[2],这些问题随便是什么问题都可以。问过一些问题后,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试。如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。

难以突破的原因

看完上方的测试方法,你或许会说:“这很简单嘛!”

没错,对于精神正常的人类,以及其在测试中担任的角色,这是很简单的行为,但对于AI姬们却不是这样。

首先,她们得有如同人脑一样的足够大的数据量。但是我们所不知道的(暂为未知的)/暂时不知道(有小部分人已经了解但是未普及)的知识的提问的回答,需要作出合理处理,否则,很容易出现大量相同的、对于不知道问题的预设定的“不知道”类回答,而被判定为AI姬。

其次,对于尤其是数学运算相关的问题,作为AI姬的强项,她们不能有很快(几乎瞬间)的应答速度,但是在简单问题时,也不能有太慢太刻意的延迟。另一个复杂问题是,如何解决转换式表述的问题,例如:

问:你会下国际象棋吗?
答:是的。
问:我在我的K1处有棋子K;你仅在K6处有棋子K,在R1处有棋子R。现在轮到你走,你应该下那步棋?
答:……

再有,对于重复问题——包括完全相同和“文字形式不完全相同,但意思相同”的重复问题,一向是AI姬面对的难题。

总而言之,挑战图灵测试成功,在很长时间内,将是众位AI姬的难关。

附上一些示范性问答记录:

示范性问答记录

欢迎补充类似问答记录。


问: 请给我写出有关“第四号桥”主题的十四行诗。
答:不要问我这道题,我从来不会写诗。
问:34957加70764等于多少?
答:(停30秒后)105721
问:你会下国际象棋吗?
答:是的。
问:我在我的K1处有棋子K;你仅在K6处有棋子K,在R1处有棋子R。现在轮到你走,你应该下那步棋?
答:(停15秒钟后)棋子R走到R8处,将军!

很明显,回答者已经有很大几率被排除是AI姬,当然,不排除是比较高智能的AI姬的可能。


问:你会下国际象棋吗?
答:是的。
问:你会下国际象棋吗?
答:是的。
问:请再次回答,你会下国际象棋吗?
答:是的。

很明显,一只笨笨的AI姬。因为如果对面是个人的话,大概应该是这样:


问:你会下国际象棋吗?
答:是的。
问:你会下国际象棋吗?
答:是的,我不是已经说过了吗?
问:请再次回答,你会下国际象棋吗?
答:你烦不烦,干嘛老提同样的问题。

当然,也有会恶意卖萌装作AI姬的家伙,但是那样是违反了图灵测试的原则的。


图灵测试的主要对象是AI姬,而非人类。[3]

其实AI姬还有更苦手的问题,比如唱歌和深入讨论话题。

问:你玩过节奏大师/歌姬计划吗?
答:玩过。
问:那你听过或是打过《Night of fire》/《初音ミクの激唱》吧?
答:当然!(这里是一个难点,上个问题提到的曲子是非常有人气的,平淡的回答可能会暴露自己是AI)
问:那你能完整地唱下来吗?
答:应该可以。/那曲子谁能唱啊…(这里涉及到难度衡量的问题,AI一道坎)
问:那你那首曲子打到SSS/PERFECT了吗?
答:没有,那曲子太难了。(AI应该会下意识地说打到了吧?)
问:……

同类型的问题多问几次,AI姬就不行了。

目前,在现实世界中,还没有任何计算姬/姬器人/AI姬通过此项测试。 2014年6月7日,在英国皇家学会举行的“2014图灵测试”大会上,聊天程序“尤金·古斯特曼”(Eugene Goostman)首次“通过”了图灵测试。

实际上这个程序冒充的只是一个来自乌克兰英语非母语的13岁正太。于是一些奇特的回答就会被当作是正太的智商有硬伤心智不成熟(就是耍了小聪明,当然哪怕如此能通过测试也是了不起的了)。

但偶尔,也会出现机器人与普通人之间无法识别的状况,比如下面这种。

这是为了测试某机器人是否能表现出与萌娘百科用户萌百机器人等价或无法区分的智能。

  1. 萌娘百科读者:你能阅读萌娘百科条目吗?
    机器人:是
    萌娘百科用户:是
  2. 萌娘百科读者:你能编辑萌娘百科条目吗?
    机器人:是
    萌娘百科用户:是
  3. 萌娘百科读者:你能提删萌娘百科条目吗?
    机器人:能
    萌娘百科用户:能
  4. 萌娘百科读者:你能提删萌娘百科图片吗?
    机器人:能
    萌娘百科用户:能
  5. 萌娘百科读者:你能破坏萌娘百科吗?
    机器人:不能
    萌娘百科用户:不能
  6. 萌娘百科读者:你能参与某萌娘百科条目的吗?
    机器人:能
    萌娘百科用户:能

经过若干询问以后,萌娘百科读者不能得出实质的区别来分辨机器人与萌娘百科用户的不同,则此机器人通过图灵测试。

广义图灵测试

又称完全图灵测试

普通的图灵测试一般避免审问者与被测试计算机发生物理上的互动,这也是上文注解中说到的测试的谈话仅限于使用唯一的文本管道,便是为了避免结果受到计算姬把单词转换为音频的能力的影响。

因为物理上模拟人(比如像模拟人的外表)并不是人工智能的研究范畴。然而一些人工智能可能涉及一些人机在物理上的交互,所以人们又拓展出了“完全图灵测试”。

在完全图灵测试中,可以包含必要的人机在物理层面上的交互。包括糟糕意义上的。但是为了通过完全图灵测试,还需要在普通图灵测试之外另外两项额外技术课题。询问者还可以测试的AI姬的感知能力,和她们的操纵物体的能力。

  • 二次元里大部分AI姬好像甚至已经完爆完全图灵测试了。
  • 如果达到这种地步的话,已经可以被称为是人造人,而不是AI姬了吧。

反图灵测试

听上去很高端洋气,但是我们其实天天都在做一种反图灵测试——验证码。

验证码,是一种反向图灵测试

在网站上执行一些动作之前,用户被呈现在一个扭曲的图形图像的字母数字字符,并要求用户输入它们,本站才没有那么奇怪的验证码呢

这是为了防止网站被自动化系统(最主要的便是广告姬)滥用。理由是软件不够精细阅读和准确地重现扭曲的形象不存在,所以能够做到这一点的任何系统可能是一个人类。

  • 所以现在出现了只需要填验证码的广告姬操作工具呢。
    • 然而并不能识别照片验证码,然后铁道部就被黑成狗。

能完成该测试的AI姬

(求补充)

外部链接

  1. 对于这一点,存在认为“即使能完成图灵测试,也称不上是AI姬们是有意识的”的人群,因此出现了思想实验“中文房间”。
  2. 测试的谈话仅限于使用唯一的文本管道,例如计算机键盘和屏幕;否则,即扩展为广义上的图灵测试。
  3. 生物计算机出现后,又产生了对于被测试对象的定义问题,由于突破了物理组成相同,可以预见到将来会产生人造人和姬器人/AI姬分辨标准的大讨论。