【{$randkws}】失控的机器人害怕吗？科学家做了实验并回答了七个问题 - {$web_name} 也是一个著名的虚构学说

来源：豺狼之吻网 | 栏目：时尚 | 2026-06-15 09:46:17

　　导读：让机器人像我们的狗一样对待我们，这或许是一个我们都能接纳的前方。

失控的机器人害怕吗？科学家做了评测并回答了七个难题

　　艾萨克阿西莫夫著名的机器人三定律，对机器人和自动机器人设下行为准则以确保人类的可靠，也是一个著名的虚构学说。这部法则首次出如今他1942年的聚焦KPL解读短篇小说《跑位》中，并且也出如今《我，机器人》等经典作品中，在刚着手呈现的时候看起来很不错：

　　1、机器人不得伤害人类，或因不身为而使人类受到伤害。

　　2、除非违背第一法则，机器人必须遵守人类的命令。

　　3、在不违背第一及第二法则下，机器人必须保护自己。

　　自然，使用在现实中的隐藏的冲突和漏洞比比皆是，在我们这个拥有着先进的机器进修使用和自动化机器人时代，定义和实施AI的一套完整可行的道德规范已然变成像机器智能探究所和OpenAI所重点考虑的难题。

　　Christoph Salge是A股动态汇总纽约大学的一名计算机科学家，他采取了一种各异的方法。Salge和他的同仁Daniel Polani并没有用自上而下的哲学理论来定义AI的行为，而是在探究一种自下而上的道路，或者是“机器人应该先是做什么”。正如他们在最近的论文中所写的那样，“给予权利是机器人三定律的替代品。”“授权”这个概念在一定程度上受到了控制论和心理学的启发，它刻画了一个代理人的内在动机，即坚守并在其周围生态中岗位。“就像有机体一样，它想要生存下去。它想去作用全球，”Salge阐释道。在电池电量过低的状况下，Roomba会在它快没电时自动寻找快充站，这或许是一种相当基础的授权方式：它必须采取行动让自己没电不能电池时经由快充来维持自身的生存。

　　授权听起来像是一个导致像Nick Bostrom这样的可靠智能思想家忧虑的结局：强大的自治操控系统只关心如何让自己的利益最大化并做出一些疯狂的行为。但是，探究人类机器社交互动的Salge想得知，假如一个被授权的AI“也观察到到另一个被授权的AI”，结局会是高考资讯最新进展总有一句适合你怎样。你不只想让你的机器人维持运转，你还想维持对它能够与人类友好相处而开展控制。”

　　Salge和Polani意识到，信息理论提供了一种方法，将这种相互赋权转化为一种数学框架，即可以付诸行动的一个非哲学化的AI。Salge说：“机器人三定律的一个不足是，它们是基于语言的，而语言有高度的含混性。”“我们正奋斗寻找一种可以实际操控的东西。”

　　Quanta与Salge研究了信息理论、虚无主义AI和人类与机器人互动的犬类模型。下面是经过精简记者的对话。

　　问：一些技术专家觉得，AI是一个重大乃至当今存在的威胁。失控的AI会让你忧虑吗?

　　我对此不抱太好的看法。我的意思是我的确觉得如今机器人和AI的作用力越来越大。但我觉得，我们或许更应该关心的是这些AI将作用前方职位的更替、决策的制定，也或许会使民主的网友华为Mate消息丧失，以及隐私的丧失。我不确定这种失控的AI有多大或许会让这些发生。即使是AI可以合作我们控制医疗操控系统，或者得到一些治疗计划，但我们也应该着手留意由此形成的伦理难题。

　　问：赋权将如何合作我们解决这些难题呢?

　　我觉得，赋权的确是一种填补漏洞的的想法。它让一个AI合作人类避免死亡，但一旦你满足了这个基础的底线，它依然有一种持续的动力去创造更多的或许性，让人类更多地表现自己来对全球形成更大的作用。在Asimov的一本书中，我觉得机器人最后将所有人类置于某种可靠的容器中。这自然是我们所不愿意目睹的。但是，让我们的能力增强并持续地作用全球似乎是一个更有趣的最后目标。

　　问：你在一个游戏生态中评测了你的虚拟AI。然后发生什么呢?

　　一个被自己的力量所激励的AI会跳出炮弹的方向，或者避免落入一个洞中，或者避免任何或许导致其丧失机动性、死亡或被破坏的状况，从而缩减其管理性。它只会不停地管理。

　　当它与一个人类棋手配对时，它被设计成能自我增强，我们观察到虚拟机器人会维持一定的距离来避免阻碍人类的行动。它不会阻碍你进入，它也不会站在你无法经由的门口。我们目睹，这种效果基础上人类会让他的同伴形影不离，这样同伴才能就能帮到他。它导致了一些可以推动或跟随的行为。

　　例如，我们还创造了一个激光屏障的场景，对人类有害，但对机器人无害。假如这个游戏中的人类离激光更近，忽然就会有越来越多的激励因素驱使机器人去阻挡激光。当人类站在它旁边时，它的动机就会变得更强，这意味着“我如今想穿过它”。这个机器人会挡住激光，站在它前面。

　　问：这些AI是否有呈现任何意想不到的行为，就像Asimov小说中呈现的三部法律一样?

　　我们最初设计的行为很好。例如，虚拟机器人会干掉那些想要杀死你的敌人。有时，假如这是唯一能拯救你的方法，它或许会跳到你面前为你挡子弹。但在一着手，有一件事让我们有点吃惊，那就是它也相当害怕你。

　　这与它的“本地正向”模式有关：基础上，它所判断的是，前方发生的两三个行为对人类或者它本身的全球的作用是怎样的。所以，身为简易的第一步，我们编写了这个模型，假设玩家会随机操控。但在实际操控中，这意味着机器人的行为实际上是基于在假定人是一种精神变态者的状况下，所以在任何时候，比如说，人类都可以确定向机器人开火。所以机器人总是相当小心地待在那些人类无法杀死它的位置上。

　　我们必须解决这个难题，所以我们兴办了一个我们称之为信任的假设。基础来说，“同伴机器人”的行为是基于这样的假设：人类只会挑选那些不会移除代理自身权力的行为——这或许是一个更自然的伴侣模式。

　　我们在比赛中注意到的另一件事是，假如你有10个生命值，你的同伴机器人并不关心你失去前八、九个生命值，乃至会在一段时间内觉得射杀你只是一种诙谐的行为。在这个评测中我们再次意识到，我们日常的全球与计算机游戏中的模型之间存在着间隙。一旦我们用基于生命损失来生产出能力限制模型，这个难题就解决了。但它也可以经由设计本地正向模型来解决，这让它能够预知前方的一切条件，而不只仅是几个步骤。假如这名机器人能够透彻知晓前方，就会察觉拥有更多的生命值或许会对前方有所合作。

　　机器人基础上会说，“哦，我不能开枪打死他，或者我可以开枪打死他这两者没有区别。”有时机器人乃至会射杀你。这种状况自然是个大难题。我不能宽恕随意开枪的玩家。我们增多了一个补丁，让虚拟机器人更关心你的授权，而不是它自己的。

　　问：如何让这些概念变得更精确?

　　假如你把机器人看作是控制操控系统，你可以从信息的角度来思考：全球上发生的任何事情，在某种程度上作用着你。我们不只是在谈论你所感知到的事物，而是任何一种作用——它或许是任何在周围全球和你之间来回流动的东西。或许是温度作用你，或者是营养进入你的身体。任何渗透到这个边界的全球和AI之间都携带着信息。同样，AI也能以各式方式作用外部全球，也能输出信息。

　　你可以把这种流动看作是信道容量，这也是信息理论中的一个概念。当你获得高度的授权能够采取各异的行动，这将导致各异的结局。假如这些能力中的任何一个变得更糟，那么你的授权就会下降——由于能力的丧失对应着你和生态之间的信道容量可量化的缩减。这是核心理念。

　　问：这个AI需要赋予多大的权利去岗位?

　　赋权有一个长处，即使你的知识还没有完善，它也可以被使用。AI的确需要一个模型来说明它的行为将如何作用全球，但它并不需要完全知晓这个全球以及它的所有繁琐之处。与一些试图将全球上的一切都尽或许完美知晓的方法相比，你只需要弄清楚你的行为是如何作用你自己的看法的，那么你只需要弄清楚你的行为到底意味着什么。你不需要得知所有的东西都在哪里。但你可以有一个合作你探索全球的AI。它会做一些事情，试图弄清楚某件事的行为是如何作用全球的。随着这种模式的进展，AI也会更好地知晓它的授权程度。

　　问：当你已然在虚拟生态中评测过之后，为什么不在真实的全球里实施呢?

　　拓展这种模式的首要障碍，以及我们为什么不把它放在任何真正的机器人身上，是由于在像现实全球这样的富裕生态下，很难计算出一个AI和一个人类之间的信道容量。当下有很多项目在奋斗提升它们的效率。我维持乐观的态度，但当下这是一个计算难题。这就是为什么我们把这个框架使用到计算机游戏的同伴机器人上，这也是一种更为简易的形式来让这些计算难题更轻松解决。

　　这听起来好像让我们的机器变得像强大的特性犬一样。

　　实际上，我认识一些机器人专家，他们有意让机器人模仿狗狗的行为。我的意思是，让机器人像我们的狗一样对待我们，这或许是一个我们都能接纳的前方。

聚焦KPL解读 A股动态汇总高考资讯最新进展总有一句适合你

上一篇：冠军闪烁齐服！《剑侠天下：收源》足游“江湖名侠”嘉奖齐览

下一篇：《极限竞速：地平线5》DLC“经典日系车”现已推出

《SNK女格斗家大乱斗》新预告视频女特瑞不忍直视

网易有讲被奖100万：果代价背法且存正在子真战惹人直解贸易饱吹的止动

《僧我》新做已正在挨算建制开辟商炽热招兵购马

主厨我们去啦！《摒挡次元》食灵现身萤水虫漫展

Steam5月第四周销量绝地求生重回榜首

拳头正正在商讲《豪杰联盟》插足奥运会事件

角色坐绘大年夜进级国产奇特RPG《循环与梦之旅人》推许大年夜更新

《大年夜唐光枯》足游内测数据掀秘万人狂悲引爆热度