时间:2023-02-06 14:00:24 | 浏览:618
雷锋网按:人工智能在当今社会被讨论的如此火热,但是仔细一想,你可能甚至并不知道它的基本运行逻辑。
人工智能和机器学习是一回事吗?人工智能是不是能解决所有的问题?如果不是的话,人工智能到底能解决哪些问题?又怎样区分这些问题?对人工智能来说,哪些事情是真正困难的?人工智能给社会到底带来了哪些挑战?
日前Medium知名博主Yonatan Zunger发布了关于人工智能的深度长文,可以说是一篇不可多得的、深度与趣味性俱佳的最佳科普。雷锋网在不改变原意的情况下为您做如下编译:
在过去的几年里,我们一直在讨论人工智能(AI)将如何拯救或摧毁世界:自驾车有利于保护我们的生命;社交媒体泡沫将破坏民主;机器烤面包机会让人类连烤面包的能力都丧失。
你可能很清楚,这其中的一些是无稽之谈,一些是真实的。但是,如果你没有深入地沉浸在这个领域,可能很难分辨孰真孰假。虽然对于想要学习人工智能编程的人来说,互联网上有大把的启蒙教程,但对于不想成为软件工程师或者数据专家的人来说,却缺乏对于人工智能的概念的了解,以及它所面临的社会上和伦理学上的挑战。
如果全社会真的要讨论人工智能,我们就需要解决这个问题。所以今天我们要谈谈人工智能的现实:它能做什么,不可能做什么,未来可能可以做些什么,以及它带来的一些社会、文化和道德方面的挑战。我不会涵盖每一个可能的挑战;其中的一些,譬如泡沫和虚假信息,大的需要一整篇文章来解释。但是,我会给你们足够的例子说明我们所面临的真正的问题,你们就能够独立提出自己的问题。
我先给大家剧透一下:大多数最难的挑战不是来自于技术。人工智能最大的挑战往往始于,它迫使我们编程时不得不非常明确地表达我们的目标,几乎没有别的事情会这样——而有的时候,我们并不想对自己说实话。
在写这篇文章时,我将或多或少地使用术语“人工智能”(AI)和“机器学习”(ML)。这两个术语意味着几乎相同的东西,原因很愚蠢:因为从历史上来说,“人工智能”差不多被定义为“任何电脑还无法做到的事情”。多年来人们争辩说,下象棋需要真正的人工智能,模拟对话需要真正的人工智能,或者识别图像需要真正的人工智能;每次这些事情实现了一个,人工智能的边界又随之移动。 “人工智能”这个词语太可怕了,它与我们人类定义自己的方式以及那些让人类与众不同的东西靠的太近。所以在某些时候,专业人士会使用“机器学习”这个术语来进行整个对话,然后就卡住了。如果我只是谈论“机器学习”,听起来会显得特别机械——因为即使是专业人士,也总是更多的在谈论人工智能。
那么让我们先来谈谈机器学习或人工智能到底是什么。从最严格的意义上说,机器学习是“预测统计学”领域的一部分,就是建立一个系统,它能够获取过去发生的事情的信息,并且利用这些建立一个关于相关环境的某种模型,用来预测在其他情况下可能发生的事情。简单来说就像“当我把车轮转向左边,车子也往左转”那样简单,往难来说,就像试图了解一个人的整个生活和品味一样复杂。
您可以使用这张图片来了解每个AI的功能:
有一个可以感知世界的传感器系统(sensor) —— 这些系统可以是从摄像机和LIDAR到查看文档的网络爬虫的任何东西。还有一些其他的系统适用于这个环境,比如开车,或者按照分类顾客展示广告。有时候,这个系统是一台机器,有时候是一个人,他必须根据一些很复杂或者太大的事情做出决定,一下子又思考不了那么多—— 比如说整个互联网的内容。
要把两者联系起来,你需要一个盒子,能够提取对这个世界的认知,并且提出一些建议,告诉你如果采取各种行动,可能会发生什么。中间那个盒子叫做“模型(Model)”,就好比一个“这个世界是如何工作的模型”,那个盒子就是人工智能的一部分。
上面的图表中还有一些别的的单词,如果你听专业人士讨论AI时你可能会听到它们。 “特征(Feature)”只是对原始认知的一些升华,包括模型的设计者认为有用的那部分认知。在有些AI系统中,特征只是原始的认知—— 例如,摄像机的每个像素所看到的颜色。如此大量的特征对于AI来说是有益的,因为它不会对什么重要什么不重要有任何先入之见,但是又使得AI本身更难构建;仅仅在过去的十年左右,建立足够大的计算机来处理这个问题才变得可能。
“预测(Prediction)”就是另一端会产生的结果:当你给模型展示一些特征时,它通常会给你一堆可能的结果,以及它对每个结果的可能性的最佳理解。如果你想让一个人工智能做出决定,那么就应用一些规则 —— 例如,“挑选最有可能成功的人”,或者“挑选最不可能导致灾难性失败的人”。对系统而言,权衡可能的成本和收益,重要性不亚于模型本身。
现在,你可以想象一个非常简单的“模型”,它给出了针对用途的具体规则:例如,旧蒸汽机上的机械调节阀是一种简单的“模型”,一端读取压力,如果这个压力超过某个设定点推杆,它会打开一个阀门。这是一个简单的规则:如果压力高于设定值,打开阀门;否则,关闭阀门。
这个阀门非常简单,因为它只需要参考一个输入,并做出一个决定。如果它必须依赖于成千上万甚至数百万输入的信息来决定一些更复杂的东西——比如如何控制一辆汽车(取决于你的所有视觉,听觉等等),或者哪个网页可以给你关于树袋熊养殖的问题提供最好的答案(这取决于你是一时兴起还是专业的脊椎动物争论者,以及该网站是由爱充满激情的爱好者所创办,还是只是想卖给你廉价的树袋熊壮阳药)——你会发现这个比较很不简单,有数百万,甚至数千万信息需要决定。
AI模型的特别之处在于们是专门为此而设计的。在任何人工智能模型里面都有一系列的规则来综合所有特征,每一个特征都依赖于数百数千甚至数百万个单独的按钮,告诉它在不同情况下如何权衡每个特征的重要性。例如,在一种叫做“决策树”的人工智能模型中,模型看起来像是一个关于Yes/No问题的巨树。如果人工智能的工作是从三文鱼中分出金枪鱼,那么第一个问题可能是“图像的左半部分比右半部分更暗”,而最后一个问题大概是“根据之前的374个问题的答案,这个正方形中的平均颜色是橙色还是红色?“这里的“按钮”是询问问题的顺序,以及每个问题的”是“和”否“之间的界限是什么。
魔法在于:不可能找到一个能够可靠地分辨鲑鱼和金枪鱼的正确问题组合。有太多了。所以,始时,AI运行在“训练模式”。AI被展示一个又一个的例子,每次调整它的旋钮,以便更好地猜测接下来会发生什么,在每次错误之后自我纠正。它所看到的例子越多,不同例子越多,它从偶然性中找到关键的能力就越强。一旦它被训练,旋钮的值是固定的,模型可以连接到真正的执行器使用。
ML模型对比人类做同样任务的优势不是速度;一个ML模型通常需要几毫秒来作出决定,人大概也需要这么多时间。 (你在开车的时候一直如此)。他们的真正优势是,他们不会觉得无聊或分心:一个ML模型可以在不同的数据片断上连续做数百万或数十亿次决定,既不会把数据弄得更好也不会更糟。这意味着你可以将它们应用于人类不擅长的问题——比如为单个搜索排名数十亿的网页,或驾驶汽车。
人类驾驶汽车非常糟糕,2015年仅美国就有35,000人因车祸死亡。这些车祸中的绝大多数是由于分心或驾驶员失误造成的——人们通常做得很好,但在某一次关键时刻却失误了。驾驶需要巨大的专注和快速反应能力,你可能认为也可以做到,但糟糕的是,它需要这种能力持续保持几个小时,事实证明,我们实际上做不到。)
当某个人谈论在项目中使用AI时,他们的意思是将项目分解成上面绘制的图,然后构建正确的模型。这个过程首先收集训练的例子,这通常是最困难的任务;然后选择模型的基本形状(即“神经网络”,“决策树”等),这些都是针对不同问题的基本模型),并进行训练;然后,最重要的是弄清楚什么是坏的,并对其进行调整。
例如,看下面的六张图片,找出前三张和后三张的关键区别:
如果你猜“前三张都有地毯”,那么你猜对了!当然,如果你猜前三张是灰猫的照片,后面三张是白猫的照片,你也是对的。
但如果您使用这些图像来训练您的灰猫探测器,那么当模型尝试对您的训练图片进行评分时,您可能会获得优异的表现,但在现实工作中这模型表现会很糟糕,因为模型实际学到的是“灰猫就是地毯上一些类似猫形状的东西。“
当你的模型学习到了训练数据的特质,但却不是你真正关心的东西的时候,这叫做“过拟合”。构建ML系统的人大部分时间都在担心这个问题。
现在我们已经谈论了AI(或ML)是什么,接着让我们来谈谈它究竟是有用还是无用。
如果你想要实现的目标和实现这些目标的手段都能够很好的理解,这种问题就不需要人工智能。例如,如果您的目标是“将车轮上的所有螺母拧紧到100英尺磅”,你只需要一个能够拧紧和测量扭矩的机构,并在扭矩达到100时停止拧紧。这称为“扭矩扳手”,如果有人给你提供一个人工智能的扭矩扳手,你要问他们的第一个问题是我为什么需要这个。 这些降低了AI的阈值,你需要的只是一个简单的机制。
人工智能能帮助解决的问题是:目标是明确的,但实现目标的手段不明确。在以下情况最容易解决:
可能的外部刺激的数量是有限的,所以模型能够了解它们
你必须控制的事物数量是有限的,所以你不需要考虑过多选择范围
刺激或者要做的决定数量很大,你不能直接写下规则并且区分开来
能够很容易的把一个动作连接到外部的一个可观察的结果,因此你可以很容易地弄清楚什么奏效,什么无效。
这些东西实际上比看起来更难。例如,现在拿起一个你旁边的物体——比如我去拿一个空的汽水罐。现在再慢一点做一次,看你的手臂是怎样运作的。
我的胳膊快速地沿肘部转动,将我的手从键盘上水平移动到离罐子几英寸的垂直位置,然后迅速停止。然后它向前移动,同时把手掌打开的比罐头大一点,以比第一个动作慢得多但是其实还是很快的速度,直到我看到我的拇指在我的其他手指的对面,尽管事实上我的其他手指被罐子遮住了视线。然后我的手指合拢,直到遇到阻力立即停下。然后手臂开始抬起,这一次从肩膀起(保持肘部固定)保持握紧,无限地收紧,直到手牢固地握住罐子但又不使罐子变形。
事实上,我们走路而不会脸朝地摔倒就是一件很惊人的事情,虽然看似平常。下一次你走过房间时,要注意你的确切路径,每次你弯曲或移动你的身体,或者把你的脚放在不在面前的别的任何地方。“运动规划”这个问题在机器人技术中是非常困难的。
这是非常艰难的任务之一,我们的大脑付出了比其他事情多两倍的专注来做这件事。这使我们完成的看起来比实际上容易得多。同属此类的其他任务还有面部识别(你可能不知道,我们的大脑的视觉功能大部分不是用于通用视觉,而是专门用于识别脸部的),理解单词,识别3D对象,以及不碰到障碍物。我们认为这些并不难,因为它们对我们来说是非常直观的,但是它们之所以这么简单,是因为我们有专门的器官组织专门负责而且擅长做这些。
对于这一系列狭窄的任务,计算机做得很糟糕,并不是因为他们表现的比在其他类似的任务上差,而是因为人类在直觉上非常擅长这些,所以对“可接受性能”的基线非常高。如果我们的大脑中没有一大块专注于认识面孔,那么我们看人就会像看犰狳一样——现在计算机正是如此。
相反,人类联结的方式又使得计算机就很容易的显得足够智能了。例如,人类的大脑有线连接认为,或多或少活跃的事物事实上就是有生命的。这意味着与人类进行令人信服的对话并不需要总体上理解语言,只要你或多或少的能把话题保持在焦点上,人类就会自动纠正任何不清楚的东西,这就是语音助理能成功的原因。最着名的例子是ELIZA,一个1964年的模仿罗杰亚心理治疗师的“人工智能”,它会理解你的句子,让你更多地讲述各种各样的事情,如果感到困惑,它就会退后一步回到“跟我说说你的母亲吧”这样的安全问题上,虽然这只是一个笑话,但人们表示确实在交谈之后感觉好了一点。
为了理解上述的最后一个问题 ——当你很难把你的直接行动和后果联系起来的时候—— 可以考虑学习玩视频游戏。行动的