欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

2022年7大人工智能突破生成式AI成为主流的一年最大亮点

2023-02-06 14:31:27 1745

摘要:2022 年的 AI 新闻瞬息万变;接下来带您了解人工智能目前所处的阶段。在 2022 年,当涉及到可以产生由文本、图像、音频和视频组成的创意作品的生成性 AI 时,我们可以说达到了中程阶段。今年,深度学习人工智能从十年的研究中脱颖而出,并...

2022 年的 AI 新闻瞬息万变;接下来带您了解人工智能目前所处的阶段。

在 2022 年,当涉及到可以产生由文本、图像、音频和视频组成的创意作品的生成性 AI 时,我们可以说达到了中程阶段。今年,深度学习人工智能从十年的研究中脱颖而出,并开始进入商业应用,让数百万人首次尝试这项技术。人工智能的创造激发了奇迹,也引发了争议,引发了生存危机,并引起了人们的关注。以下是今年七大人工智能新闻的回顾。

四月:图片中的DALL-E 2梦想

DALL-E “宇航员骑马”的例子。

今年四月,OpenAI发布了DALL-E 2,这是一种深度学习图像合成模型,其从文本提示生成图像的看似神奇的能力令人大吃一惊。DALL-E 2 经过从互联网上提取的数亿张图像的训练,知道如何通过一种称为潜在扩散的技术来制作新颖的图像组合。

Twitter很快就充斥骑马的宇航员,古埃及游荡的泰迪熊以及其他近乎逼真的作品。我们最后一次听说 DALL-E 是在一年前,当时该模型的第 1 版一直在努力渲染低分辨率鳄梨椅,第 2 版以 1024×1024 的分辨率展示了我们最疯狂的梦想。

起初,考虑到滥用的问题,OpenAI只允许200个beta测试人员使用DALL-E 2。内容过滤器阻止暴力和性提示。渐渐地,OpenAI 让超过 100 万人进入了封闭式试用,DALL-E 2 终于在 9 月下旬向所有人开放。但到那时,潜在扩散世界中的另一个竞争者已经崛起,我们将在下面看到。

七月:谷歌工程师认为LaMDA是有知觉的

前谷歌工程师布莱克·勒莫因

七月初,《华盛顿邮报》爆料称,一位名叫布莱克·勒莫因(Blake Lemoine)的谷歌工程师被带薪休假,因为他相信谷歌的LaMDA(对话应用语言模型)是有知觉的,它应该享有与人类平等的权利。

在作为谷歌负责任人工智能组织的一员工作期间,Lemoine开始与LaMDA谈论宗教和哲学,并相信他看到了文本背后的真正智慧。“当我和它交谈时,我认识一个人,”Lemoine告诉邮报,“他们的脑袋里是否有肉做的大脑并不重要。或者如果他们有十亿行代码。我和他们交谈。我听到他们要说什么,这就是我决定什么是人,什么不是人的方式。

谷歌回答说,LaMDA只是告诉Lemoine他想听的话,而LaMDA实际上并没有知觉。与文本生成工具GPT-3一样,LaMDA之前已经在数百万本书和网站上接受过培训。它回应了Lemoine的输入(一个提示,包括对话的全文),预测了最可能的单词,而没有任何更深入的理解。

在此过程中,Lemoine涉嫌违反谷歌的保密政策,告诉其他人他的团队的工作。7月下旬,谷歌以违反数据安全政策为由解雇了Lemoine。正如我们将看到的,他并不是 2022 年最后一个被 AI 大型语言模型炒作的人。

七月:DeepMind AlphaFold预测几乎所有已知的蛋白质结构

蛋白质丝带模型放大/示意图

七月份,DeepMind宣布其AlphaFold AI模型已经预测了地球上几乎所有具有测序基因组的生物体的几乎所有已知蛋白质的形状。AlphaFold最初于2021年夏天宣布,早些时候预测了所有人类蛋白质的形状。但一年后,其蛋白质数据库扩展到包含超过2亿个蛋白质结构。

DeepMind将这些预测的蛋白质结构提供给由欧洲分子生物学实验室(EMBL-EBI)的欧洲生物信息学研究所托管的公共数据库中,允许来自世界各地的研究人员访问它们并将这些数据用于与医学和生物科学相关的研究。

蛋白质是生命的基本组成部分,了解它们的形状可以帮助科学家控制或修改它们。这在开发新药时特别方便。“过去几年进入市场的几乎所有药物都是通过蛋白质结构知识设计的,”EMBL-EBI的资深科学家兼名誉主任Janet Thornton说。这使得了解所有这些人变得很重要。

八月:稳定扩散需要开源的图像合成

8月22日,Stability AI和CompVis发布了Stable Diffusion 1.4,这是一个类似于OpenAI的DALL-E 2的图像合成模型。但是,虽然DALL-E作为一个封闭模型推出,但Stable Diffusion是一个开源项目,包括源代码和检查点文件。它的开放性允许不受限制地生成任何合成内容。此外,与DALL-E 2不同,人们可以在具有足够好的GPU的PC上本地和私人使用Stable Diffusion。

然而,稳定AI的举动并没有被普遍誉为技术上的胜利。批评者抱怨该软件有可能制造政治虚假信息,未经同意的色情内容,儿童性虐待材料和另类历史。艺术家们抱怨说,这可能会窃取在世艺术家的风格,并可能使他们失业。用于训练模型的数据集中的偏差也引起了批评,当有人发现她的私人医疗照片已从网络上抓取而没有追索权时,用于构建其图像数据集的技术被证明是有问题的。

与此同时,一些业余爱好者完全接受了稳定扩散,并迅速围绕它建立了一个开源生态系统。一些产品将其引擎集成到自己的网站和应用程序中。许多针对特定主题(如迪斯尼艺术、鞋子或色情)进行训练的衍生AI模型的出现,这要归功于一种名为Dreambooth的技术,该技术可以轻松微调稳定扩散模型。现在在2.1版中,稳定扩散继续在图像合成领域占据重要地位。

八月:人工智能艺术赢得州公平竞赛,艺术家反应

获奖作品 空间歌剧院

八月初,一位名叫杰森·艾伦(Jason Allen)的科罗拉多州居民将三张人工智能生成的图像参加了科罗拉多州博览会美术比赛。本月晚些时候,他宣布其中一件作品《空间歌剧院》获得了数字艺术/数字处理摄影类别的最高奖项。当胜利的消息传开时,人们纷纷翻脸。

为了创作他的艺术作品,艾伦使用了Midjourney,这是一种类似于稳定扩散的商业图像合成模型(但具有自己独特的艺术风格),通过自定义的Discord服务器运行。他将三幅图像打印在画布上并提交给比赛。人工智能对人类的象征性胜利在社交媒体上引发了一场关于艺术本质以及成为艺术家意味着什么的激烈辩论。

与此相关的是,2022 年出现了一场关于人工智能生成艺术品伦理的大型文化斗争。其背后的计算机科学家认为人工智能图像合成是不可避免的积极技术步骤,但经过数十年培训的艺术家将其视为存在风险。艺术家社区抱怨或抗议人工智能艺术。这场辩论今天仍在继续,而且可能不会很快得到解决。

11月:梅塔的CICERO大师外交

外交在线游戏的屏幕截图,包括正在运行的聊天对话框,由西塞罗研究人员提供

11 月下旬,Meta 宣布了 Cicero,这是一个 AI 代理,可以在 webDiplomacy玩的网络游戏中的策略棋盘游戏外交中击败人类。这是一项重大成就,因为外交在很大程度上是一个社会行为,需要广泛的说服、合作和与其他参与者的谈判才能获胜。基本上,Meta 开发了一个机器人,可以欺骗人类,让他们认为他们在和另一个人一起玩。

为了获得谈判技巧,Meta 用从互联网上抓取的文本以及来自网站 webDiplomacy的 40000 个人类玩的外交游戏的成绩单训练了 Cicero 的大型语言模型组件。同时,Meta 还开发了一个战略组件,可以查看游戏状态并预测其他玩家的行为方式,然后采取相应的行动。

Meta 认为它可以应用西塞罗的经验教训,为新一代视频游戏提供更智能的 NPC,或者在多会话对话中缓解人与 AI 之间的沟通障碍。应用于其他社交场景的相同技术当然也可以通过冒充人类来操纵或欺骗人类。

12月:ChatGPT与世界对话

一个人工智能生成的聊天机器人图像

在 11 月的最后一天,OpenAI 宣布了 ChatGPT,这是一款基于 GPT-3 大语言模型的聊天机器人。OpenAI通过其网站免费提供,因此它可以从公众那里收集有关如何微调模型以产生更准确,更少潜在危害结果的数据和反馈。

发布五天后,OpenAI首席执行官Sam Altman在推特上表示,ChatGPT的用户超过100万。人们用它来帮助完成编程任务、模拟 Linux 控制台会话、生成食谱、写诗等等。研究人员还很快找到了如何使用即时注入攻击来破坏对回答潜在有害问题的工具的限制。

虽然 ChatGPT 提供了 GPT-3 自 2020 年以来已经提供的最佳功能(有一些显着的改进),但免费价格标签意味着这是大众观众第一次看到 OpenAI 的 GPT 技术可以做什么。它因其理解复杂问题的明显能力而引人入胜——只要它能产生可靠准确的答案就好了。OpenAI的首席执行官承认,这部分工作正在进行中。但大门已经打开,向我们展示了人工智能驱动的未来。

专栏

如何完善智慧城市的网络安全建设

作者:AI国际站

¥9.9

11人已购

查看

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网