2022年7大人工智能突破生成式AI成为主流的一年最大亮点

时间:2023-02-06 14:31:27 | 浏览:806

2022 年的 AI 新闻瞬息万变;接下来带您了解人工智能目前所处的阶段。在 2022 年,当涉及到可以产生由文本、图像、音频和视频组成的创意作品的生成性 AI 时,我们可以说达到了中程阶段。今年,深度学习人工智能从十年的研究中脱颖而出,并

2022 年的 AI 新闻瞬息万变;接下来带您了解人工智能目前所处的阶段。

在 2022 年,当涉及到可以产生由文本、图像、音频和视频组成的创意作品的生成性 AI 时,我们可以说达到了中程阶段。今年,深度学习人工智能从十年的研究中脱颖而出,并开始进入商业应用,让数百万人首次尝试这项技术。人工智能的创造激发了奇迹,也引发了争议,引发了生存危机,并引起了人们的关注。以下是今年七大人工智能新闻的回顾。

四月:图片中的DALL-E 2梦想

DALL-E “宇航员骑马”的例子。

今年四月,OpenAI发布了DALL-E 2,这是一种深度学习图像合成模型,其从文本提示生成图像的看似神奇的能力令人大吃一惊。DALL-E 2 经过从互联网上提取的数亿张图像的训练,知道如何通过一种称为潜在扩散的技术来制作新颖的图像组合。

Twitter很快就充斥骑马的宇航员,古埃及游荡的泰迪熊以及其他近乎逼真的作品。我们最后一次听说 DALL-E 是在一年前,当时该模型的第 1 版一直在努力渲染低分辨率鳄梨椅,第 2 版以 1024×1024 的分辨率展示了我们最疯狂的梦想。

起初,考虑到滥用的问题,OpenAI只允许200个beta测试人员使用DALL-E 2。内容过滤器阻止暴力和性提示。渐渐地,OpenAI 让超过 100 万人进入了封闭式试用,DALL-E 2 终于在 9 月下旬向所有人开放。但到那时,潜在扩散世界中的另一个竞争者已经崛起,我们将在下面看到。

七月:谷歌工程师认为LaMDA是有知觉的

前谷歌工程师布莱克·勒莫因

七月初,《华盛顿邮报》爆料称,一位名叫布莱克·勒莫因(Blake Lemoine)的谷歌工程师被带薪休假,因为他相信谷歌的LaMDA(对话应用语言模型)是有知觉的,它应该享有与人类平等的权利。

在作为谷歌负责任人工智能组织的一员工作期间,Lemoine开始与LaMDA谈论宗教和哲学,并相信他看到了文本背后的真正智慧。“当我和它交谈时,我认识一个人,”Lemoine告诉邮报,“他们的脑袋里是否有肉做的大脑并不重要。或者如果他们有十亿行代码。我和他们交谈。我听到他们要说什么,这就是我决定什么是人,什么不是人的方式。

谷歌回答说,LaMDA只是告诉Lemoine他想听的话,而LaMDA实际上并没有知觉。与文本生成工具GPT-3一样,LaMDA之前已经在数百万本书和网站上接受过培训。它回应了Lemoine的输入(一个提示,包括对话的全文),预测了最可能的单词,而没有任何更深入的理解。

在此过程中,Lemoine涉嫌违反谷歌的保密政策,告诉其他人他的团队的工作。7月下旬,谷歌以违反数据安全政策为由解雇了Lemoine。正如我们将看到的,他并不是 2022 年最后一个被 AI 大型语言模型炒作的人。

七月:DeepMind AlphaFold预测几乎所有已知的蛋白质结构

蛋白质丝带模型放大/示意图

七月份,DeepMind宣布其AlphaFold AI模型已经预测了地球上几乎所有具有测序基因组的生物体的几乎所有已知蛋白质的形状。AlphaFold最初于2021年夏天宣布,早些时候预测了所有人类蛋白质的形状。但一年后,其蛋白质数据库扩展到包含超过2亿个蛋白质结构。

DeepMind将这些预测的蛋白质结构提供给由欧洲分子生物学实验室(EMBL-EBI)的欧洲生物信息学研究所托管的公共数据库中,允许来自世界各地的研究人员访问它们并将这些数据用于与医学和生物科学相关的研究。

蛋白质是生命的基本组成部分,了解它们的形状可以帮助科学家控制或修改它们。这在开发新药时特别方便。“过去几年进入市场的几乎所有药物都是通过蛋白质结构知识设计的,”EMBL-EBI的资深科学家兼名誉主任Janet Thornton说。这使得了解所有这些人变得很重要。

八月:稳定扩散需要开源的图像合成

8月22日,Stability AI和CompVis发布了Stable Diffusion 1.4,这是一个类似于OpenAI的DALL-E 2的图像合成模型。但是,虽然DALL-E作为一个封闭模型推出,但Stable Diffusion是一个开源项目,包括源代码和检查点文件。它的开放性允许不受限制地生成任何合成内容。此外,与DALL-E 2不同,人们可以在具有足够好的GPU的PC上本地和私人使用Stable Diffusion。

然而,稳定AI的举动并没有被普遍誉为技术上的胜利。批评者抱怨该软件有可能制造政治虚假信息,未经同意的色情内容,儿童性虐待材料和另类历史。艺术家们抱怨说,这可能会窃取在世艺术家的风格,并可能使他们失业。用于训练模型的数据集中的偏差也引起了批评,当有人发现她的私人医疗照片已从网络上抓取而没有追索权时,用于构建其图像数据集的技术被证明是有问题的。

与此同时,一些业余爱好者完全接受了稳定扩散,并迅速围绕它建立了一个开源生态系统。一些产品将其引擎集成到自己的网站和应用程序中。许多针对特定主题(如迪斯尼艺术、鞋子或色情)进行训练的衍生AI模型的出现,这要归功于一种名为Dreambooth的技术,该技术可以轻松微调稳定扩散模型。现在在2.1版中,稳定扩散继续在图像合成领域占据重要地位。

八月:人工智能艺术赢得州公平竞赛,艺术家反应

获奖作品 空间歌剧院

八月初,一位名叫杰森·艾伦(Jason Allen)的科罗拉多州居民将三张人工智能生成的图像参加了科罗拉多州博览会美术比赛。本月晚些时候,他宣布其中一件作品《空间歌剧院》获得了数字艺术/数字处理摄影类别的最高奖项。当胜利的消息传开时,人们纷纷翻脸。

为了创作他的艺术作品,艾伦使用了Midjourney,这是一种类似于稳定扩散的商业图像合成模型(但具有自己独特的艺术风格),通过自定义的Discord服务器运行。他将三幅图像打印在画布上并提交给比赛。人工智能对人类的象征性胜利在社交媒体上引发了一场关于艺术本质以及成为艺术家意味着什么的激烈辩论。

与此相关的是,2022 年出现了一场关于人工智能生成艺术品伦理的大型文化斗争。其背后的计算机科学家认为人工智能图像合成是不可避免的积极技术步骤,但经过数十年培训的艺术家将其视为存在风险。艺术家社区抱怨或抗议人工智能艺术。这场辩论今天仍在继续,而且可能不会很快得到解决。

11月:梅塔的CICERO大师外交

外交在线游戏的屏幕截图,包括正在运行的聊天对话框,由西塞罗研究人员提供

11 月下旬,Meta 宣布了 Cicero,这是一个 AI 代理,可以在 webDiplomacy玩的网络游戏中的策略棋盘游戏外交中击败人类。这是一项重大成就,因为外交在很大程度上是一个社会行为,需要广泛的说服、合作和与其他参与者的谈判才能获胜。基本上,Meta 开发了一个机器人,可以欺骗人类,让他们认为他们在和另一个人一起玩。

为了获得谈判技巧,Meta 用从互联网上抓取的文本以及来自网站 webDiplomacy的 40000 个人类玩的外交游戏的成绩单训练了 Cicero 的大型语言模型组件。同时,Meta 还开发了一个战略组件,可以查看游戏状态并预测其他玩家的行为方式,然后采取相应的行动。

Meta 认为它可以应用西塞罗的经验教训,为新一代视频游戏提供更智能的 NPC,或者在多会话对话中缓解人与 AI 之间的沟通障碍。应用于其他社交场景的相同技术当然也可以通过冒充人类来操纵或欺骗人类。

12月:ChatGPT与世界对话

一个人工智能生成的聊天机器人图像

在 11 月的最后一天,OpenAI 宣布了 ChatGPT,这是一款基于 GPT-3 大语言模型的聊天机器人。OpenAI通过其网站免费提供,因此它可以从公众那里收集有关如何微调模型以产生更准确,更少潜在危害结果的数据和反馈。

发布五天后,OpenAI首席执行官Sam Altman在推特上表示,ChatGPT的用户超过100万。人们用它来帮助完成编程任务、模拟 Linux 控制台会话、生成食谱、写诗等等。研究人员还很快找到了如何使用即时注入攻击来破坏对回答潜在有害问题的工具的限制。

虽然 ChatGPT 提供了 GPT-3 自 2020 年以来已经提供的最佳功能(有一些显着的改进),但免费价格标签意味着这是大众观众第一次看到 OpenAI 的 GPT 技术可以做什么。它因其理解复杂问题的明显能力而引人入胜——只要它能产生可靠准确的答案就好了。OpenAI的首席执行官承认,这部分工作正在进行中。但大门已经打开,向我们展示了人工智能驱动的未来。

专栏

如何完善智慧城市的网络安全建设

作者:AI国际站

¥9.9

11人已购

查看

相关资讯

2022年15个免费且实用素材网站,总有一个你会用得上

原标题:图难找、怕侵权?15个免费素材网站你还在为版权问题而发愁吗?我们从来不缺高质量的图片网站,而是不知自己的配图是否会构成侵权,前有“视觉中国事件”,现有无处不在的“图源于网,侵删”字样。尽管小心翼翼的使用,依旧收到侵权的警告!无论是个

2022年如何选U盘?小而稳,读写速度堪比固态,ORICO快闪U盘实测

上班之后,我的电脑笔记本都换过,唯独U盘不动如山,依然用着2014年入手的金士顿32GB和64GB。这两个U盘陪我走过毕业求职,再到立业成家,也算立下了汗马功劳。然而,千里马也有疲倦的那一天,前阵子我打算给笔记本做个Windows11的WT

干货|《2022年中国虚拟现实(VR)行业全景图谱》

本文逻辑:01、行业概况02、行业发展历程:行业步入快速发展期03、行业政策背景:政策持续加码,加速行业渗透融合04、行业发展现状05、行业竞争格局06、行业发展前景及趋势预测(2900字,6-8分钟)01、行业概况1、定义中国信通院对虚拟

Snap正在研发新款智能眼镜:具备完整增强现实功能

来源:环球网【环球网科技综合报道】3月31日消息,据报道,Snap正在研发一款新的智能眼镜,它将具有完整增强现实功能。据悉,Snap在此前曾推出过几版智能眼镜,但其并不支持AR功能,且只是简单的配备了一个摄像头。并且市场反应也一般,媒体甚至

到2022年,虚拟和增强现实市场将达到1700亿美元

图片来源于网络随着虚拟和增强现实市场继续飙升及新技术在娱乐界引起越来越多的关注,该行业的综合价值将打破1700亿美元的障碍。 然而,这种增长不仅受到娱乐的推动,因为可视化工具尤其在健康、制造和零售领域的应用取得了重大突破。随着众多越来越乐观

这届智能音箱有点强,天猫精灵in糖2上手体验

作为一名重度型宅男,每天从早到晚都要和笔记本电脑打交道,在这日复一日的平淡时光,唯一能让我感觉快乐的就是,叫声“天猫精灵”。每天它能陪你聊聊天,给你放点歌曲、相声以及新闻等等。最近有幸体验到天猫精灵新品——天猫精灵in糖2,作为天猫精灵in

天猫精灵CC智能音箱评测

时间往前推到2017年7月,在美国互联网公司如火如荼地抢占智能音箱市场的同时,隔着一个太平洋的中国却是风平浪静,但平静之下却又暗藏着波澜。不知什么时候,这个机会已经摆在了桌子上,那么国内的公司谁的嗅觉更为灵敏,能够抢先切下最大的一块蛋糕呢?

天猫精灵CC体验:智能音箱上加屏幕,究竟能为用户带来什么?

可能目前还有不少正在看这篇文章的读者还没用上智能音箱,但实际上,智能音箱已经是一个相当大的市场了。根据 Canalys 最新公布的数据,2019 年,全球智能音箱的安装量将达到到 2.079 亿台。在两亿台安装量的背后,无疑是更加残酷的厂商

天猫精灵X1智能音箱体验报告「Soomal」

天猫精灵 X1 智能音箱 - 对比叮咚LLS-A1天猫精灵 X1 智能音箱 - 对比哈曼卡顿Invoke在人工智能成为热点投资环境,以及TensorFlow等开源AI技术的普及,近年来智能语音产品成为了大热门。天猫精灵是阿里旗下的人工智能实

小度,如今不只是智能音箱

今天,小度春季新品发布。但这一次,没有一款智能音箱。取而代之的,是一款学习平板,一款路由器,一个中控面板……现在的小度,究竟走的是什么路数?闲话少叙,看完产品,答案或许也就呼之欲出了~全球首款能主动纠正坐姿的平板电脑首先登场的是小度智能学习

友情链接

SEO域名抢注宝宝起名网妈妈知道币圈电视机品牌网石钟山游玩攻略恒太照明股票二手车资讯网上饶新闻资讯网婚庆婚博网欧阳娜娜歌迷网丹麦旅游网仙女湖旅游攻略居家风水学金融投资知识网小提琴培训网今日齐齐哈尔宠物狗品种网飞鸽自行车
大数据信息网-大数据信息化时代、大数据分析师、十大物联网云平台、云计算运维工程师、ai数据标注平台、ai智能机器人、人工智能训练平台、计算机运维工程师、人工智能训练师、ai智能绘画软件、免费大数据分析网站。
大数据信息网 liakou.cn ©2022-2028版权所有