新智元报道
编辑:编辑部【新智元导读】一年一度的百度Create大会又来了,还是一如既往地酷炫、硬核!当你仰望星空时,你在想些什么?
有执着的发问,就会有不曾想象的回音。
从方寸之间到寰宇之外,创造新宇宙的人,相信永远看不到天花板。
坚定的人,不会因为到达而停下,他们用创造的脚步丈量未知。
百度CREATE 2022大会,为我们展示了人类设计师和AIGC共同创意制作的绘画。
而就像这些绘画所描述的场景,百度,也不曾停下创新的脚步。
在大会开始,李彦宏就提出了一个令人深思的观点:第四次科技革命的标志,就是深度学习算法。与深度学习相关的重大创新,会像汽车、互联网一样,对我们的社会产生重大的影响。
真正的实践中,没有导航地图,只有指南针。而百度,也是摸准大致方向后,基于实践一步步迭代,才跑出了有价值的创新。
在大会上,李彦宏展示了这样一幅画。这幅画是他以「危机和希望」为关键词,在百度AI作画平台一格上生成的。
这幅画,很好地代表了人工智能面临的现状——经历起起落落,但充满希望。
是的,李彦宏依然坚持去年的观点——创造者们将迎来属于人工智能的黄金十年。
AIGC元年,来了
2022,AIGC全面爆发。DALL·E2让文本生成图片火爆一整年,随后的Stable Diffussion、Midjourney,更是启发了无数人的艺术灵感,甚至让不少画手感到震惊。
而DALL·E2和谷歌发布的Imagen的模型,也吸引了许多AI学者参与研究。
ChatGPT虽然到了年末才压轴出场,但「强化学习」赋予它的魔力,让它在全民狂欢中再次掀起AIGC的风暴。其实,在2022年初,百度研究院早已预测到了AIGC在这一年的火爆。
超大规模预训练模型呈现知识增强、跨模态统一建模、多学习方式共同演进的趋势,并逐渐实用化。
例如AIGC (AI generated content,人工智能创造内容),借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将会实现大规模应用。
而且,这已经不是百度研究院第一次做出神预测了。2020年,它预测的NLP模型在GPT-3上得到应验,而在2021年,它押中的数字人全面大爆。
而这次,百度对于AIGC领域的趋势,可谓是胸有成竹。
三个天才创作者,一键圆你导演梦
在Create 2022大会上,百度几乎将AIGC深入应用到了每一个环节。歌曲、场景、演讲脑图的创作,这些环节中,全都有AI的参与。而李彦宏以「危机和希望」为主题生成的绘画,背后就是文心知识增强跨模态大模型一格,它就是接下来要出场的三位天才创作者的其中一位。
这次Create大会上,百度技术委员会主席吴华为我们介绍了三位能力超群的天才创作者。
它们分别是天才编剧——文心ERNIE3.0Zeus,天才插画师——文心ERNIE-ViLG 2.0,剪辑和动画大师——VIMER-TCIR。
有了这三位天才创作者,再配上自己设计的虚拟人演员,你也可以当上导演,拍出自己的影视大作了!
文心ERNIE 3.0 Zeus语言大模型,陪你聊到天荒地老!
作为ERNIE 3.0系列模型的最新升级,ERNIE 3.0 Zeus除了对无标注数据和知识图谱的学习之外,还通过持续学习对百余种不同形式的任务数据实现了全面掌握。
在对通用知识和专门知识「双管齐下」后,模型的泛化能力显著提升,不管是多语言理解,还是生成任务,都能轻松搞定,名副其实的「通才」了属于是。
无论是自主创作、自由回答,还是命题对话、情感分析,100多个层次化Prompt,ERNIE 3.0 Zeus都能顺利应对。
文心ERNIE-ViLG 2.0图像生成大模型,天才画师了解一下?
如果说文心ERNIE 3.0 Zeus是语言大师,ERNIE-ViLG 2.0就是作画大师。它能根据一句话或者一段描述文本,生成一幅精美的画作。
中文提示,想要什么画,直接开口说就行,只有你想不到的,没有ta画不出来的,看看这艘青花瓷战舰,像不像一尊精美的艺术品?就是不知道真的打起来,会不会被一炮干碎......
而要达成这个目标,离不开模型本身背后知识增强的扩散模型。
一句话或几句话的提示中,哪些是核心要素,需要在画作中突出展现,哪些是修饰要素,作用就是锦上添花,还不能喧宾夺主,这里边就有学问了。
为了尽可能实现精准作画,在学习过程中,ERNIE ViLG 2.0引入了语言、视觉等多源知识,引导模型更加关注文本和图像中的核心语义元素,实现精准的细粒度语义控制。
此外,ERNIE ViLG 2.0还可以针对不同阶段,选择不同网络(比如降噪)建模的框架,有效解决了不同阶段对模型能力要求不一致的问题,减少了降噪任务的互相干扰,提升了图像生成的质量。
无论是写实风、中国风、还是国潮、国画风,ERNIE-ViLG 2.0都能根据简短的中文提示生成切题、风格各异、且生动逼真的图像。
举个例子,比如下面这段艳丽飘逸的「天宫盛宴」:
基于ERNIE-ViLG 2.0的文心·一格,交出了可以说是面面俱到的作业,整体画风色调明艳,不失古代情调。
现在,我们只需要在百度「文心·一格」平台上输入几个关键词,也能分分钟得到风格独特的画作。
除了语言和图像外,在视频内容生成与编辑上,也是文心大模型大展身手的地方。
在视觉内容生成方面,视频生成大模型可以根据用户提供的一段描述文本,或者一幅图像,自动地生成高清、流畅的视频。
在视觉编辑方面,VIMER-TCIR多任务大模型,则可以利用对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练,同时实现对多种不同情况的修复和编辑。
目前,VIMER-TCIR已经在老电影修复等场景实现落地,而且大幅提升了运行效率,每天单机就可修复视频28.5万帧,解决了绝大部分老电影画面的修复问题。
AIGC的浪潮已经到来,在未来,可以预见的是,AI作画、AI创作视频等等,很快就会变得像手机拍照一样简单。
周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...
2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...
3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...
4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...
5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...
周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...
2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...
3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...
4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...
5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...
撤稿申请|
备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有