当前位置:主页 > 业界动态 > WEB3.0 > 谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

2022-11-25 00:14:28来源:互联网

文章导读
时下,AI领域最火的 技术非AIGC莫属。 去年三月,OpenAI发布了人工智能绘画产品DAL L·E,后来升级到DALL·E 2。 谷歌和Meta紧随其后,并且进一步发展出文字转视频功能。 今年8月, Stable Diffusi ...

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?


时下,AI领域最火的技术非AIGC莫属。去年三月,OpenAI发布了人工智能绘画产品DALL·E,后来升级到DALL·E 2。谷歌和Meta紧随其后,并且进一步发展出文字转视频功能。今年8月,Stable Diffusion正式开源。而在日前,英伟达也宣布加入AIGC的赛道,发布了Magic3D。
AIGC究竟如何从前些年的默默无闻,到这两年的火爆网络?是什么变量促成了这一技术的爆发,又是哪些潜在趋势在助推这股潮流?我们国内目前在这一技术领域的发展现状又如何?

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

AIGC火爆的背后:Diffusion Model的出现AI生成其实一直都有,在2021年之前主要通过NLG生成文字,而要完成图片等视觉艺术品,则要基于生成对抗网络GAN,通过生成器和判别器不断对抗来训练模型。通过GAN的算法训练,可以生成不错的图形,但也有很多问题难以解决,比如图形结果雷同,多样性缺乏;生成器有上升瓶颈,从而造成模式坍缩;以及训练难度高和成本大。所以,尽管图形生已有不短的历史,包括像BigGAN,StyleGAN等的技术突破,但始终未能让产品真正商业化,只能停留在新奇好玩的阶段,直到Diffusion Model(扩散模型)出现。通过马尔科夫链,将文字描述文本经过处理后当做噪声不断添加到原图当中,从而让神经网络从无到有的生成了图片,这是扩散模型的作用原理。通过该模型,算法训练变得更加简洁,只需要添加大量图片,生成的结果相较GAN更具多样性。但自2015年诞生的前五年,扩散模型并没有引起业界关注。直到2020年,一篇名为Denoising Diffusion Probabilistic Models 的论文终将这一模型用在了图像的生成上。反应极快的OpenAI,在隔年1月即公布将出品Dall-E。并宣称Diffusion Model击败了GAN(论文:Diffusion Models Beat GANs on Image Synthesis),从而似乎为AI生成的工程落地指明了方向。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

更多推动力:大模型、多模态、开源模式同样是OpenAI,两年前推出1750亿参数的预训练语言大模型GPT-3,至此开始,千亿规模的大模型训练成为流行趋势。但在国内,一方面因为接口开放的限制,AI生成相关应用难以使用;另一方面,大模型训练成本高企,让不少企业望而却步。这些导致了AI生成在国内无论是应用,还是形成产业都未能起势。但在近来,还是有不少国内企业开始关注大模型训练,走在前面的公司已经展开训练。同样非常火的多模态,对于发展AIGC来说,重要性体现在打破不同模态的数据,包括文本、图像、视频、音频等数据之间的分界线,从而在模型的构建上趋向统一。多模态已经通过 DALL-E、Stable Diffusion的应用日趋成熟。而除了技术本身,开源模式也进一步推动了AIGC的发展,AIGC火爆也有像Stable Diffusion正式开源(模型权重和代码)的功劳,这意味着所有人都可以通过开源代码做出文本生成图像的产品,因而Stable Diffusion也在GitHub上长期霸榜。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

彼岸到此岸:国内AIGC的产业先锋们

然而,对于中文世界的创作者来说,无论是在 DALL-E 2 还是在Stable Diffusion上操作,不仅需要对英文Prompts的准确表达极尽思考,在英文语境下想要生成真正地道中国风的画作也是难上加难。
实际上,国内已经有一些AIGC的行业先锋推出了中文版的AI生成产品。紧随Stable Diffusion,心辰科技(盗梦师团队)在不到一个月时间,于今年8月底上线 AI 作画产品“盗梦师”。仅用1秒出图,日留存率接近50%,上线不到两个月生成的图像数量已经达到1千万张,且已经开启商业化。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

盗梦师生成的画作本月初,第一个中文版本的 Stable Diffusion 模型“太乙 Stabl Diffusion”正式开源。2022 年 7 月,IDEA CCNL开源了第一个中文CLIP模型,目前已经有 4 个版本。太乙 Stable Diffusion上线二十天,下载量即超过10万,成为全球排名第三的Stable Diffusion模型。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

太乙 Stable Diffusion生成的画作“飞流直下三千尺 ,唯美,插画”本月中,智源研究院大模型研究团队开源最新双语AltDiffusion模型,并在近日升级至 AltDiffusion-m9版本,全面支持中、英、西、法、日、韩、阿、俄、意等九种不同语言的文图生成任务。该模型已跻身 GitHub Python 开源项目每日热榜,paperwithcode 网站热度前5。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

AltDiffusion生成的画作那么,这些惟妙惟肖的画作究竟是如何生成的?扩散模型能够为AI生成带来哪些变革?多模态、大模型又给AI生成带来哪些助推力?AIGC在国内发展现状如何?又该如何实现商业化?今晚19:30,我们请到盗梦师、太乙 Stable Diffusion、AltDiffusion的创作者和资深技术专家,共同探讨、解密AIGC的背后有哪些玄机。

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

扫码,预约直播,等你来~

谷歌、Meta、英伟达……巨头扎堆的AIGC,国内发展如何了?

热门文章
日榜 周榜
1 3月6日投资晚报|证监会:鼓励上市公司一年多次分红,上海电力

周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...

2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车

2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...

3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场

界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...

4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念

3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...

5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生

界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...

1 3月6日投资晚报|证监会:鼓励上市公司一年多次分红,上海电力

周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...

2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车

2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...

3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场

界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...

4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念

3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...

5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生

界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...

撤稿申请|

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有