▲百度虚拟数字人度晓晓
这位神秘的学霸何许人也?这篇文章什么来路?事实上,这是百度虚拟数字人度晓晓第一次参加高考,根据全国新高考I卷“本手、妙手、俗手”的作文题,度晓晓在40秒时间内写完了40篇800字高考作文,平均一秒完成一篇,最后选出最好的一篇交给老师评分。▲度晓晓高考作文《苦练本手,方能妙手随成》节选
“一日新,翌日新,日日新”、“穷山距海,不能限也”、“朝乾夕惕”……在这篇金句频出的高考作文中,我们可以看到度晓晓拥有庞大的知识贮备以及灵活的语言应用能力。我们已经知道,这个由AI大模型武装大脑的虚拟数字人,之所以能够出口成章,妙笔生花,背后依靠的是百度文心大模型的底层技术支撑。那她是如何准确理解题意,并写出一篇高分作文的呢?AI内容创作又有哪些新玩法,AI大模型将为产业带来哪些新变化?在经过一番深入调查,并与百度相关负责人交流后,我们找到了答案。▲ERNIE 3.0 Zeus大模型
就拿AI写高考作文举例,度晓晓写高考作文和其他的AI文本生成器有何不同?从中我们或许能一窥千亿参数的AI大模型将会带来哪些质变。要想教会AI写出一篇完整的高考作文?这可不是件容易事。
无论是AI还是人类,都需要先审题。不过AI的审题方式与人类有所不同,它们主要通过识别网络和卷积神经网络从大段的作文素材中提取题目,并将其递给下一神经网络。
而难倒无数考生的立意过程,对于AI来说也是不小的挑战。AI需要通过一整套读题网络来猜测哪一个立意更有可能是正确立意。由AI创作的一些搞笑文章,往往都是在这个阶段出现了一定偏差。
随后写作的过程,则是根据考生的写作习惯各自选择的阶段。而AI也会在大量的训练后建立自己的写作模型。
和人类不同的是,AI可以在极短的时间内“写完”多篇高考作文,但也比人们多出一个步骤,找到最好的一篇高考作文。而这个“最好”的评判标准,也是AI在大量的训练中自己得出的一套标准。
但这里还不是重点,此时的AI只能说完成了一篇高考作文。要想让AI能够写出高分作文,AI同样需要像人类一样,在千锤百炼中成长。在AI成长的预训练过程中,ERNIE 3.0 Zeus与其他文本生成器的差距就此拉开。千亿参数的AI大模型调动庞大的计算能力意味着研究人员可以“喂养”大量的作文样本数据让AI明白什么是高分作文。AI大模型在训练中建立自己的写作模型,就像人类的“文风”。最后根据给定的题目,生成与需求匹配的内容,从而完成写作。同时,研发人员也可以在微调的过程中改变AI大模型的惩罚条件,帮助AI大模型摸索出高分作文的潜在条件。但值得注意的是,尽管AI可以写出来高分作文,这并不意味着AI和高考生一样,完全明白高考作文需要从立意明确、语言流畅、修辞丰富等三个标准评判,而是AI大模型通过数据自行对比高分作文之间的共性特点,然后通过数据分析,选出最合适的下一句,由此完成一篇高考作文。可以显而易见的是,这样的处理方式不免会存在一定的漏洞,哪怕是度晓晓生成40多篇文章中也会存在一定不足之处。比如说《苦练本手,方能妙手随成》高考作文中的出现的YYDS之类的网络用语,是不符合高考标准的。再比如说“红楼梦”高考作文中对文章立意的理解会稍有偏差。 ▲度晓晓高考作文中出现网络用语YYDS但这些不能藏住AI大模型的光芒。正是通过ERNIE 3.0 Zeus千亿参数的大模型以及对于NLP程序语言的优化,AI才能学会高考作文的结构框架、输出800字语言流畅的长文本和引经据典以及合理使用名人名言。另一方面,也是通过百度文心大模型,我们可以看见AI写作早已经今时不同往日。过往,人们一谈到AI内容创作总会想到废话文学,而百度文心大模型向我们展示AI的文字表达已经和多数的高中生语言表达能力相当,甚至更优一些。度晓晓以百度文心大模型为技术支撑,给出了一份高分作文,也正说明了AI内容创作的时代已经拉开了新的篇章。AI的创作水平究竟提高到什么水准?我们可以从高考作文中一窥真相。
早在2016年,微软小冰就曾挑战过2016年北京卷高考作文《神奇的书签》。可以看到,这时候AI写作还处在比较初级的阶段,多生成一些短句,并且病句频出。而在六年后,度晓晓就已经能够根据复杂的材料,写出一篇高分作文。
▲微软小冰写高考作文(左)、百度度晓晓写高考作文(右)
由此可见,AI内容创作的水平正在不断提升。而这背后正是科技公司持续多年投入研发的成果,百度也已经在这条道路上扎根多年。
你可能没有发现,在我们日常生活中,已经有不少AI内容创作的产品诞生。
在AI的世界里,很多事物都有了一些新的玩法。你在键盘上,敲入几个节奏,AI就能帮你创造出一段新的旋律;你设定好场景,输入想要表达的内容,选取好颜色,AI就能以此创造出新的画作。
而在一些作词、作诗等文本创作方面,AI已然成为新的内容创作者主体。
百度认为,AIGC是继UGC、PGC之后一种新型的内容生产方式,主要指运用人工智能技术自动生产内容。很多AI虚拟数字人都是AIGC的重要文化输出群体。
AI写出金句频出的高考作文并非易事,其背后也离不开AI大模型的技术支撑。相较于其他的大模型,百度文心大模型拥有的两大杀手锏,“产业级”定位和“知识增强”。
面对AI大模型的“产业级”定位,在百度看来,文心大模型的技术都是根据实际的产业应用场景打造的。
在数据源,百度选择产业内部真实的数据,帮助AI成为一个“业内人士”。在应用方面,百度提供了各式各样的AI工具箱,并帮助开发者快速学会调用AI大模型的能力,根据自己的需求定制化相应的产品。面向产业时,研发人员往往会面临一个问题:AI模型对于数据训练的需求太大,而产业内部很有可能无法提供如此多的数据。同时,AI大模型的训练成本也是阻碍其走入产业的关键因素之一。为了解决这一痛点,百度打造了自己的第二大杀手锏“知识增强”。
百度通过“知识增强”的方法,将数据与知识融合,让百度文心大模型相较于其他大模型学习效率更高、可解释性更好。
当大模型的通用性更好,泛化性更强时,将会大大降低AI开发和应用的门槛。如果说知识图谱让知识之间有着更紧密的内在逻辑,那么“知识增强”则为减少样本数据提供新的解决方式。
目前来看,百度文心大模型的升级,为AI创作提供了更多的发挥空间。
周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...
2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...
3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...
4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...
5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...
周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...
2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...
3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...
4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...
5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...
撤稿申请|
备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有