当前位置:主页 > 产业资讯 > 更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类

2023-03-15 15:24:59来源:互联网

文章导读
当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4.该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。 OpenAI于2020年发布了GPT(生成型 ...

  当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4.该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

  OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这两款产品极大地吸引了公众的关注,并刺激其他科技公司更积极地追求人工智能(AI)。

  OpenAI周二表示,在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。

  OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

  据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

  例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

  OpenAI表示,虽然两个版本在日常对话中看起来很相似,但当任务复杂到一定程度时,差异就表现出来了,GPT-4更可靠、更有创造力,能够处理更微妙的指令。

  不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

  OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

  OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。

  延伸阅读

  ChatGPT成“西南偏南”热议话题 OpenAI联合创始人:未来AI更像一个全天候助手 将首先替代基于认知的工作

  当地时间3月10日至19日,西南偏南多元创新大会和艺术节(SXSW)在美国得克萨斯州奥斯汀举行。如果说去年SXSW的主题是关于Web3、NFT和元宇宙,那么今年的SXSW显然展现出完全不同的景象,ChatGPT几乎成为贯穿每场活动的话题。

  3月10日,OpenAI联合创始人兼总裁Greg Brockman在当天举行的活动现场接受了外媒的专访,在长达一小时的谈话中,Brockman谈到了许多与ChatGPT和人工智能(AI)的话题。当天,现场座无虚席,观众时不时因为Greg的发言而发出阵阵呼声。

  与许多人一样,在Brockman的畅想中,未来的通用AI将给人类带来颠覆性的影响。他认为,未来AI更像是一个全天候的助手,它能够“放大”人们的能力,并帮助人类获得新的想法。

  “想想今天,每个人都在看同一个电视节目,也许人们都在看《权力的游戏》的最后一季,”他说,“但想象一下,如果你可以让你的AI以不同的方式进行,甚至可能将自己作为主角置身其中,并进行互动体验。”

  在此之前,许多人——包括Brockman本人在内——都认为AI将从一些体力劳动开始替代人类的工作,但如今的事实恰好相反。Brockman在谈话中表示,未来人类基于认知的工作将首先被机器取代,例如内容审核。因此,在AI浪潮中,人类需要更高级别的技能、判断和认知。

  ChatGPT火爆背后:更强的语言处理 开源

  ChatGPT无疑是近期发展最迅猛的应用之一,它的崛起也使生成式人工智能赛道升温。上个月,ChatGPT在推出仅两个月后,月活用户估计已达1亿,成为历史上增长最快的消费应用。

  Brockman在谈到这一点时,也承认ChatGPT的火爆让他自己感到惊讶。他表示,这是OpenAI首次公布一个面向大众消费者的应用,整个团队对此感到非常紧张,但好在结果是积极的。

  对于ChatGPT现象级的火爆,他认为,尽管ChatGPT背后的大型语言模型GPT-3.5早于一年前就已经诞生,并非一个新的技术,但他和他的团队做了很多额外的工作让其拥有了更强的语言处理能力

  其次,Brockman认为,OpenAI做出的“开源”决定也是让ChatGPT如此受欢迎的原因之一。继去年11月底公布ChatGPT后,本月初ChatGPT的API也向公众开放了。“人们能够接触到最前沿的技术,他们能够亲身体验到什么是‘可能’,什么是‘不可能’,”Brockman这样说道。

  OpenAI公司:目标是通用AI

  在ChatGAPT掀起新一轮AI浪潮的同时,OpenAI这家公司也走到了聚光灯下。2015年7月,Brockman与该公司的另一位创始人兼首席执行官Sam Altman在一次晚宴上齐聚一堂,讨论AI的未来。在场还有许多大名鼎鼎的人物,例如Elon Musk、Reid Hoffman、Jessica Livingston、Peter Thiel、和 Olivier Grabia。

  他们认为通用AI的未来并非不能实现,并向彼此问道这个时候一起开办实验室是否为时已晚呢?答案不言而喻,于是,OpenAI就这样成立了。最初,OpenAI是一家非营利性研究实验室,计划开源代码,他们的目标是让所有东西都开源。但为了更好地确保资金和规模,在2019年转为营利性公司。

  不过,并非所有创始人都坚持留在了这里。Elon Musk于2018年从OpenAI董事会辞职,但仍是捐助者。不过,近几个月来一直直言不讳地批评该公司,称其存在偏见。

  在访谈中,Brockman接受了这个批评,也承认ChatGPT并不完美。“这是我们的失败,我们没有足够快地解决ChatGPT 中的偏见,虽然我们也不希望它们存在。我们的目标确实是拥有一个平等的系统,对所有人一视同仁。在过去的一个月里,我们实际上在这方面有了很多改进。”他说道。

  Brockma:AI不完美是必须经历的过程

  尽管ChatGPT收获了许多掌声,但正如大众所知道的那样,它远非完美,有时会“自信地说出完全错误的话”。上个月,微软发布了嵌入ChatGPT模型的新版必应浏览器后,必应立刻“花式翻车”了。有关AI伦理的问题也再次被广泛讨论。

  “很多时候(产品)与大众的期望是有鸿沟的。这是一个过程,你必须经历这些痛苦。但我们的目标是建立一种信任。” 。“ Brockma表示,”即便我们知道它并不完美,但你不应该因为过于保守而将这些东西雪藏起来。

  AI的伦理问题也是Brockman经常思考的问题,他认为人工智能是全人类需要帮助的东西,人们也不应该100%地相信人工智能。他表示,错误信息一直是OpenAI很关注的一件事,这也是为什么需要收集用户反馈的数据对模型进行不断地调整。

  AI的滥用一直是围绕在这项技术身上的担忧。Brockman透露,最常见的一种滥用AI的方式是用户通常用来传播有关毒品等有害事物的信息。不过,通过观察ChatGPT的用户信息反馈,他们发现,许多用户会创建多个账号来尽可能多地尝试使用ChatGPT,但是却过于依赖ChatGPT给出的信息,即便其给出的信息是错误的。

  Brockman说,随着AI工具的发展,新闻业和拥有权威的信息来源将变得越来越重要。基于此,他也认为,对于AI的监管也越来越重要,而在这一点上,需要所有人的参与。

  通用AI的未来:全天候助手

  可以说,ChatGPT带来了AI的黄金时刻。对于这一点,Brockman认为,得益于过去数年的努力,才迎来了今天的爆发。AI积累了一定的价值才能呈现如今的指数级增长,它并非昙花一现。

  他表示,ChatGPT 自去年12月以来已经更新了大约四五次。许多人对ChatGPT的使用让他感到惊喜,他已经看到了AI工具改变人类学习方式的潜力。“在我们公司,有员工的英文不好,ChatGPT正好可以帮助他的英文写作。”他这样说道。

  谈及通用AI的未来时,Brockman认为,通用AI将给人类带来颠覆性的影响。最重要的一点是,AI能够“放大”人们的能力,它会更像一个助手,尤其是在知识性的工作上。例如,在医疗、编码、写作、娱乐等领域的工作上,AI将开辟另一个个性化定制的世界。

  “对我来说,生成式AI真正能发挥作用的地方在于解除你的阻碍,获得新的想法,并成为一个愿意24小时为你服务的助手,”Brockman说。

  尽管Brockman认为,AI不会完全替代人们的工作,但他承认,部分工作的确会被机器所取代。

  “许多人——包括我自己——曾经都认为AI将从一些体力劳动开始替代人类的工作。但是,从现在来看,事实是相反的。AI会首先替代基于认知的工作,例如内容审核、写诗之类的。”他说道。因此,Brockman表示,在AI浪潮中,人们需要更高级别的技能、判断和认知。

热门文章
日榜 周榜
1 外交部领事司:3月15日起驻外签证机关恢复审发外国人各类赴华

外交部领事司发布通告:为进一步便利中外人员往来,决定自北京时间2023年3月15日零时起,就...

2 3月14日贵金属板块涨幅达5%

  3月14日9点31分,贵金属板块指数报937.248点,涨幅达5%,成交10.01亿元,换手率0.24%。   板...

3 中润资源3月14日快速上涨

3月14日,中润资源盘中快速上涨,5分钟内涨幅超过2%,截至9点30分,报4.04元,成交4585.12万元,...

4 迪阿股份3月14日快速反弹

3月14日,迪阿股份盘中快速反弹,5分钟内涨幅超过2%,截至9点30分,报52.27元,成交121.98万元,...

5 奥普光电3月14日快速回调

3月14日,奥普光电盘中快速回调,5分钟内跌幅超过2%,截至9点30分,报29.21元,成交2702.91万元...

6 保时捷2022年全球交付新车309884辆 中国连续第八年蝉联最大单一

3月13日,保时捷发布上市以来第一份年度财报,并发布“通向20之路”战略,即集团销售回报率...

7 差别化住房信贷政策调整对居民家庭有何影响?30年期50万贷款利

5月15日,中国人民银行、中国银行保险监督管理委员会发布调整差别化住房信贷政策有关问题...

8 多只个股最新股东户数大降 远兴能源降逾两成

3月13日、14日,一批上市公司通过互动易平台发布最新股东户数,其中多家公司最新股东户数大...

9 恒生指数开盘跌0.87% 恒生科技指数跌0.5%

恒生指数开盘跌0.87%;恒生科技指数跌0.5%。...

10 三未信安等22只科创板股融资余额增幅超10%

统计显示,3月13日共有274只科创板个股融资余额环比增加。其中,22股融资余额增幅超过10%。融...

1 外交部领事司:3月15日起驻外签证机关恢复审发外国人各类赴华

外交部领事司发布通告:为进一步便利中外人员往来,决定自北京时间2023年3月15日零时起,就...

2 3月14日贵金属板块涨幅达5%

  3月14日9点31分,贵金属板块指数报937.248点,涨幅达5%,成交10.01亿元,换手率0.24%。   板...

3 中润资源3月14日快速上涨

3月14日,中润资源盘中快速上涨,5分钟内涨幅超过2%,截至9点30分,报4.04元,成交4585.12万元,...

4 迪阿股份3月14日快速反弹

3月14日,迪阿股份盘中快速反弹,5分钟内涨幅超过2%,截至9点30分,报52.27元,成交121.98万元,...

5 奥普光电3月14日快速回调

3月14日,奥普光电盘中快速回调,5分钟内跌幅超过2%,截至9点30分,报29.21元,成交2702.91万元...

6 保时捷2022年全球交付新车309884辆 中国连续第八年蝉联最大单一

3月13日,保时捷发布上市以来第一份年度财报,并发布“通向20之路”战略,即集团销售回报率...

7 差别化住房信贷政策调整对居民家庭有何影响?30年期50万贷款利

5月15日,中国人民银行、中国银行保险监督管理委员会发布调整差别化住房信贷政策有关问题...

8 多只个股最新股东户数大降 远兴能源降逾两成

3月13日、14日,一批上市公司通过互动易平台发布最新股东户数,其中多家公司最新股东户数大...

9 恒生指数开盘跌0.87% 恒生科技指数跌0.5%

恒生指数开盘跌0.87%;恒生科技指数跌0.5%。...

10 三未信安等22只科创板股融资余额增幅超10%

统计显示,3月13日共有274只科创板个股融资余额环比增加。其中,22股融资余额增幅超过10%。融...

撤稿申请|

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有