您的位置:首页 >快讯 >

热点!GPT-4发布!在美国律考中击败九成人类 OpenAI警告称,GPT-4还不完美,在许多情况下它的能力不如人类

2023-03-16 08:16:51    来源:深圳商报

读特客户端·深圳新闻网2023年3月16日讯(深圳商报记者 涂竞玉)“我继承了GPT-3的基本架构和能力,但在训练数据、模型优化、用户体验等方面有所不同。”GPT-4昨日在线回答深圳商报记者提问时表示。


(资料图片仅供参考)

在ChatGPT引爆科技领域之后,记者获悉,北京时间3月15日凌晨,创造出ChatGPT的OpenAI公司正式对外发布了GPT-4。据悉,GPT-4是新一代多模态大模型,支持图像和文本输入以及正确的文本输出,拥有强大的识图能力,文字输入限制提升至2.5万字,支持多个语言,回答准确性显著提高。

听听GPT-4自己怎么说

深圳商报记者通过注册用户向GPT-4提问道:“在《三体》中,云天明讲的三个童话故事是什么?”其回答:“《三体》是刘慈欣创作的一部科幻小说,全书共分为三部。在第一部《三体》中,云天明讲了三个童话故事,分别是《红色公主》《你是谁》和《送你一朵小红花》。这三个故事都寓意着人类在探索宇宙与外星文明时,所面临的挑战和困惑。”

同一个问题,GPT-3的回答略有不同:“在刘慈欣所著的科幻小说《三体》中,云天明在面对外星文明时,通过三个童话故事向外星人表达了他对人类的看法和态度。这三个童话故事分别是:《史迪仔》《三体》和《蝴蝶效应》。”

对于“如何看待OpenAl近期的快速迭代”这个问题,GPT-4先是表示:“OpenAl是一个致力于开发和研究人工智能的非营利组织,它近期发布了GPT-4,这是一种基于大规模语言模型的生成式AI工具,可以用于文本、图像、音频和视频的生成。OpenAl近期的快速迭代可能反映了它对人工智能发展潜力和影响力的信心和追求,也可能表明了它在人工智能领域的竞争优势和创新能力。”

紧接着,它分析:“OpenAI近期的快速迭代可能带来了一些积极的效果,比如提高了人工智能技术的性能、可用性和多样性,促进了人工智能技术在各个领域和场景的应用和推广,增加了人工智能技术对社会、经济和文化的贡献等。OpenAI近期的快速迭代也可能带来了一些挑战或风险,比如增加了人工智能技术对计算资源、数据资源和环境资源的消耗和压力,引发了人工智能技术在伦理、安全和法律方面的争议和难题,威胁了人类在某些领域或任务上的优势或地位等。”

各种考试能力大幅提升

“GPT-4是世界第一款高体验,强能力的先进AI系统,我们希望很快把它推向所有人。”OpenAI工程师在官网介绍视频里说。

根据官方实验表明,GPT-4在各种专业测试和学术基准上的表现与人类水平相当。在美国BAR律师执照统考模拟中,GPT-4得分约为前10%——击败了90%的人类,而ChatGPT背后的GPT-3.5得分约为倒数10%;在生物奥林匹克竞赛中,GPT-3.5能达到后31%水平分位,GPT-4可达到前1%水平分位;在研究生入学考试(GRE)、SAT数学考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。

在与其他英文机器学习模型的技术能力方面,GPT-4也表现出了过人之处。OpenAI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中,GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。

此外,GPT-4还支持做编程、玩梗图、回答关键问题、理解图片、看懂法语题目并解答等其他更多扩展技术能力。研究人员发现,GPT-4能随着时间不断处理令人兴奋的新任务。不过OpenAI表示,图像输入是研究预览,目前不公开。

在该模型的落地和应用方面,OpenAI也有了最新进展。新模型将提供给ChatGPT的付费用户,也将允许程序员将AI集成到他们的应用程序中。OpenAI将对750字左右的指令信息收费3美分,对750字左右的响应信息收费6美分。

微软已经投资了数十亿美元

公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。

OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

但OpenAI并未公布这个模型的参数量有多少。OpenAI表示,它使用的是微软(MSFT.US)Azure训练模型,微软已经向这家初创公司投资了数十亿美元。

目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。

为了不断提高GPT-4性能,在过去的两年里,OpenAI重建了整个深度学习堆栈,并为其工作负载从头开始设计了一台超级计算机。一年前OpenAI在训练GPT-3.5时,第一次尝试运行了该超算系统,之后他们又陆续发现并修复了一些错误,改进了其理论基础。这些改进的结果是GPT-4的训练运行获得了前所未有的稳定。

OpenAI联合创始人兼总裁格雷格·布罗克曼表示,OpenAI预计未来将由投资10亿美元超级计算机的公司开发尖端模型,一些最先进的工具将带有风险。OpenAI希望对他们工作的某些部分保密,以给初创公司一些喘息的空间。

OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类,“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

GPT-4自话 比GPT-3强多少

当记者提问:“你和GPT-3有什么不同?”GPT-4回答:我是基于GPT-3模型的一个实例,但我已经进行了进一步的改进和优化。GPT-3(第三代生成式预训练模型)是OpenAl开发的一个大型语言模型,它在很多自然语言处理任务中表现出色。我继承了GPT-3的基本架构和能力,但有以下几个方面的不同:

首先是训练数据,我的训练数据包含了更多的最新信息,截止到2021年9月。这意味着我可以回答更多与近期相关的问题,但请注意我的知识仍有局限,尤其是关于2021年9月之后发生的事件。

其次是模型优化,经过持续的迭代和优化,我的性能可能比原始的GPT-3更好。这包括更好的理解能力、回答问题的准确性和生成更连贯的文本。

再次是用户体验,为了提供更好的用户体验,我可以根据用户需求进行定制和调整。这包括根据具体任务或场景调整我的回答风格、内容和格式。

它表示:“尽管我有这些改进和优化,但我仍然继承了GPT-3的一些局限性,例如在回答某些问题时可能出现准确性、一致性和可靠性方面的问题。我的目标是协助您解决问题和提供信息,但请谨慎对待我的回答,特别是在涉及重要决策时。”

标签:

相关阅读

精彩放送

1-2月全国CPI同比上涨1.5%,PPI同比下降1.1%

近七成央企集团总部已设立首席合规官

今日要闻!农发行今年累放粮棉油贷款超千亿元支持春耕备耕

热门:中消协:超八成受访者对国内消费环境总体满意

草原书屋让阅读成为乡村生活新风尚

前2月房企业到位资金同比下降15.2%

李沧仁德诊所:做有温度的医疗服务 为居民健康保驾护航

天天视点!我国实现多个领域新突破 推动高质量发展

叮!您有一份消费提示,请查收

播报:全国法院电子送达文书均已支持在线核验

当前关注:全国多地组织多场招聘会 多途径促进大学生求职就业

利安人寿再次成功发行 10 亿元资本补充债

每日快播:教育部明确师生校内不强制佩戴口罩,专家:建议其他场合也逐步放开

国际最新研究:臭氧污染可能影响果蝇吸引伴侣或认知异性

最资讯丨旁观了两眼就敢做手术?女子自学医美,手术致人8级伤残

当前热议!玩溜早餐荟| 3月以来顶流“花花”带动人均消费1075元;中国中免拟以12.28亿元...

天天百事通!GPT-4来了:支持图生文,多项测试“超越”90%的人类

环球播报:必须要改的5个伤肾坏习惯!一不小心“肾结石”拖成“尿毒症” !

天天微头条丨肯尼亚移动支付发展迅速

每日资讯:3月15日起,中国出境团队游目的地增至60国

【世界新视野】机票预订量大增超23倍!酒店预订量大增超22倍!什么地方这么火?

国产榴莲要来啦!网友有个期待

环球微资讯!网信中国发布“地图导航类”App个人信息收集情况测试报告

世界信息:花粉高峰期来了!出现这些症状,高度警惕!

出国游成本涨了?以前带一万泰铢还有结余现在几乎没剩下

短讯!沙尘暴蓝色预警:新疆甘肃河北等地有扬沙或浮尘天气

当前简讯:西安市雁塔区邮政编码_西安市雁塔区邮编

激振新消费

洋水果国产“平替”乐坏了谁

短讯!WPS“藏”起来的增值服务

天天通讯!滨海能源出售重要子公司被疑“财务洗澡”

天天新动态:9家公募上报三大央企主题ETF 易方达广发南方汇添富招商等饮头啖汤

环球消息!澳门4月举行文化传播月 以互动体验发掘城市多元美学

世界头条:瑞幸咖啡因饮品去冰后量少引争议

全球热头条丨调查|增值服务“藏”在会员权益之外,WPS把用户蒙在鼓里?

胡甲履新长盛基金董事长,同时代任公司总经理

每日头条!浙商证券:向特定对象发行股票事项获浙江国资委同意

不法贷款中介要凉?整顿违规转贷乱象 已有银行在行动

“根植美丽乡村 ‘农’情洒满人间”3·15金融知识宣讲进乡村

焦点资讯:部省联动启动长江流域再生稻产能提升项目

轴对称图形大全及答案_轴对称图形大全

天天快看:长盈精密:拟定增募资不超22亿元

美国2月CPI同比上涨6.0%

硅谷银行“闪崩”72小时:有储户落袋为安,但多米诺骨牌效应仍在蔓延

新资讯:中国中免拟以12.28亿元参与中出服增资

今日精选:因不具备条件经营健康保险业务等十项违规,复星保德信人寿合计被罚313万元

千味央厨非独立董事叶威辞职

打造民族农副品牌,中农七朵以产业兴旺助力乡村振兴

全球热点评!跨境电商直播催生新需求,小语种人才的春天来了吗?

吉鲁焦点大战!3个秘密武器或助王晗复仇,赛前2大名帅采访表态

【热闻】机构:3月以来与熊猫相关酒店预订量同比增长3.2倍

焦点消息!首家!全面注册制下沪市主板IPO企业柏诚股份提交注册申请

世界青光眼周:关注青光眼 专家提示早诊早治

世界即时:外国人来华政策,明起调整

享梦游荣获2022年“光&影”国家旅业时尚盛典:文旅影响力品牌奖

环球观天下!16000株樱花竞相绽放 上海著名赏樱地迎来大客流

菜鸟与无限极深化合作,共同推动企业数字化转型

资讯推荐:中国音数协征求意见稿:游戏进行分发前应取得相应的资质证明文件

天天播报:深交所:将于3月18日组织全面注册制发行业务通关测试

16000株樱花竞相绽放 上海著名赏樱地迎来大客流

打造育苗工作“升级版”,奏响春耕备耕“进行曲”

环球滚动:上交所:将于3月18日开展全面注册制发行业务通关测试及交易业务全网测试

环球快播:qq头像和名字_好看的qq名字

购买洋房要注意什么?40年产权和70年产权有什么区别?

什么朝向的房子好?八层洋房有腰线层吗?

买房要怎么选择楼层?高层楼房的抗震标准是什么?

楼层选择多少层好?聪明人为啥买房都买九楼?

买房子选购楼层原则是什么?高层住宅二楼下水道会反水吗?

反水有哪些解决办法?有腰线的楼层有什么不好?

次顶层有腰线影响大吗?在腰线层影响大不?

次顶楼房子的坏处有哪些?次顶楼房子的坏处有哪些?

16层的楼房买几层合适?16层楼腰线层一般在几层?

客厅面积通常该怎么计算?买房时不同楼层都有哪些优缺点?

江苏省徐州刘集镇人大代表为乡村高质量发展贡献智慧

次顶层到底值不值得买?6层楼千万不要买几层?

买高层楼房如何选楼层?房屋面积类型都有哪些?

高层住宅得房率怎么算?买高层楼房要注意什么?

哪几层楼层最好不要买?国家规定住宅楼最高可以到几层?

即日起全国法院电子送达文书均可支持司法区块链在线核验

主卧带卫生间有哪些优缺点?房子楼层选哪层好?

买房选择楼层有哪些讲究?两间朝南卧室哪间是主卧?

三室一厅的房子通常多少平合适?买一楼的好处与坏处都有啥?

当前快播:老人流感愈后恢复期难熬:愈后要合理饮食 不去人群密集场所

为什么说三室的房子比较好?买房选择楼层有哪些讲究?

哪些因素会影响房间通风?怎么选择楼层更科学?

房间通风不好怎么办?买房买3楼到底好不好?

环球今热点:香港国际影视展实体回归 700多家全球展商参展

楼房怎么看坐向和朝向?LDK户型到底是什么意思?

房屋朝向如何选择?餐客厨一体有哪些优缺点?

买房楼层选择技巧有哪些?小腰线层上一层真的不能买吗?

挑选高层住宅要注意哪些问题?户型朝向的判断方法有哪些?

天天即时:山东济宁兖州区:农技农机送地头 夏粮丰收有甜头

每日头条!悲剧!美国得州3岁女孩家中意外开枪打死4岁姐姐

睡眠无小事,芯选好睡眠,舒达床垫芯选屋新品3.15震撼上市

杰克丹尼春日露营派对 精彩每一刻

环球通讯!中国美协2022年度会员正式开始申报

乡村振兴“城市之窗”数字展厅正式启动

世界头条:一封跨越2600公里的感谢信

香港5人承认暴动罪 分别被判囚3年半至4年

十大国产羊奶粉排行榜10强的宜品小羊,新国标基础之上营养再创新高度