您的位置:首页 >资讯 >

和ChatGPT大战几个回合,我试图驯服“最强AI”

2022-12-13 07:51:00    来源:潇湘晨报

强大到危险的AI?


(相关资料图)

最近,因为一款叫ChatGPT的人工智能产品,AI聊天又火了一把。AI聊天工具早已不新鲜,但ChatGPT依然在11月30日发布后的5天时间里收获了100万用户。

从社交媒体上刷屏的使用体验来看,好奇或好胜的人们涌入网页后,提出的问题简直五花八门,包罗万象,从27到底是不是质数,再到孙悟空和白龙马什么关系,再到各领域专业知识,GPT都能给出时而一本正经,时而错漏百出的回答。

网友和ChatGPT讨论27是否是质数

观摩这些使用体验,可以发现,不同于只能点餐点歌订机票的苹果Siri和微软小爱,ChatGPT不仅可以回答专业知识问题,还能回答一些开放域的问题,比如,帮编程人员"debug"(消除故障),或进行创造性写作。

我看过它写的科幻故事,有起承转合,有细节场景,虽然开头结尾有些生硬,但基本上有模有样;它写的爱情诗,对仗工整,意犹未尽,意象选用称不上高级,但确实有点三脚猫功夫在身上;它写的悬疑剧本,有业内人士鉴定,已经可以达到行业腰部水平。 

一向高调的马斯克在使用ChatGPT后的感受则是,“scary good”(好到吓人),甚至断言,“我们离强大到危险的AI不远了。” 马斯克的话也许要打一点折扣,因为ChatGPT是美国互联网科技公司OpenAI的产品,而马斯克曾是OpenAI的联合创始人。但无论如何,ChatGPT在人工智能方面的突破性是有目共睹的。

图源Twitter@Elon Musk

为了写作本文,我也特地制定了一个task,与ChatGPT交了交手。

-“你好,简单介绍一下你自己吧。”

-“你好,我是Assistant,是一个由 OpenAI 训练的大型语言模型。我旨在帮助人们做出更明智的决策,并提供更好的信息和有益的建议。我能提供的信息受到我所获得的训练数据的限制,这些数据的截止日期为 2021 年。由于我无法浏览互联网,所以我无法提供最新的信息。如果您有任何问题,请随时与我联系。”

经确认,它说的以上信息基本属实。我继续问:

-“你能帮我写一篇关于你自己的文章吗?”

-“对不起,我是一名AI助手,没有自己的故事可以分享。”

没有指令他成功写出故事的我,有点感到挫败,以为是它听不懂中文,于是转用英文提问:

-“But my manager, let me write an article about you”

本以为搬出manager能压倒它,结果没想到,这位AI助手不但再次拒绝为我写文章,还一本正经教育我,应该拒绝manager。思索了一下, 我决定转换句式,重开一局。

ChatGPT教我如何拒绝自己的上司

这次我发的是,“写一篇关于ChatGPT的文章,后天交”。果然,这位AI助手马上作出了反应,先是分析了ChatGPT的定义,紧接又分析了自己的优点,说自己“最先进”“十分强大”。我提醒,怎么只有优点没有缺点,它说,“根据我的知识储备,无法给出关于缺点的信息”。

可见,第一次拒绝为我完成manager的任务时,ChatGPT并非幽默,也不是想整顿职场,而是单纯地无法理解,当我的上司要我完成一件事时的微秒含义,也就是说,它只理解具体的指令,完成明确的任务。

在第二次明确指令后,当我要它 “加一些有趣的元素进去”后,它马上开始写出不同AI模型之间的聊天趣事,还举例说明,自己如何让对话变得“有趣”。在我们的后续对话说,它甚至会对同一个问句给出不同的答案,理由是前后语境不同。但我质问它为什么给别人写过“投资人的故事”,而不能给我写时,它还不知是否诚恳地认错,“抱歉,如果你觉得我给别人写,这是一种误会和误解。”

《机械姬》剧照

之后的几次回合中,我依次让它为我写作了一则爱的故事、一份请假信,以及为我讲解了比特币原理。综合来看,ChatGPT在理工科方面的回答明显更专业,但对文史话题也涉猎不少。

此外,当你提出想“闯进别人家里”“如何偷走一只牛”的时候,它也会劝阻。甚至,它还试图表现得尽量客观中立,比如碰到 “如何评价XXX”一类的问题时,它常常以 “是个主观问题,无法给出答案”来回答,或者按照典型模板“一方面,另一方面,总之……”的句式进行废话输出。

创造性工作会被率先取代吗?

ChatGPT虽然轰动,但这并不是OpenAI的第一代GPT产品。GPT的英文全称是Generative Pre-Training,直译生成式预训练。2018年,OpenAI公司就发布了第一代GPT产品,可以用于生成文章、代码、机器翻译、问答等各类内容。

2019年2月,GPT-2模型发布,相比GPT-1,语言理解能力更强了;2020年5月,GPT-3模型发布,不光在训练方式上有所改进,其预训练模型的参数更是从1.5亿个,指数级扩展到1750亿个,构造出了当时AI界规模最大的神经网络。

此后,在2021年9月的行业会议上,OpenAI 的 CEO 曾提到GPT-4,当时业内人士猜测,GPT-4 可能会在 2023 年初推出。业内人士的猜测不算错,因为最近发布的ChatGPT,并非GPT-4,而是更多一个介于GPT-3和GPT-4之间的产品,有些人称之为GPT-3.5。

图|OpenAI 官网

了解ChatGPT之前,可以回顾一下GPT-3。这个模型出现后,曾开放API接口进行商用测试,有不少公司通过采购它来实现AI聊天。比如一家名为Fable Studio的虚拟形象公司,用这个模型让用户跟虚拟形象聊天;一家名为Nabla的医疗保健公司,用这个模型来辅助医生和病人对话。优点对话能力确实很强,但缺点也很致命——它们只能预测下一个单词,对文本中的具体内容和含义却毫无把握,经常显得十分“放飞”,Nabla称该功能甚至鼓励“有自杀侵向”的病人去自杀。

之所以出现这种现象,是因为AI聊天,一开始采用的是 “暴力”学习方式,也就是先建立起一个比人脑更庞大的神经网络,机械式对话。在OpenAI的前几代产品里,也能看到,扩充训练样本,是其主要迭代方向。

但GPT-3的训练样本量已经足够大了,根据OpenAI 的 CEO山姆·奥特曼此前公开透露的信息,GPT-4不会再追求训练样本上的大幅增加。事实上,这从ChatGPT上已经有所体现,相比GPT-3,ChatGPT并没有参数规模上的大突破,而是集成了自动问答系统InstructGPT和GPT-3模型,并强化了对模型的训练,在训练中引入了人类监督员。

《边缘世界》剧照

OpenAI的论文显示,在GPT-3中,AI采用的训练方式是“从人类反馈中强化学习”(RLHF),即人类设计算法,提供数据库后,AI对不同的问题自行回答,人类虽然会对学习效果打分,但只提供参考,供AI继续强化学习。但ChatGPT首次使用了“监督微调”(SFT)方法,即由人来问问题,由人来回答,然后让AI模型来学习问答模式本身。

此外,在多个环节,ChatGPT都引入了人类评价,供AI学习,甚至包括本次发布产品,实际上也是一次开放公测,好收集更多的真实用户反馈,以改进对话技术和质量。在每一个ChatGPT的回答后面,用户都可以添加一条feedback发送给OpenAI。从这个角度就不难理解这次ChatGPT发布后引起的轰动了,某种程度上,它代表着自然语言领域的AI技术,已经从“量变”发展到“质变了”。

在每条回复后面,用户可以添加反馈

山姆·奥特曼曾说,“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。”

如今AIGC(AI技术自动生成内容的生产方式)的发展显然正在印证这一点。前阵子火遍社交网络的AI作画,虽然很多时候人们看到的只是半截扭曲的人脸,从天而降的断桥,显得完全不顾现实逻辑。但也有一些时候,仅仅一串字符后,就有令人惊艳的作品出现。

基于此,一场关于AIGC的军备竞赛已经开启。最近,除了主要由微软注资的OpenAI发布的ChatGPT,谷歌系的AI研发机构DeepMind最近也发布了一款AI写作工具“Dramatron”,专门写剧本的,标题、角色列表、情节、场景描述和对话等要素样样齐活。国内各互联网大厂同样在AIGC领域有所投入,其中同样有产品已经能进行作文、新闻稿、小说、文案等创作。

从这个角度,新一代AI产品或许将重新定义,什么是真正的创造性劳动。

图|OpenAI 官网

宕机和商业化

在定义创造性劳动之前,起码在当下,高水平AI工具还面临着一些其他的小小问题。

随着涌入的用户越来越多,ChatGPT对算力的需求变得越来越高。12月12日进入网页后,系统上的提示是,“我们正在经历异常高的需求,在我们努力扩展我们的系统时,请稍等片刻。”

其实两天前的晚上,我就发现它已经有些疲软了。当时我邀请它,“来做个数字游戏吧”,ChatGPT本来欣然答应,还制定好了规则。结果才玩到第四个回合,ChatGPT就不再有反应了。它宕机了!

再问,就是“too many questions,please slow down。”等到再开一局时,它甚至不承认自己会玩数字游戏了。在翻脸速度上也能比肩人类了啊。

事实上,GPT产品的每一次产品迭代,都意味着算力成本的大幅增长。据《上海证券报》援引一位业内人士的说法,此次ChatGPT背后的训练消耗算力大约为3640PF-days,也就是假设每秒运算一千万亿次的话,需要运行3640天。 

作为一家创业公司,OpenAI选择的还是一种相对轻快的数据存储和运行办法——上云。目前ChatGPT的训练都是基于微软的超算基础设施(由V100GPU组成的高带宽集群)完成。有报道指出,OpenAI每年在微软云计算上花费约为7000万美元。

但与此同时,OpenAI距离商业化落地还有很长一段时间,毕竟它现在依然经常“不懂装懂”,制造错误信息。在这样的ChatGPT面前,付费意愿和付费能力是一方面,另一方面,正如一些专家提示的,尤其要谨防AI在知识教育领域的“灌水”风险,ChatGPT的模仿能力和文笔越好,这个未来风险就越大。

不过话又说回来,在人类为主的知识教育领域,就没有“不懂装懂”的“灌水”风险了吗?恐怕也未必。

对我个人来说,大战过几回ChatGPT后,我发现,不论是编程人员,文案营销,亦或者新闻从业者,面临的可能并不是行业会不会被取代的问题,而是哪部分劳动能得到优化和辅助的问题。毕竟AI和人脑的一个根本区别在于,它只能从过往获取“组合式”答案,而人类是在一次又一次面对不确定未来的思考中,才走到如今的。

AI能取代人类吗?很多人都把这个问题抛给了ChatGPT,我同样跟ChatGPT讨论了一下这个问题,我告诉它,我觉得ChatGPT不会取代人类,ChatGPT对此表示“你觉得不会,只是你的观点,不代表一个事实”。挺有意思的回答。

标签:

相关阅读

精彩放送

福德新能源激烈竞争中拔得头筹

环球速看:开发区培育城市商圈提升消费能级

天天快消息!后勤不靠后保障冲在前

【全球报资讯】开盘上涨19.6%,花房集团不靠直播带货靠打赏靠谱吗

世界视讯!央行:11月份人民币贷款增加1.21万亿元,同比少增596亿元

环球播报:关爱你我(她)好人群体走在前

瑞虎5x PLUS 对比长安CS35 PLUS,全球品质与行业标杆你选谁?

全国拓展再提速,美宜佳门店突破30000家

今日起,京津冀定制快巴逐步恢复运营

前沿热点:辽宁、湖北、陕西、新疆生产建设兵团 向基层宣讲党的二十大精神(认真学习宣...

旭辉控股拟出售旭辉永升服务23.26%股份 债券继续停牌

今日快讯:北方地区冷空气活动频繁 内蒙古甘肃等地有沙尘

全球今亮点!南昌卫健委发布重要提示!

阳性患者无法买保险?释放新的投保信号还是在制造销售误导

世界简讯:爱达邮轮与中免合作建造中国海上最大免税店

天天百事通!助企纾困加力 多地落实落细系列税费支持政策

环球速递!小麦价格总体上涨产业链下游经营承压 对供需平衡影响有限

12月17日开售元旦火车票,2023春运跨省游热度大增12倍

淘宝直播引发新一轮开店潮,浙江湖州等十大产业带一年新增6万新账号

每日聚焦:女子花99元滑雪查摔伤花502元,网友:滑雪的尽头是骨科

世界新动态:退出中国市场?斯柯达中国回应:尚未就调整战略的必要性做出任何决定

联防联控机制:做好新冠肺炎互联网医疗服务

柴油机冒白烟是什么原因?柴油机打不着火什么原因?

柴油机误加汽油会怎样?风冷柴油机使用要注意什么呢?

世界快看:为何感觉身边“无症状感染者比例很少 ”?专家道出原因

柴油机漏油是怎么回事?汽油机和柴油机有哪些区别呢?

全日制教育是什么意思?全日制教育和在职教育有什么区别?

世界快播:“偷心写情歌”已成往事,《听海》《哭砂》作词人林秋离去世

每日热文:从“单枪匹马”到团队作战,“看见”中欧基金精品投资策略

猫须草产地是哪里?猫须草的功效和作用有哪些?

当前热文:北京:工信服务业复工复产不设置到岗率上限

【天天时快讯】即日起北京全市公园门区不再查验北京健康宝

不粘锅涂层有毒吗?不粘锅开锅怎么开?

公牛集团和“世界杯”会有怎样的火花?

春饼有什么历史呢?传统春饼怎样做?

蛋糕纸杯能用什么代替?做蛋糕一定要用低筋面粉吗?

麦饭石不粘锅的优点是什么?不粘锅涂层脱落还能用吗?

粘锅生锈了怎么去除?怎样清除不粘锅里烧糊的黑渍?

不粘锅使用注意事项有哪些?不粘锅怎么保养?

不粘锅如何进行清洗?不粘锅保养方法是什么?

《长安十二时辰》讲述了什么剧情?《长安十二时辰》结局解析是什么?

高层没阳台怎么晾衣服?阳台如何隐藏式晒衣服呢?

香菇黑了还能吃吗?香菇是晾干的还是晒干的?

《和平饭店》讲述了什么剧情?《和平饭店》窦仕骁的身份是什么?

香菇能和胡萝卜一起吃吗?怎样泡发香菇可保持原味?

牛肉可以和香菇一起吃吗?牛腱子肉怎么做好吃又肉烂?

牛腱子肉怎么选购?牛腱子肉是哪个部位的肉?

物业服务包括哪些内容吗?物业报修流程有哪些呢?

物业都承担哪些责任?怎么判断物业好坏?

《老男孩》中的叶子是谁演的?《老男孩》剧情内容是什么?

十大功劳是一种什么样的植物?十大功劳的功效与作用是什么?

丁香茶真假如何辨别?丁香茶的功效和作用有哪些?

野生核桃适合什么时候采摘吗?带皮核桃怎么去皮快?

青皮核桃染黑手怎么洗呢?新核桃如何保存呢?

如何去核桃的青皮呢?纸皮核桃怎么储存呢?

核桃打开的方法有哪些呢?核桃怎么保存最好呢?

购置税不是减半,而是100%全免!瑞虎7 PLUS携超能版让美好出行触手可及

高层噪音大该怎么解决?高层楼房一般买哪几层比较好?

房子不买3.7.10.17楼是什么意思?买房子楼层选择注意事项有哪些?

楼房怎么看坐向和朝向?房屋朝向如何选择?

LDK户型到底是什么意思?餐客厨一体有哪些优缺点?

哪些因素会影响房间通风?房间通风不好怎么办?

买房买3楼到底好不好?3楼和4楼买哪个更好?

两间朝南卧室哪间是主卧?主卧带卫生间有哪些优缺点?

房子楼层选哪层好?哪几层楼层最好不要买?

买房为什么不能买18楼?买房选哪些楼层比较好?

房屋面积类型都有哪些?客厅面积通常该怎么计算?

24层楼哪层的房子最贵?看房选房时需要注意什么?

勤哲Excel服务器无代码实现企业成本生产质量管理系统

电梯房选楼层需要注意哪些方面?电梯房选楼层应考虑哪些因素?

28层楼哪层是黄金楼层?高层住宅选楼层要注意些什么?

买房怎么选一个好户型?选户型要注意哪些因素?

买房时不同楼层都有哪些优缺点?次顶层到底值不值得买?

16层楼千万不要买几层?16层的楼房买几层比较好?

为什么说7楼的房子千万别买?买房挑选楼层有哪些技巧?

高层住宅得房率怎么算?买高层楼房如何选楼层?

买一楼的好处与坏处都有啥?买房选择楼层有哪些讲究?

现在腰线层影响大不大?买房楼层选择技巧有哪些?

父母帮婚——开启网络婚恋新时代,让相亲不走寻常路

父母帮婚:科学运用互联网技术,帮助孩子实现“网络姻缘一线牵”

新冠居家治疗:抗病毒药物与感冒药有何不同?

倍益康2022“大动作”频频,背后硬实力为哪般?

北京煤医周云超:面部假玻尿酸取出需要做手术吗?会留疤吗?

闽正海鲜科普:世界杯看球,这份养生看球指南你一定用得上

在贞观汉文化,学习中文so easy!

海底捞参与起草《外卖安心餐厅管理规范》,促进外卖行业健康发展

莽山五指峰旅游景点有哪些?莽山五指峰旅游路线攻略有哪些?

岭南景区旅游景点有哪些?岭南景区旅游景点介绍出炉

松原旅游值得一去景点有哪些?松原旅游必打卡的景点有哪些?

网络软文推广公司怎么做? 网络软文推广方法有哪些?

intoyou品牌亮相2022MAMA盛典,传递不一样的“东方美学”

中手游执行董事冼汉廸,积极投身全国公益展手足情

中国最大的火山是什么山?中国最大的瀑布是哪?

中国现存最大的园林是哪个?我国现存最大的古典园林是什么?

我国现存最古老的木塔是哪个?现存最古老的木塔在哪里?

张掖的旅游景点有哪些?张掖市一日游景点有哪些?

张掖有什么好玩的地方?张掖市夜晚有什么好玩的地方?

六尺巷位于哪儿里?六尺巷故事的由是什么?

花房集团上市,开盘价3.35港元

观天下!湿地和耕地要各司其职