乐火资讯百科网欢迎您!
搜索
当前所在位置: 首页>数码科技

深度解析ChatGPT的前世今生

发布时间:2023-02-17 来源:互联网 点击:(3068) 【 字体:

深度解析ChatGPT的前世今生,风靡全网的“最强AI”是如何做到这一切的?


在美剧《硅谷》中,曾有这样一幕有趣的剧情:程序员Gilfoyle用AI聊天软件“安东之子”捉弄他的好友Dinesh。该软件能模拟独属于Gilfoyle的闷骚幽默,让Dinesh误以为是在与Gilfoyle本人聊天。发现真相后,同为程序员的Dinesh也做了一个AI机器人用来报复Gilfoyle。结果,两个AI机器人热聊了起来,还把网络给聊崩了……


这样的场景已经走入现实。美国人工智能实验室OpenAI推出的语言模型系统GPT-3就曾构建出两个人工智能之间的对话,谈论如何成为人类,令看客大呼脊背发凉。


但OpenAI并未止步于此,而是将GPT-3进化为最近风靡全网的ChatGPT,后者不仅在大量网友的“疯狂”测试中表现出各种惊人的能力,如流畅对答、写代码、写剧本、辩证分析问题、纠错等等,甚至让记者编辑、程序员等从业者都感受到了威胁,更不乏其将取代谷歌搜索引擎之说。



推特上一位网友称ChatGPT将在两年内取代谷歌搜索功能

作为OpenAI的幕后老板,尚在主导推特变革的马斯克也公开表达了对ChatGPT的力挺,认为“我们离强大到危险的AI不远了。”


全球用户争相晒出自己极具创意的与ChatGPT交流的成果。一位网友要求ChatGPT用《坎特伯雷故事集》风格改写90年代热门歌曲《Baby Got Back》;有网友晒出ChatGPT参加美国高考SAT考试之后的得分:1020(总分1600分);亦有网友收获了ChatGPT用《老友记》几大主角口吻创作的剧本对白。


计算生物学教授卡尔·伯格斯特罗姆要求ChatGPT写一篇维基百科式他生平条目


ChatGPT上热门问题,如何闯入一个人的家

据OpenAI的CEO,硅谷著名投资人山姆·奥特曼(Sam Altman)透露,自11月30日至12月5日,ChatGPT的用户数量已突破100万。由于太过火爆,OpenAI不得不暂时关闭了用户的测试入驻窗口。


可以说,继AlphaGo击败李世石、AI绘画大火之后,ChatGPT开启了人工智能对人类社会产生深远影响的又一扇窗。不禁让人好奇,它究竟是怎么做到的?


为何是ChatGPT?

如果用一句话来说明ChatGPT是什么,可以将它理解为由AI驱动的聊天机器人。


外界往往认为语言学领域是人工智能派上用场的绝佳地带,而事实并非如此。截至目前,人工智能还没有找到征服语言领域的暗门,即使是谷歌、苹果这样的顶级科技公司,都面临着相关AI研究成果派不上用场的苦恼。


尚处在免费试用阶段的ChatGPT,关注度短短几天扩大到燎原之势,正是因为人们从中看到了人工智能和语言本体之间的真正接口。


那么,ChatGPT采取了什么方式达到了如此惊艳的效果呢?为何苹果的Siri至今无法生成一篇学术论文,亚马逊的Alexa无法吟出一首莎士比亚十四行诗呢?


过去十年间,谷歌、 Facebook、亚马逊、苹果和微软等硅谷科技巨头纷纷开启AI军备竞赛,先后成立专门的AI实验室,而最终业界公认的做纯AI研究的顶级实验室只有三家:背靠谷歌的DeepMind、背靠微软的OpenAI和背靠Facebook的FAIR。其中,被谷歌收购的DeepMind因拥有AlphaGo最为家喻户晓。


OpenAI在2015年底创立于旧金山,其联合创始人是马斯克以及硅谷知名孵化器Y Combinator的前掌门人奥特曼。不过,近年马斯克多以OpenAI的出资人角色出现,奥特曼才是这家公司的主导者和现任CEO。


不到五年时间,OpenAI就依靠GPT3跃升为全球AI领域顶级公司,与DeepMind并称AI圈的“双子星”。事实上,Meta的Fair实验室也一直在自然语言处理和对话型AI领域深耕,但其成果以发表论文为主,显得较为低调。今年6月,大举向元宇宙转型的Meta决定AI部门不再“集中化研究”,而是分布式下放,以便与实际业务结合,导致Fair的前途并不明朗。


OpenAI足以与AlphaGo一战的“武器”正是GPT3,这个2020年推出的巨型语言处理模型怪兽,可以完成诸如答题、写论文、文本摘要、语言翻译和生成代码等壮举,其诞生被视作人工智能竞赛的里程碑事件。


ChatGPT的前世今生

如果梳理OpenAI的GPT(Generative Pre-trained Transformer)系列技术路线,可以探寻出OpenAI的布局思路。


OpenAI最初提出的GPT1,采取的是生成式预训练Transform模型(一种采用自注意力机制的深度学习模型),此后整个GPT系列都贯彻了这一谷歌2017年提出,经由OpenAI改造的伟大创新范式。


简要来说,GPT1的方法包含预训练和微调两个阶段,预训练遵循的是语言模型的目标,微调过程遵循的是文本生成任务的目的。


2019年,OpenAI继续提出GPT-2,所适用的任务开始锁定在语言模型。GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模,GPT-2有了惊人的生成能力。不过,其在接受音乐和讲故事等专业领域任务时表现很不好。


2020年的GPT3将GPT模型提升到全新的高度,其训练参数是GPT-2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。



图源:Medium GPT系列模型的数据集训练规模

现在的ChatGPT则是由效果比GPT3更强大的GPT-3.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。


具体来说,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT3的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。


也因此,我们得以看到一个强大的ChatGPT:能理解人类不同指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。


当初,GPT-3只能预测给定单词串后面的文字,而ChatGPT可以用更接近人类的思考方式参与用户的查询过程,可以根据上下文和语境,提供恰当的回答,并模拟多种人类情绪和语气,还改掉了GPT-3的回答中看似通顺,但脱离实际的毛病。


展现出ChatGPT对问题分辨能力的一则回答

不仅如此,ChatGPT能参与到更海量的话题中来,更好的进行连续对话,有上佳的模仿能力,具备一定程度的逻辑和常识,在学术圈和科技圈人士看来时常显得博学而专业,而这些都是GPT-3所无法达到的。



ChatGPT自己回答与前代GPT3的能力区别

尽管目前ChatGPT还存在很多语言模型中常见的局限性和不准确问题,但毋庸置疑的是,其在语言识别、判断和交互层面存在巨大优势。同属于生成式AI范畴,ChatGPT在速度上已经比DeepMind研究人员提出的聊天机器人Sparrow(麻雀)模型领先一步。


有分析指出,OpenAI一直坚定不移的只用自然文本的上文来训练模型推动了GPT3到ChatGPT的成果,其顺应了人类思考的逻辑,最终由量变推动了质变。


商业模式的通路与障碍

不少人已经注意到,ChatGPT的能力已经涉及到AI模型之间的合作:一位网友要求ChatGPT写一个描述女孩的文案,然后用ChatGPT生成的文案画出了女孩的图像。


除了GPT系列之外,Open AI其实另有一条多模态领域研究支线闻名于世,即今年发布的明星产品——人工智能图像生成器DALL-E2。以DaLL E2为代表的Diffusion Model(扩散模型)几乎完成了此前爆火的AIGC(人工智能生成内容)领域的“大一统”,为AI绘画树立了全新标杆。


顶级技术能力之外,OpenAI能抢在谷歌和Meta之前重新书写AIGC版图,与其精细化的布局相关。


OpenAI月内的两笔收购都切中AIGC的增长点交叉地带,一桩投给了音频转录编辑器Descript ,一桩落子在AI笔记应用Mem。前者的处理场景刚好是文本、图片、音频以及视频,后者的技术底座是Transfomer模型,与ChatGPT同源。也就是说,OpenAI在打造自身处理下游任务的能力的同时,也在寻觅能承载下游任务的容器。


OpenAI的研究领域包括机器学习、自然语言处理和强化学习,其能在短短几年间迅速崛起,与创始人奥特曼对AI的创意性理解力密切相关:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。”


在YC,奥特曼以激进大胆的投资风格著称,因其秉承直击腹地的简洁思维,备受创业者青睐。YC曾有创始人称奥特曼为“创业公司的尤达大师”(《星球大战》中的绝地武士导师)。


这位CEO还有着实事求是的性情,当外界对GPT-3的能力发出铺天盖地的赞美时,他反而说“GPT-3被吹捧得太过了”。此后GPT-3在一系列问答中闹出笑话、表现不佳,也印证了他的说法。


但奥特曼的冷静挡不住幕后金主马斯克对ChatGPT抱持的极大热情,他十分关注ChatGPT的商业化前景,并在推特上向奥特曼提问,“ChatGPT每回答一个问题的成本是多少?”奥特曼则如实地答道:“每次对话的平均费用可能只有几美分,我们正试图找出更精确的测量方法并压缩费用。”


实际上,谷歌和Meta等巨头目前都尚未将生成式AI领域的研究能力转化为商业化部署,作为创业公司的OpenAI却做了不少尝试。


这家公司曾希望通过API(应用编程接口)方式来推动GPT-3的技术商业化,在2020年6月就开放了GPT-3的API接口,并曾与十余家公司展开过初步的商用测试,但由于GPT-3的功能并不完善未见成效。曾有传言称OpenAI为GPT3投入了至少1000万美元,为了摆脱入不敷出的窘境,才将GPT3作为一项付费服务来推广。


据虎嗅报道,Facebook改名为Meta之后,Meta AI实验室在5月宣布开放自己的语言大模型OPT(预训练变换模型),而OPT一直对标OpenAI的GPT3。与之类似,硅谷大厂内部都有对标GPT3的产品,只是因为大厂都是关起门来做私密研究,因而不为外界所知。


某种程度上,ChatGPT采取免费试用是OpenAI准备继续打磨这款产品的信号,用户给予的反馈会帮助该模型吸取足够的信息量,从而作出更恰当的反应。


OpenAI鼓励用户多与ChatGPT交流以帮助其改进模型

从GPT-3开始,ChatGPT及尚未出炉的GPT-4都面临训练成本过大的问题。有分析指出,是否收费是个两难决策:如果继续免费,OpenAI会无法承受,但收费又会极大减少用户基数。倘若训练成本能大幅下降,则两难自解。


此外,GPT-3历经两年商业化尝试,并未“如愿”取代记者编辑或码农的职业生涯,OpenAI也从中发现,将GPT系列作为辅助生产力工具对商业化更为合适。此前业内传言微软对这家公司的新一轮注资即将落地,届时其估值预计超过200亿美元,商业化也必将提上日程。到那时,OpenAI可以倚仗的大概率是ChatGPT,或者是通过了图灵测试的GPT4。


OpenAI CEO对产品未来的展望

一片叫好声中,也不乏有人泼来冷水——程序员首选问答社区Stack Overflow日前便宣布,禁止用户复制ChatGPT的答案来回答其它用户的问题,理由是ChatGPT的答案正确比率太低,日后待社区讨论后再作出解禁决定。


此举立刻引发了业界普遍关注,仿佛是对ChatGPT编程价值的彻底否定。与此同时,人工智能界的专家们也在激辩这些大型语言模型可能带来的负面效应,比如Meta的首席人工智能科学家Yann LeCun认为,虽然它们会有错误信息和不良输出,但并不会使文本的实际分享变得容易,而后者才是造成危害的真正原因。但也有人反驳称,这些语言系统的廉价文本生成能力必然会增加其后被分享的风险。


ChatGPT自己回答的关于Stack Overflow社区将其临时封禁的原因

而在OpenAI内部,一年半前曾遭遇核心员工集体出走,创办了一家名为Anthropic的新公司,致力于提高AI安全和可解释性,目前筹资已超过7亿美元,业内亦有声音认为,这支“AI叛逆者联盟”说不定会是另一个OpenAI。


猜你喜欢

第五届中国工业互联网大赛无锡赛站决赛举办

第五届中国工业互联网大赛无锡赛站决赛举办

以“数字赋能 智创未来”为主题,由工业和信息化部、国务院国有资产监督管理委员会、中华全国工商业联合会等单位主办的第五届中国工业互联···
2023-12-08
点击 152
复旦教授称中国退休年龄还是太早,建议推行延迟退休制度

复旦教授称中国退休年龄还是太早,建议推行延迟退休制···

在当今这个快速发展的时代,退休年龄问题成了一个热门话题。复旦大学的一位教授彭希哲,这位在学术界有着丰富成就的资深教授,近日就提出了···
2024-01-10
点击 81
2024年AI领域五大趋势

2024年AI领域五大趋势

人工智能(AI)的未来将是什么模样?美国《福布斯》双周刊网站在近日的报道中,列出了2024年AI领域发展的五大趋势,这些趋势有望赋···
2023-12-08
点击 107
中国汽车提前布局智能赛道

中国汽车提前布局智能赛道

  这两天,“奥迪向中国车企低头”的词条霸榜热搜。据外媒报道,为了应对日益激烈的电动汽车竞争,奥迪正在考虑直接从中国的电动车企业购···
2023-07-19
点击 175
荣耀赵明:Magic V2发布希望带动产业坚定折叠屏道路

荣耀赵明:Magic V2发布希望带动产业坚定折叠···

  近日,全新折叠旗舰荣耀Magic V2正式发布,荣耀Magic V2系列用重构思维,从消费者需求原点思考产品设计,打破传统折叠···
2023-07-19
点击 127
共促节能降碳 美团“青山计划”新增10家餐盒回收合作机构

共促节能降碳 美团“青山计划”新增10家餐盒回收合···

  今年节能宣传周期间,美团“青山计划”联合中华环境保护基金会宣布与10家回收机构达成合作,将在全国更多城市启动“盒聚变”塑料餐盒···
2023-07-19
点击 111
相关推荐

《汽车文化》试卷

《汽车文化》试卷
《汽车文化》试卷姓名:班级:一、填空题(每空 1 分,共 35 分)1、世界上的五大汽车城是 美国底特律 、 德国沃尔夫斯堡 、 德国斯图加特 、 日本丰田市 和 意大利都灵 。2、韩国最大的汽车公司是 现代汽车公司 。3、最早与中国合作生产汽车的厂家是 克莱斯勒汽车公司 ,该公司目前与 菲亚特汽车公司合并。4、被誉为“为世界...

九寨沟在哪里 九寨沟的位置

九寨沟在哪里 九寨沟的位置
九寨沟位于四川省阿坝州藏族羌族自治州,九寨沟是国内有名的旅游风景区,同时也是世界自然遗产,拥有鬼斧神工般的自然风光,让每个到这旅游的小伙伴都震撼无比,还被人们誉为不可多得的“童话世界”。九寨被称为“美丽的童话世界”真的是一点也没错,置身于九寨沟之中,整个人真的就像在童话世界里一般,这里的景色...

化妆技巧,入门级化妆技巧,学习彩妆

化妆技巧,入门级化妆技巧,学习彩妆
入门级化妆技巧,让几乎不懂得怎样化妆又不知从何学起的你快速入门,掌握基本技巧,小米名媛形象设计学院零起点教你快速入门派化妆技巧课程。让你在最短的时间,最快速地获得基本的化妆知识,让你想美,就美!快快拿来你的镜子和工具,对着步骤一步一步来吧,别担心,这个过程可是最简化的哦。一、试用化妆品及工具化妆品:...

南京风景名胜有哪些 南京风景名胜介绍

南京风景名胜有哪些 南京风景名胜介绍
南京风景名胜有南京钟山风景名胜区、中山陵、紫金山天文台、玄武湖、雨花台、夫子庙及秦淮风光带、栖霞山、总统府等。南京是中国四大古都之一,“六朝古都”、“十朝都会”之美誉,有着深厚的文化底蕴,同时也是全国很出名的重点风景旅游城市。 南京风景名胜有哪些夫子庙秦淮河风光带...

借你一双慧眼 从细节识别泡水车

借你一双慧眼 从细节识别泡水车
摘要: 夏季用车容易遇到大雨,很多车不幸的成为泡水车,大多数车主会将泡水的车子拖去修理厂处理,之后卖掉。泡水车犹如一颗定时炸弹,车子电路、车身部件腐蚀,行驶过程中会出现车辆熄火、高速刹车失灵等威胁生命安全的情况。泡水车有如此多的隐患,我们该如何识别它呢?下面我为大家介绍一些鉴别泡水车的技巧...

西藏旅游保姆级全攻略

西藏旅游保姆级全攻略
很多人心中都有一个西藏梦,对那纯洁而神圣的地方非常向往,只不过碍于她的高原气候,对西藏旅行有所顾虑,今天就送上一份完整的【西藏旅行全攻略】,希望无论是中国朋友,还是国际友人,都能有机会感受到西藏的美一、出行前准备01 出行必备证件:身份证、边防证(阿里地区需要)、驾照、西藏健康吗、核酸检测报告&nb...

燃油宝是不是智商税?能帮发动机清理积碳吗?听修理工给你讲清楚

燃油宝是不是智商税?能帮发动机清理积碳吗?听修理工给你讲清楚
燃油宝这个词可能大家并不陌生,但是它真的像广告中说的那样神奇吗?有些人甚至把它称为“智商税”,这是为什么呢?首先,我们来了解一下什么是燃油宝。简单来说,燃油宝是一种汽油添加剂,它的主要作用是清洁汽车发动机中的积碳。然而,这是否意味着使用了燃油宝就能让我们的爱车始终保持良好的状态呢?答案可能并非如此。...

天津旅游必去的地方 天津游玩必去的地方

天津旅游必去的地方 天津游玩必去的地方
天津游玩必去的地方有天津之眼、津湾广场、五大道、意大利风情街、古文化街、海河、瓷房子、西开教堂、天津水上公园、南开大学。天津之眼天津之眼是天津的地标,也是来天津旅游必打卡的景点之一。天津之眼是横跨在海河上的一座摩天轮,每到夜晚华灯初上时,天津之眼的彩灯柔美,无数游客会来到这里,拍摄全景或...

沙发翻新的妙招,沙发掉皮严重如何进行翻新修复?

沙发翻新的妙招,沙发掉皮严重如何进行翻新修复?
1、需要使用皮革专用清洁剂清洗将其沙发清洗干净,然后晾干或者烘干。2、使用阴离子皮革补伤膏修平裂纹与掉皮处,用封闭剂将修复处喷涂一遍,然后再烘干。3、烘干后再进行二次修补刮平,使用800#水砂纸将表面轻微打磨至光滑平整。然后根据沙发的颜色进行加固剂开始喷涂颜色,具有成膜功能上色剂在皮面形成一层色膜,再烘干。...

高通《混合AI是AI的未来》白皮书在2023年服贸会发布

高通《混合AI是AI的未来》白皮书在2023年服贸会发布
  新华网北京9月5日电(记者凌纪伟)9月5日,在2023年中国国际服务贸易交易会成果发布平台,高通公司发布人工智能(AI)白皮书——《混合AI是AI的未来》。  据了解,高通深耕AI研发超15年,致力于通过基础研究和平台式创新,助力AI变革多个行业,开启全新体验。《混合AI是AI的未来》白皮书,梳理了高通在AI领域技术发展...
返回顶部