大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸

sxkk20082年前智能百科226
据广大网友们的反馈,似乎人们普遍认为GPT-4变得有些愚笨了。距离OpenAI最初发布GPT-4已经过去了将近四个月。然而,随着时间的推移,最近网络上开始出现了一些质疑声,认为世界上最强大的GPT-4似乎变得不那么强大了。

据广大网友们的反馈,似乎人们普遍认为GPT-4变得有些愚笨了。距离OpenAI最初发布GPT-4已经过去了将近四个月。然而,随着时间的推移,最近网络上开始出现了一些质疑声,认为世界上最强大的GPT-4似乎变得不那么强大了。

一些业内人士认为,这可能与OpenAI对该系统进行重大重新设计有关。实际上,在最近几周,我们或多或少地在网络上看到了一些GPT-4用户对其性能下降的怨声。有用户称这个模型相比先前的推理能力和其他输出变得"懒散"和"愚笨"。

而且,不仅如此,在Twitter和OpenAI的在线开发者论坛中,用户们也表达了对这一问题的不满。例如,他们认为GPT-4的逻辑能力减弱了,回答错误增多了,对提供的信息追踪能力丧失了…

对于GPT-4究竟发生了什么,让我们来看看网友们的反馈:

一位使用GPT-4进行网站开发的网友写道:"现在的GPT-4真是让人失望。感觉就像你开了一个月的法拉利,突然它变成了一辆破旧的皮卡车。按照这种趋势,我不确定我是否愿意为此付费了。"

还有用户表示:"我使用ChatGPT有一段时间了,自从GPT-4发布以来,我一直是GPT Plus的付费用户。最近几天,GPT-4似乎在之前擅长的事情上遇到了困难。以前,它似乎能很好地理解我的请求。现在,它对信息的追踪能力下降了,给出的信息有误,并且经常误解我的问题。"


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


Roblox的产品负责人Peter Yang在Twitter上声称,GPT-4的输出速度变快了,但质量却降低了。例如,在让它输出更清晰、简洁和有创意的文本任务时,GPT-4给出的结果质量下降了。

"GPT-4开始反复输出代码和其他信息,就像它大脑死亡一样。如果你没有真正经历过它之前的能力,你可能不会注意到。但对于那些之前充分使用过GPT-4的人来说,他们明显感觉到它变得更愚蠢了。"另一位用户抱怨道。


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


"我对GPT-4的回答质量也有同样的问题,有人知道如何解决或纠正这种情况吗?"

"我确实注意到了这一点。在一天中的某些时候,它似乎只记得最近的提示。但在一整天的使用中,GPT-4的性能似乎有波动,在不同的时间尝试时,感觉它的表现也不一样。"


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸

通过网友的反馈,可以看出大家都有感受到GPT-4变得愚笨的事实。

自OpenAI在去年年底发布ChatGPT,这一举动震惊了整个人工智能界。最初,ChatGPT是建立在GPT-3和GPT-3.5基础之上的。而在三月中旬,GPT-4发布后,迅速成为开发者和其他科技行业人士的首选模型。

GPT-4被认为是广泛可用的最强大的人工智能模型,具备多模态功能,可以理解图像和文本的输入。根据创业公司Lamini首席执行官Sharon Zhou的说法,它虽然速度较慢,但非常精准。

然而,几周前,情况开始发生变化。尽管GPT-4的速度变快了,但性能却明显下降了。这引发了整个人工智能社区的讨论。根据Sharon Zhou和其他专家的说法,这意味着着发生了重大的变革。

他们认为,OpenAI正在创建一些较小的GPT-4模型,这些模型在功能上类似于大型模型,但运行成本更低。

几天前,SemiAnalysis发布的一篇付费订阅内容也涉及到这一点。文章中提到,OpenAI通过使用混合专家(MoE)模型来维持可行的成本。他们在模型中使用了16个专家模型,每个专家模型大约有111B个参数。这些专家模型中的两个被路由到每个前向传递。

"这些较小的专家模型针对不同的任务和领域进行了训练。可能有一个专门用于生物学的小型GPT-4,以及其他用于物理学、化学等领域的小型模型。当一个GPT-4用户提问时,新系统就会知道向哪个专家模型发送该查询。新系统可能会决定将查询发送给两个或多个专家模型,然后将结果合并起来。"Sharon Zhou解释道。

开发者兼黑客George Hotz在最近的一个播客中描述了GPT-4是运行8个混合模型。需要提到的是,艾伦人工智能研究所创始CEO Oren Etzioni在看到这些信息后,通过邮件向Business Insider表示:“我『推测』这些猜测大致准确,但我没有证据。”


大家都在吐槽GPT-4变「笨」了,可能是架构重新设计惹的祸


Oren Etzioni认为,采用混合模型的目的在于提升生成式模型的输出质量、降低成本并提高响应速度。


eEtzioni进一步补充道:"恰当地使用混合模型可以同时满足上述需求,但通常需要在成本与质量之间做出权衡。有传言称OpenAI正在为了降低成本而牺牲一部分质量,但这只是无根据的传闻。"


据实际情况,2022年,OpenAI的总裁Greg Brockman与几位同事合作撰写了一篇有关MoE方法的文章。该文中提到:"采用MoE方法,在不增加计算成本的前提下,模型可以支持更多参数。"


Sharon Zhou表示:"与训练和OpenAI推出的小型专家GPT-4模型有关,GPT-4近几周的性能下降是很可能的。当用户对其进行测试时,我们会提出各种不同的问题。尽管它的回答可能不理想,但它会从我们那里收集数据,并不断改进和学习。"


相关文章

从“墙面依赖”到“智慧掌控”,三翼鸟携手沃棣家居,焕新家居生活新篇章

从“墙面依赖”到“智慧掌控”,三翼鸟携手沃棣家居,焕新家居生活新篇章

随着科技的不断进步,家居生活也正在经历一场前所未有的变革。在2024年7月8日开幕的广州建博会上,三翼鸟携旗下品牌沃棣家居,为我们呈现了一场智能家居的盛宴。 沃棣家居此次推出的全场景智慧...

海尔全屋家居亮相中国品牌博览会,理念创新高端品质体验再升级

海尔全屋家居亮相中国品牌博览会,理念创新高端品质体验再升级

 5月10日-14日,由国家发展改革委、国资委、市场监管总局、国家知识产权局共同主办的2024年中国品牌博览会在上海盛大开幕。 作为第8个中国品牌日系列活动之一,今年中国品博会...

国产AI大模型“曹植”发布:擅长文档写作、支持中英法日等数十种语言

在 2023 世界人工智能大会期间,达观数据“曹植”大模型正式发布,并对外开放公测。在 2023 世界人工智能大会(WAIC)上,达观数据引领国产大预言模型的新潮流,正式发布了其垂直专用的大语言模型—...

汉威激光甲烷家用燃气报警器,守护家庭用气安全

汉威激光甲烷家用燃气报警器,守护家庭用气安全

 随着城市化和农村天然气改造进程加快,我国燃气用户、管道长度不断增长。据《2021年城乡建设统计年鉴》,2013年~2021年期间,我国城市、县城燃气(包括天然气和人工煤气)用气人...

众多科技大V推荐的大屏电视!年度最热门Mini LED非海信电视U8莫属

众多科技大V推荐的大屏电视!年度最热门Mini LED非海信电视U8莫属

 新年伊始,不少人都把焕新列到了年度清单,尤其要换一台音画双绝,观影、游戏都能打的“全能”电视。毕竟,在接下来春节亲友来聚、一家看春晚、组团开黑等美好时刻,这样的电视才能把情绪价值...

炬芯科技Home Audio Soundbar 无线家庭影院解决方案

炬芯科技Home Audio Soundbar 无线家庭影院解决方案

 在平板液晶电视时代,笨重的功放机和组合音响逐渐被淘汰,代之以轻巧灵便的Soundbar,辅之以独立的低音炮和环绕音响,用于增强电视或其他音频源的声音效果,为消费者带来震撼、沉浸...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。