欢迎来到区块链早报官方网站!
首页>>观点 > 正文

竞品还在追赶,OpenAI 用 GPT-4 飚赢自己

区块链早报 发布时间:2023-03-16 12:06:49 OpenAIGPT-4
热度:132℃

赶在百度“文心一言”发布前一天,OpenAI祭出了GPT-4,这对于百度、谷歌们来说,可能是一个重大打击。

人们已经领略过GPT-3.5加持下的ChatGPT,但GPT-4比“前辈”更强大,它具有更高的可靠性和准确性,能够读懂图片,甚至还能角色扮演。目前,GPT-4已被应用到ChatGPT和Bing上,再一次刷新外界对AI的能力认知。

GPT-4越耀眼,谷歌、百度等竞争对手们便越焦虑。毕竟,其他公司忙着对标GPT-3.5时,OpenAI快速将大模型升级为GPT-4,一骑绝尘的样子丝毫“不讲武德”,像一个孤独求败的杀手,眼望着挑战者的到来。


GPT-4打败GPT-3.5


知名KOL和菜头说,因为OpenAI在3月15日凌晨发布了GPT-4,他和他的一些老朋友都没睡好,微信里的消息提示此起彼伏,“感觉像是回到了乔布斯还在世的时候,大家相约线上看苹果发布会的那些夜晚。”

北京时间3月15日凌晨,GPT-4发布受万众瞩目,这是采用GPT-3.5的ChatGPT火爆后的必然结果。看客们想要知道,它比GPT-3.5到底强多少?人们甚至没有兴趣拿它来对比别的同类产品,因为能站在同一起跑线上与之对比的还没有出现。

OpenAI很了解围观者的胃口,在那场更像是产品演示的发布会里,开发者一上来就让GPT-3.5和GPT-4分别尝试回答同样的问题。结果,熬夜的人没白等。

一开始,OpenAI的开发者复制了一篇博客文章,并交给了GPT-3.5,让它进行总结,要求是每个单词都要以“G”开头。结果GPT-3.5直接选择了放弃。轮到GPT-4,它快速地给出了答案,完全符合要求。随后,开发者又让它尝试以字母“A”开头回答同样的问题,GPT-4又做到了。

这还没完,如同提升“节目效果”一样,开发者直接和Discord社群互动起来,选取了网友提出的字母“Q”。再来一遍,GPT-4依然轻松拿捏。

这轮演示,OpenAI特地选取了一个超过GPT-3.5“阈值”的问题来测试,意在表现GPT-4的能力进化水平。正如官方所解释的,在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙,当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

为了全面且可视化地评估GPT-4的能力提升程度,OpenAI展示了它与GPT-3.5共同参与了多项模拟考试的情况,包括统一律师资格考试、研究生入学考试、医学知识自测、艺术史、微积分等等,结果GPT-4几乎碾压了GPT-3.5。比如,在模拟律师考试中,GPT-4的分数在应试者的前10%左右,而GPT-3.5 的得分排在倒数10%左右。

各项考试中GPT-4领先GPT-3.5

如同苹果发布会每次都会带来一个大彩蛋,GPT-4也带来了一项跨越式的功能——接受视觉输入。这意味着,GPT-4能够看懂图片了。

官方解释:GPT-4在给定由散布的文本和图像组成的输入的情况下,可生成文本输出(自然语言、代码等)。换言之,给它一张带有文字的图片,并提出要求,它就能给出想要的结果。

在演示中,开发者画了一张网站的草图,要求GPT-4用简短的 HTML/JS 将这个草图变成彩色的网站。仅仅几秒钟后,GPT-4就带来了一个完整的网页。

不仅如此,GPT-4还能尝试理解一些流行的“梗图”。如下图所示,让它解释这张图的笑点在哪,GPT-4不但Get到了,还一本正经地解释了一通。

GPT-4解释“梗图”的笑点

GPT-4的识图功能只有体验过才能知道是否如OpenAI说得这么厉害。遗憾的是,目前视觉输入还没有完全开放,仅在一小部分开发者中进行测试。OpenAI创始人Sam Altman解释称,此举是为了防止可能出现的安全性和伦理问题。

GPT-4还有一项特别本领,它可以扮演不同的角色和说话的方式,这与具有固定语气和风格的GPT-3.5不同。基于这个功能,用户可以让GPT-4实现角色扮演并定制它的性格。

就像当年的一代代新款iPhone给人们带来惊奇感受,GPT-4展现了比它的上一代更强大的能力。不过,它也并不完美。与GPT-3.5一样,GPT-4有时仍会虚构事实,“一本正经地胡说八道”还不能完全避免。OpenAI宣称,在内部对抗性真实性评估中,GPT-4的得分比GPT-3.5高40%,显然,它还有很大的提升空间。


谷歌、百度更焦虑了


OpenAI正和当初的苹果走在一样的道路上:成为引领者,并在别人苦苦追赶时,又猛地拉开一大截。

就在GPT-4发布前,互联网巨头谷歌也在YouTube上发布了一支预告片,宣布将AI整合到Gmail电子邮件和GoogleDocs文档等办公应用中。谷歌在视频中费了很大力气展示相关功能,告诉人们可以在文件中进行头脑风暴、校对、写作和改写;利用幻灯片中自动生成的图片、音频和视频,将创意构想变为现实等。

然而,“一点水花都没有,几个小时之后GPT-4开发布会,人一下子就全跑光了。”和菜头如此描述他的观察。从社交网络上舆论风向看,谷歌的AI新动作被铺天盖地的GPT-4消息所淹没——无论是海外的推特还是国内的微博,GPT-4都登上了热搜榜。

和谷歌一样被冷落的AI玩家还有Meta。不久前,Meta公布了旗下全新的AI大型语言模型LLaMA,宣称可帮助研究人员降低生成式AI工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。Meta还放话,这一大模型仅用约1/10的参数规模,就能匹敌OpenAI GPT-3、谷歌PaLM等主流大模型的性能表现。这一新动态在GPT-4到来后,没有在舆论场上再露脸。

OpenAI的光芒越盛,其他科技巨头们就越焦虑。

2月,仓促应战ChatGPT的谷歌还闹出过笑话,其开发的聊天机器人Bard首秀“翻车”,答错问题导致其市值一天之内蒸发约1000亿美元。

在国内,百度也在加急研发与ChatGPT类似的聊天机器人“文心一言”。按照预告,百度将在今天下午举办有关文心一言的新闻发布会。在许多人也许还在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT,结果,OpenAI赶在百度发布会前带来了更强大的GPT-4。

别人忙着对标GPT-3.5时,OpenAI如同冷血杀手一般,亲手击败了自己出品的GPT-3.5。同类竞争公司们有多焦虑,网友们已经自行脑补出了各种“梗图”。

“那种提刀在手,环顾天下,寂寞如雪的感觉,让我忍不住感慨:即便在美国本土,这件事也和绝大多数美国科技公司无关了。”和菜头形容,OpenAI迭代的速度让他感觉到心惊肉跳,“所有试图追赶的人和公司,目前落后进度最少两年。在这种AI爆发式增长的时代,两年就是三辈子。”

回顾GPT的发展,它用5年时间里完成了从量变到质变的飞跃。2018年,GPT-1首次发布,当时的模型参数只有1.17亿个,随后的GPT-2将标准提高到15亿个参数,GPT-3和GPT-3.5的神经网络直接提升到1750亿个参数,而到了GPT-4,采用的参数超过2000亿个,并利用了超过200万个数据源(GPT-3.5使用了45万个数据源),包括互联网上的各种文本、图像、音频和视频数据。

相比之下,2022年初谷歌曾披露其LaMDA 模型参数为1370亿个,不如当时的GPT-3多。而据百度透露,文心一言大模型参数规模达到2600亿,相比GPT-4更多,这或许还能让它留给人们一些期待。

不过,有专家指出,模型参数并不是决定AI聊天机器人能力的绝对因素,在此基础上,对数据的清洗和标注、模型结构设计、训练推理的技术积累都会决定最终产品的表现。

GPT-4甚至不用担心产品化了,它已经应用于ChatGPT和微软的搜索引擎必应(Bing)上。一骑绝尘后,尘土里若隐若现着谷歌和百度。


标签:OpenAIGPT-4

热门文章

  • 上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO
    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    QKEx是QK集团于2020年开始自主研发的全球化加密资产综合服务平台,包含现货、合约、理财、算力挖矿等多板块业务;QKEX首创CommunalFI的行业全新概念,计划实现社区行为经济上链,打造去中心化社区经济及交易生态。 据官方消息,QKEx将于UTC+8时间11月8日12:00开启平台币最后一轮IDO,官方对外显示第三轮IDO价...

  • CyberCrowdChain(CCROWD)将于1月17日上线HTX
    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    据官方消息,CyberCrowdChain(CCROWD)将于1月17日上线HTX,存款将于1月13日13:00开放,在存款量满足市场需求时开放CCROWD/USDT现货交易对。据悉,CyberCrowdChain是一种基于以太坊的代币,它继承了传统加密货币的安全性和透明性,并融合了人工智能,为资产表示和交易过程带来更高的可信度和创新性。CCROWD目前已上线Polon...

  • 理财新选择,托菲斯打造 Bitcoin 价值增值共享平台
    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    据官方消息报道,托菲斯正式发布其全新挖矿理财服务,为广大用户提供Bitcoin价值增值的共享平台。作为业界领先的大型 Bitcoin 矿机企业,托菲斯以其雄厚的实力和卓越的技术,在挖矿领域独树一帜。凭借专业的技术团队和深厚的行业经验,托菲斯创新推出挖矿收益与存币生息双重收益模式,一方面,托菲斯支持三十余种主...

  • QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易
    QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易

    QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易

    据官方消息,QKEx平台代币$QQT第三IDO发售已于UTC+8时间11月9日23:59:59准时结束,此后$QQT将不再对外发售! $QQT是QKEx平台所发行的唯一治理及流通使用代币,代币总量5亿枚,将于6年内释放完毕;在代币发行之初QKEx为$QQT持有者赋予了多项权益; 权益一,持有者可享受平台40%盈利分红,该分红范围...

  • 绝佳的投资机会,财富巅峰尽在Ulinx!
    绝佳的投资机会,财富巅峰尽在Ulinx!

    绝佳的投资机会,财富巅峰尽在Ulinx!

    高回报率Ulinx以超高收益和闪电般的成交速度著称。我们为您提供通往财富巅峰的捷径!资金安全保障您的安全是我们的首要任务。Ulinx采用世界一流的安全技术和协议,确保您的资金安全无忧。我们一直在为您的利益而努力,给您无与伦比的安心体验。百万活动奖励&n...

  • SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投
    SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投

    SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投

    AI 社交平台 SOAI 完成了 500 万美元的机构天使轮融资,其中 Archer Capital投资 300 万美元,XForce Capital 投资 200 万美元。本轮融资将加速 SOAI 在AI 情感通讯领域的技术创新和市场扩张。新的计划包括深化 AI 情感理解和匹配技术,优化用户体验,扩大全球市场。SOAI 是一个起源于硅谷的创新型 AI 平台,...

  • 全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线
    全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线

    全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线

    FonsionDex凤笙去中心化交易所由老挝MY BIOTECH集团开发,总部位于老挝国家,集团在老挝、中国政商界有着极为广阔深厚的资源与背景。此外,肩负着建设老挝文化经济特区使命、加速老挝数字经济发展,是老挝数字经济改革的首批试点单位。...

  • 区块链畅销书作者签售会
    区块链畅销书作者签售会

    区块链畅销书作者签售会

    12月6日,在马来西亚吉隆坡,金典议会《通证经济》一书举办签售会。该书由李嘉诚主席、赵梓雄博士、翁祖福博士合著。作为区块链畅销书,该书深入剖析通证经济。签售会上,作者们与读者亲切交流,分享创作心得,强调通证经济对经济结构的影响。此次活动不仅拉近了作者与读者的距离,更促进了区块链知识的普及。相信通证...

  • 奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛
    奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛

    奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛

    2023年12月20日14:00(UTC+8),Biking交易所正式开启年度交易狂欢赛,本次大赛共分为模拟交易大赛、合约交易大赛、现货交易大赛三大赛区,大赛总奖池价值高达一千万美金!据悉,Biking年度交易大赛主赛区为模拟合约大赛,报名参赛即可获得价值十万美金的模拟合约专项金,并参与总奖池瓜分。大赛有效时间:202...

  • ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装
    ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装

    ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装

    2023年9月5日,新加坡交易所ULINK发布公告,ULINK现货交易板块即将迎来上线。 经过ULINK技术团队的全力研发,本次功能升级的最大亮点是一直以金融衍生品加密货币交易所为核心定位的ULINK上线了现货交易板块。 目前ULINK的金融衍生品矩阵经过不断沉淀,已涵盖永续合约,闪电合约,网格交易,期权等多...

观点

更多 >
  • 蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了
    蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了

    原文来源:量子位图片来源:由无界 AI‌ 生成从AI制药全面转向大模型领域!这是蚂蚁集团原副总裁,复旦大学AI创新与产业研究院院长漆远正在做的事。他创办的公司无限光年,现在从AI制药领域,转向专注于生成式AI和AGI研发。量子位获悉,这家公司规划自研百亿千亿大模型搭建底座,最终构建行业应用落地医疗、游戏和教育场景。...

  • 百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴
    百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴

    作者:IT时报记者:孙妍 编辑:钱立富 孙妍3月16日,李彦宏携百度文心一言亮相,并宣布开放邀请测试。虽然文心一言的能力受到了质疑,但毋庸置疑的是,百度是全球第一个挑战ChatGPT的大厂。李彦宏也已经预见,文心一言在与ChatGPT正面比较时会令大众失望,但百度认为,文心一言有两大优势:一是,画图、写长文、...

观点李彦宏:中国基本不会再出一个OpenAI,创业公司重做ChatGPT没多大意义
观点AI“春晚”英伟达又甩王炸!ChatGPT专用GPU来了 还要赋能芯片制造
观点GPT-4会让多少美国人失业?OpenAI:高收入工作会面临更大影响
观点AI企业如何发展,“中国版chat GPT”给出了答案
观点英伟达CEO:现在是AI行业的iPhone时刻