欢迎来到区块链早报官方网站!
首页>>专栏 > 正文

GPT-4收获满堂彩 百度“文心一言”还只是PPT?

区块链早报 发布时间:2023-03-17 14:35:23 GPT-4文心一言百度
热度:128℃

原文:《产品“摆拍”展示 文心一言露怯》

作者:文刀

3月16日,“文心一言”没有在问答环节 “翻车”,因为,百度创始人李彦宏在开发会现场展示的这个自然语言大模型产品,测试的过程和结果是提前录制好的。

“摆拍”的测试Demo里,文心一言能用中文回答问题,能续写《三体》,能理解“洛阳纸贵”,能计算“鸡兔同笼”的数学问题并给出推算过程,还能生成图片、语音甚至视频。看上去挺强大,但也仅限于看上去,远没有更早一天OpenAI直接演示GPT-4模型时带来的全网惊艳。

展示看似稳妥,但没保住股价。李彦宏登台后,港股百度集团股价从130港元开跌,22分钟后跌幅超9%至120港元,发布会结束后,百度股价也没能回到130港元。

整场发布会,文心一言没有真实互动、没有技术数据细节、没有与其他大模型的对比,李彦宏与百度CEO王海峰一人一套PPT,公众一个多月的期待落空。当下,王海峰宣布,“邀测开启”,需要邀请码。

这意味着,普罗大众还无法体验文心一言。而那边厢,GPT-4已经被嵌入到ChatGPT和搜索引擎Bing,让AI技术直抵普通人。

相较而言,百度对文心一言更有信心的领域似乎在产业,李彦宏和王海峰都强调了自然语言大模型对“千行万业”的影响,这也是它与ChatGPT的区别之一,后者的“现象级”、“杀手级”评价纯来源于用户“自来水”。

1、问答演示系提前录制 股价应声大跌

李彦宏一上台就给“文心一言”定了一个调——这个基于文心大模型底层的产品在公众的期待中,对标的是ChatGPT甚至GPT-4,“门槛很高。”

他话锋一转,巧妙地避开了百度与OpenAI的比较,而是把对比放在了全球大厂的范畴里,“百度是第一个发布的,大家知道微软是直接调用OpenAI,谷歌、Meta、英伟达都没有真正发布同类型的、同级别的产品。”这句话没说完,李彦宏清了下嗓子,一如他在过往发布会上一样,略显紧张。

后来的15分钟里,李彦宏用Demo展示了文心一言的五大能力:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。对应每个能力,他以文字的形式输入了不同的、有上下文联系的需求。

比如,展现文学创作能力时,他让文心一言总结《三体》核心内容后,提出从哲学的角度续写《三体》的要求;展现商业文案创作时,他让文心一言按企业业务给公司起名、生成Slogan、写公司成立的新闻稿;在展示梳理逻辑推算时,李彦宏用小学生们躲不开的“鸡兔同笼”数学题为例,甚至故意输错了题干,文心一言指出有错后,在修改的题干后给出了正确答案和解题过程。

此时,发布会直播刚好进入到第21分钟,面向全网,李彦宏突然解释了一句:演示不是现场进行的,而是提前录下来的,“因为需要输入很多词,为了节省时间。”

此话一出,全网哗然,“原来是摆拍的。”2分钟后,港股百度集团股价直接下挫至120港元,较发布会14点开始时的130港元跌超9%。

百度港股股价在发布会期间大跌

“摆拍”的测试Demo继续演示了文心一言的“强大”:解答“洛阳纸贵”在当时到底有多贵,能拿这个成语作一首藏头诗,根植于中国的百度能拿出比其他自然语言大模型竞品更好的中文理解能力;它也能在输入文字需求后生成海报(图片)、语音(可以是方言)甚至视频,即多模态生成能力。

然而,“提前录制”这个转折让文心一言后续的展示效果变弱了。

一天前,OpenAI的联合创始人Greg Brockman直播演示GPT-4的多模态能力时,没有PPT,没有酷炫的开场广告,将一张手绘的“玩笑网站”模版草图拍照上传至新模型后,10秒生成了网站。这场展示不到半小时,但Brockman全程与社群平台Discord上的用户保持互动,还随机选择了用户的需求测试GPT-4。

谁对自己的产品更自信,一目了然。

2、中文能力显本土优势 跨语言“还在学习”

如果抛却信心不谈,那么,文心一言对标ChatGPT或GPT-4到底能否胜出?

在数据或技术细节上,无论是李彦宏还是后来上台解释文心一言技术背景的CTO王海峰,都没有在发布会现场给出具体的对比,仅提到了“5500亿”这个事实量指标,而GPT-4并没有对外披露知识数。

普通人或许无法在数据对比中得出结论。但作为中文用户,我们将李彦宏给文心一言输入的中文需求甩给了植入GPT-4模型的ChatGPT,这个“外国AI”也可以理解,但很容易给出错误答案。

比如,做鸡兔同笼数学题了错不说,题干错误也未能指出;将成语“洛阳纸贵”解释成“高分考卷在洛阳被大量复制、传阅”,“表示名贵、珍重、有价值”,属于没读过《晋书·左思传》里的《三都赋》典故,不知这个成语原意是比喻“著作风行”之意了。

ChatGPT似乎在从字面上理解中国成语‍‍‍‍‍

有趣的是,ChatGPT又回答出“洛阳纸贵”在现代经济学原理中代表“供求关系”的引申义。当它用这个成语作藏头诗时,前面三个字都藏头入诗了,但“贵”写成了“绮”,没能对这个中文字正确识别。

正如李彦宏所说,文心一言根植于中国,一定比其他国家的自然语言大模型更理解中文和中国文化。而对于跨语言,文心一言还在学习,“英文也能用,但肯定没有中文好。”

GPT-4适应的“母语”显然是英语,但为了初步测试该模型在其他语言上的能力,OpenAI的研究团队曾使用 Azure Translate 将MMLU 基准(一套涵盖 57 个主题的 14000个多项选择题 )翻译成多种语言时,GPT-4 的英语精度(85.5%)较GPT-3.5 的精度(70.1%)更高,而跨语言精度放在普通话(Mandarin)上,GPT-4能达到80.1%,高于日语和韩语等亚洲国家的语言。

作为中国本土化的ChatGPT,中文能力好当然是应尽之责。对用户和客户来说,这也是最明显的利好,语言门槛低了,申请、使用相应地都会带来便捷。但放在全球竞争中,这个优势最多能体现在使用中文的国家和地区中,而OpenAI将辐射英文使用区。

在多模态生成上,文心一言的Demo展示了输出图片、语音、视频的能力;GPT-4也披露将具备图片、视频的输出能力,但目前无法在ChatGPT 上向更广泛的公众展现,而它对网络“梗图”的理解力曾让网友惊叹,当然,最惊讶的还是它用草图框架生成代码的能力。

写代码这一涉及多模态的能力,文心一言并没有在发布会中展示。但已经拿到测试资格的媒体《量子位》成员在晚间的直播中测试了文心一言写代码能力,给出的评价是“一般般”,“Python语言还可以,其他语言就不太行了。”他还测试了文心一言是否具有GPT-4的角色扮演能力,结论是“没办法”。

3、聚焦企业客户 以用户反馈促迭代

“从我自己的内测体验看,文心一言确实也不能叫作完美。”李彦宏谦虚了一下又说,“但是,为什么今天要发布?”屏幕前一定有人以为他要说竞争、要说文心一言的出品难度,没想到的是,他自问完自答:因为有市场需求。

他说,百度的各个产品线,从搜索、智能云到自动驾驶、到小度都等着要用这样的的技术,“更重要的是,我们的客户、我们的合作伙伴在等着用这样的技术,大家都在催,我们需要尽早的将它发布出来。”

一句话,李彦宏道出了文心一言的企业级场景,客户、合作伙伴成为重中之重,背后的一页PPT里写着,“文心一言让每一家公司都离客户更近”。

李彦宏解释大模型的产业机会

在解释文心一言以及底层的文心大模型会带来哪些创业机会和投资机会时,李彦宏说,大模型将带来三大产业机会,包括新型云计算、行业模型精调和应用开发,而有关文字、图像、音视频生成、数字人、3D生成等的应用开发是“最大的机会”。

万众期待的文心一言发布会在这一刻如同一场“商业路演”,坐等客户上门。而在这场发布会之前的一个月里,几百家企业纷纷官宣加入了文心一言生态,百度给出的数据是650多家。

To B或许是文心一言的重要优势,毕竟,这个产品是集合了百度多个大模型的产物,包括ERNIE和PLATO,而这两个模型都产出过多个企业级模型,场景涵盖金融、医疗、航天、媒体、汽车等等。文心一言给企业用,简直是水到渠成。

此前,有两家“官宣”的公司告诉《元宇宙日爆》,“先占坑,测试后再看怎么用。”企业需求到底有多强烈,还有待观察。观察的窗口期也开始了,在发布会上,百度CTO王海峰当场宣布,“邀请测试”当天启动,获得邀请码即可参与测试,包括合作伙伴和个人。

很快,文心一言的测试入口开通,当然,需要邀请码才能开测。当晚10点,百度发布了文心一言的“邀测”喜报,申请调用的企业为6.5万家。

测试Demo是提前录制的,真实的测试将在有限的用户中展开,文心一言到底强不强,测试用户心里会有数。那么个人用户如何获得邀测权限?百度公布方案:在测试入口网站点击“立即体验”,参与排队。更广泛的个人用户想要用到这个产品,大概率要等它正式上线了。

百度倒不是不重视C端,发布会上,李彦宏说了,大语言模型这种产品,一旦发布出来,就会获得真实用户的反馈,“有了这些反馈,它迭代的速度、能力的提升就会非常快。”

可见,“真实用户中”的C端也有他的价值,为文心一言的大模型贡献“反馈”,提升它的迭代速度与能力。希望这个贡献对C端是免费的,这样又能与ChatGPT产生差异化。毕竟,那个“外国AI”要向体验GPT-4模型的用户收Plus版的订阅费。


热门文章

  • 上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO
    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    QKEx是QK集团于2020年开始自主研发的全球化加密资产综合服务平台,包含现货、合约、理财、算力挖矿等多板块业务;QKEX首创CommunalFI的行业全新概念,计划实现社区行为经济上链,打造去中心化社区经济及交易生态。 据官方消息,QKEx将于UTC+8时间11月8日12:00开启平台币最后一轮IDO,官方对外显示第三轮IDO价...

  • CyberCrowdChain(CCROWD)将于1月17日上线HTX
    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    据官方消息,CyberCrowdChain(CCROWD)将于1月17日上线HTX,存款将于1月13日13:00开放,在存款量满足市场需求时开放CCROWD/USDT现货交易对。据悉,CyberCrowdChain是一种基于以太坊的代币,它继承了传统加密货币的安全性和透明性,并融合了人工智能,为资产表示和交易过程带来更高的可信度和创新性。CCROWD目前已上线Polon...

  • 理财新选择,托菲斯打造 Bitcoin 价值增值共享平台
    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    据官方消息报道,托菲斯正式发布其全新挖矿理财服务,为广大用户提供Bitcoin价值增值的共享平台。作为业界领先的大型 Bitcoin 矿机企业,托菲斯以其雄厚的实力和卓越的技术,在挖矿领域独树一帜。凭借专业的技术团队和深厚的行业经验,托菲斯创新推出挖矿收益与存币生息双重收益模式,一方面,托菲斯支持三十余种主...

  • QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易
    QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易

    QKEx交易所已确定会在UTC+8时间11月11日16:00正式开启$QQT代币上线交易

    据官方消息,QKEx平台代币$QQT第三IDO发售已于UTC+8时间11月9日23:59:59准时结束,此后$QQT将不再对外发售! $QQT是QKEx平台所发行的唯一治理及流通使用代币,代币总量5亿枚,将于6年内释放完毕;在代币发行之初QKEx为$QQT持有者赋予了多项权益; 权益一,持有者可享受平台40%盈利分红,该分红范围...

  • 绝佳的投资机会,财富巅峰尽在Ulinx!
    绝佳的投资机会,财富巅峰尽在Ulinx!

    绝佳的投资机会,财富巅峰尽在Ulinx!

    高回报率Ulinx以超高收益和闪电般的成交速度著称。我们为您提供通往财富巅峰的捷径!资金安全保障您的安全是我们的首要任务。Ulinx采用世界一流的安全技术和协议,确保您的资金安全无忧。我们一直在为您的利益而努力,给您无与伦比的安心体验。百万活动奖励&n...

  • SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投
    SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投

    SOAI 完成 500 万美元天使轮融资,Archer Capital 和 XForce Capital 领投

    AI 社交平台 SOAI 完成了 500 万美元的机构天使轮融资,其中 Archer Capital投资 300 万美元,XForce Capital 投资 200 万美元。本轮融资将加速 SOAI 在AI 情感通讯领域的技术创新和市场扩张。新的计划包括深化 AI 情感理解和匹配技术,优化用户体验,扩大全球市场。SOAI 是一个起源于硅谷的创新型 AI 平台,...

  • 全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线
    全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线

    全球首个RWA赛道去中心化交易所FonsionDex全球宣发3.7号上线

    FonsionDex凤笙去中心化交易所由老挝MY BIOTECH集团开发,总部位于老挝国家,集团在老挝、中国政商界有着极为广阔深厚的资源与背景。此外,肩负着建设老挝文化经济特区使命、加速老挝数字经济发展,是老挝数字经济改革的首批试点单位。...

  • 区块链畅销书作者签售会
    区块链畅销书作者签售会

    区块链畅销书作者签售会

    12月6日,在马来西亚吉隆坡,金典议会《通证经济》一书举办签售会。该书由李嘉诚主席、赵梓雄博士、翁祖福博士合著。作为区块链畅销书,该书深入剖析通证经济。签售会上,作者们与读者亲切交流,分享创作心得,强调通证经济对经济结构的影响。此次活动不仅拉近了作者与读者的距离,更促进了区块链知识的普及。相信通证...

  • 奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛
    奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛

    奖池一千万美金,零成本参赛!Biking交易所开启年底交易狂欢赛

    2023年12月20日14:00(UTC+8),Biking交易所正式开启年度交易狂欢赛,本次大赛共分为模拟交易大赛、合约交易大赛、现货交易大赛三大赛区,大赛总奖池价值高达一千万美金!据悉,Biking年度交易大赛主赛区为模拟合约大赛,报名参赛即可获得价值十万美金的模拟合约专项金,并参与总奖池瓜分。大赛有效时间:202...

  • ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装
    ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装

    ​​新加坡交易所ULINK即将正式上线现货交易,并赠中秋礼盒套装

    2023年9月5日,新加坡交易所ULINK发布公告,ULINK现货交易板块即将迎来上线。 经过ULINK技术团队的全力研发,本次功能升级的最大亮点是一直以金融衍生品加密货币交易所为核心定位的ULINK上线了现货交易板块。 目前ULINK的金融衍生品矩阵经过不断沉淀,已涵盖永续合约,闪电合约,网格交易,期权等多...

观点

更多 >
  • 蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了
    蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了

    原文来源:量子位图片来源:由无界 AI‌ 生成从AI制药全面转向大模型领域!这是蚂蚁集团原副总裁,复旦大学AI创新与产业研究院院长漆远正在做的事。他创办的公司无限光年,现在从AI制药领域,转向专注于生成式AI和AGI研发。量子位获悉,这家公司规划自研百亿千亿大模型搭建底座,最终构建行业应用落地医疗、游戏和教育场景。...

  • 百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴
    百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴

    作者:IT时报记者:孙妍 编辑:钱立富 孙妍3月16日,李彦宏携百度文心一言亮相,并宣布开放邀请测试。虽然文心一言的能力受到了质疑,但毋庸置疑的是,百度是全球第一个挑战ChatGPT的大厂。李彦宏也已经预见,文心一言在与ChatGPT正面比较时会令大众失望,但百度认为,文心一言有两大优势:一是,画图、写长文、...

观点李彦宏:中国基本不会再出一个OpenAI,创业公司重做ChatGPT没多大意义
观点AI“春晚”英伟达又甩王炸!ChatGPT专用GPU来了 还要赋能芯片制造
观点GPT-4会让多少美国人失业?OpenAI:高收入工作会面临更大影响
观点AI企业如何发展,“中国版chat GPT”给出了答案
观点英伟达CEO:现在是AI行业的iPhone时刻