​山姆-奥特曼怒喷谷歌,GPT-4o抢了Gemini风头

2024-05-21 00:58 来源:网络 点击:

山姆-奥特曼怒喷谷歌,GPT-4o抢了Gemini风头

作者|孙鹏越

编辑|大     风

这些天的硅谷,乱成了一锅粥。

OpenAI CEO 山姆 - 奥特曼直接在社交平台公开嘲讽谷歌的审美过于差劲,他表示:我努力不去过多思考我们的竞争对手,但我无法不去思考 OpenAI 和谷歌之间的美学差异。

下面附着的两张发布会现场图,左边是 OpenAI,右边是谷歌。言下之意,就是 OpenAI 干净明了,极具科技感;而谷歌则离人群非常远,十分过时。

OpenAI CEO 山姆 - 奥特曼

山姆 - 奥特曼如此气急败坏,还是因为在上周,OpenAI 和谷歌同时发布 AI 新品,双方打的你来我往:你说 GPT-4o 全球最先进,我说 Gemini 家族能覆盖全生态全路径。

两家硅谷巨头的直接对抗,把科技竞赛的强度拉满,就连 CEO 本人都坐不住了。

谷歌 AI 全家桶上线

山姆 - 奥特曼嘲讽谷歌并不是无的放矢,这场谷歌 I/O 大会在观看性上,确实差强人意。

首先是时间太长,谷歌 I/O 大会足足有接近两个小时,主持人连续提起了 121 次 AI 字眼,甚至有观众在社交平台抱怨自己都快睡着了。

然后就是产品太多,比起 OpenAI 仅有 GPT-4o 一款新品,谷歌这次则推出了十余种 Gemini 大模型的升级及新品,可以说是 "AI 全家桶 "。

发布 AI 搜索:Google Search;

升级了 Gemini 大模型:Gemini 1.5 Flash(100 万上下文)、Gemini Pro(200 万上下文);

新发布了手机版 Gemini App:以手机应用程序形式,支持和 AI 视频对话;

发布视觉语言模型 Project Astra:拥有 Imagen3(图像)、Music AI Sandbox(音乐)、Veo(视频生成)三种能力。

虽然谷歌 AI 全家桶看上去格外炫酷,但实际上对比 OpenAI 的 GPT-4o 依然差上很多,更多是硬件性升级,单纯给大模型升级一下参数。

谷歌 Gemini 家族

最令人印象深刻的两项功能,是 AI 搜索 Google Search 和 AI 助理 Project Astra。

首先是 Google Search,搜索作为谷歌起家的根本,这些年遭受到了微软的重创。微软的 Bing 已经借助 ChatGPT,给传统搜索引擎带来了 " 亿点点 "AI 降维打击。

甚至就连 OpenAI 也在盛传将推出 AI 搜索类产品,来抢占 Google 搜索市场。

压力之下,谷歌推出 Google Search 来稳定自家护城河,下定决心重塑搜索体验。

据演示视频来看,Google Search 最核心的功能,就是搜索摘要功能 AI Overview。

所谓的 " 搜索摘要功能 ",就是谷歌之前提出来的 " 搜索生成式体验(SGE)"。

用户在搜索框内键入文本,直接在最上方跳出 AI 帮忙整理的信息摘要。其中包含用自然语言对搜索结果的总结和概括,以及推荐的链接。

AI Overview 还内置了 " 多步推理功能 Multi-Step Reasoning"、" 计划功能 Planning in Search"、" 视频提问 Ask With Video"。

另外一个发布会亮点,就是谷歌推出的 AI 助理 Project Astra。

Project Astra 就是一个完全对标 GPT-4o 的产品,产品形态和使用逻辑基本和 ChatGPT 无二。用户可以和它实时对话、视频聊天。

并且,和 GPT-4o 一样,Project Astra 也提供文生图、文生视频两项功能。只不过不叫 DALL · E 和 Sora,而是叫做 Imagen 3 和 Veo。

唯一有点不一样的,就是 Project Astra 提供了音乐生成模型 Music AI Sandbox。

用户可以上传一小段音乐 demo,Music AI Sandbox 能在此基础上拓展延长。用户还可以输入提示词,进一步调整音乐风格,进行乐曲的二度创作。

总之,用一句话来概括谷歌 AI 全家桶,就是:东西很多,精品很少。

我们能在一系列 AI 新产品里,不断看到 ChatGPT 的影子,但单纯是在 GPT-4o 做好的框架里缝缝补补,升级一下算力,换个新框架。

能给用户带来震撼感的产品呢?

依然没有看到。

越来越像人类的 GPT-4o

比起谷歌的多到凌乱,OpenAI 则是简洁明了。

仅仅只有半个多小时,全程由公司 CTO 和两位工程师 face to face,以对话形式展示产品,非常具有电影感。

甚至 CEO 山姆 - 奥特曼都没有现身发布会,完全用产品力来震撼用户。

现场的演示嘉宾拿着手机摄像头,让 GPT-4o 识别自己的表情,来判断自己的情绪。

GPT-4o 很快识别完成,说:你看起来很开心,带着灿烂的笑容,甚至有一丝兴奋,你能分享你快乐的来源吗?

演示嘉宾在纸上写了 "i love you" 给 GPT-4o,GPT-4o 用带有一丝丝娇羞、热情四溢的语气快速回应着人类的 " 爱意 "。

GPT-4o 演示现场

GPT-4o 能感受到你的呼吸节奏、能 " 看出 " 你文字当中包含的情绪、甚至可以打断它的话,重新为话题增加新的语境,它也能作出完美回应……

这样的人工智能,让你想到了什么?

是的,一个完美恋人。

就像是 2013 年上映的好莱坞电影《Her》,斯嘉丽配音的人工智能和人类谈起了恋爱。

这一幕,逐渐成为现实。谁会不喜欢一个热情洋溢、事事有回应、提供丰富情绪价值的伴侣呢?

哪怕它是 AI。

GPT-4o 给后来者谷歌一个下马威,也给出未来 AI 大模型的一个满分答案:不管是生成式 AI 大模型也好,聊天机器人也好,不用再去关心什么硬件什么参数,AI 的最终方向就是越来越像人类。

OpenAI 并没有过多描述自己的算力、自己的硬件升级,只是由首席技术官穆里 · 穆拉蒂  ( Muri Murati )  表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升,"GPT-4o 可以综合利用语音、文本和视觉信息进行推理。"

现阶段的 GPT-4o 已经摆脱了对文本、图片或语音的束缚,它的识别能力进化到了 " 听觉 " 和 " 视觉 "。

用 " 听 " 来捕捉情绪变化,比如能判断对方急促的呼吸方式不对;用 " 看 " 来识别你写在纸上的方程式数学问题,一步步教你解题步骤。

甚至它还可以通过手机摄像头,回答你 " 这个人穿什么牌子的衬衫?"

比起谷歌眼花缭乱、不知从哪下手的 AI 全家桶,GPT-4o 已经领先到大气层了。

免费,但又不完全免费

GPT-4o 除了在能力上,给了谷歌一个下马威外,OpenAI 还放了大招:

穆里 - 穆拉蒂表示,GPT-4o 将免费提供给所有用户使用,不但当下免费,甚至以后 OpenAI 做产品就是要免费优先,为的就是让更多的人能使用。

就连 OpenAI CEO 山姆奥特曼表示,新的 GPT-4o 是 OpenAI 有史以来最好的模型,它可供所有 ChatGPT 用户使用,无论是免费版本还是付费 GPT-4 版。

不得不说,当服务免费时,用户就是产品。

如果 GPT-4o 真的能彻底取消付费制度,那么 OpenAI 获得的数据量会超出想象。

可惜的是,OpenAI 还是缺少 " 用免费改变世界 " 的魄力,背后还是有不少的猫腻。

穆里 · 穆拉蒂  ( Muri Murati )

首先,OpenA 在官网公告上明确说明,免费用户在使用 GPT-4o 时,OpenAI 做出了权限上的分级。

免费用户可以使用 GPT-4o 的分析数据、创建报表、处理照片、上传文件、使用记忆功能等,基本上 GPT-4o 涵盖了 GPT4 所有的付费功能。

但是免费用户会有消息数量的限制,PIUS 用户的消息将是免费用户的 5 倍,Team 和 Enterprise 用户限制将会更高。

每天能用多久?每天能发几条?GPT-4o 并没有详细说明。

或许,我们可以参考 OpenAI 上一代 GPT-4,限制每个用户每天的使用时间在 3 小时以内,并限制每天生成的信息数量不超过 25 条。

虽然说这一限制在一定程度上,提高了信息的质量和用户的注意力。但还是要感叹一句,互联网的免费,永远不是真免费。

哪怕到了 AI 时代,这个法则也同样适用。