​AI硬件会缓解字节的FOMO情绪吗?

2024-09-28 05:00 来源:网络 点击:

AI硬件会缓解字节的FOMO情绪吗?

文 | 窄播,作者 | 李威(北京)

字节跳动对下一代硬件有一种强烈的 FOMO 情绪——宁愿承受屡败屡战带来的损失,也不愿放弃每一个可能掌握硬件入口的机会。

生成式 AI 掀起的新一轮硬件创新中,当然也没有缺少字节跳动的身影。在大模型能力加持下,升级智能耳机和智能眼镜产品的使用体验,是大多数 AI 硬件创业公司的探索目标,也是字节跳动自研 AI 硬件的两个明确方向。

已经公开的消息中,字节跳动在 AI 耳机方面的布局和进展更为明确。据《晚点 LatePost》报道,拥有内容创业和硬件创业经验的 Kayden 正在带领字节跳动的 AI 硬件团队开发一款与豆包大模型和豆包 App 深度结合的 AI 耳机产品。此前被字节收购的中国耳机制造商大十未来的创始人李浩乾及其团队,也在其中扮演了重要角色。

耳机之外,眼镜也是生成式 AI 与硬件结合的主流选择。Ray-Ban Meta 的成功已经初步验证了 AI 眼镜的可行性。在 Meta Connect 2024 年度开发者大会上,Meta 将推出首款「结合了 XR 与 AI 领域研发成果」的 AR 眼镜产品。既然 Meta 可以在 AI 眼镜方向上大步前进,同样拥有内容平台和 VR 硬件业务积累的字节跳动也完全可以效仿这个路径。

字节跳动的确是这么做的。但字节跳动在 AI 眼镜方面的布局成熟度和投入力度看上去远不如 AI 耳机。目前外界甚至不清楚字节跳动在 AI 眼镜业务上,究竟是要侧重以投资公司的方式继续布局,还是要组建内部团队展开研发。也有消息显示,字节跳动已经与某互联网公司的前大模型核心技术人员合作,共同进行 AI 眼镜产品的研发。

但是,字节跳动当下的 AI 硬件业务,很难从根本上缓解其在硬件方面的 FOMO 情绪,更多是在为豆包的增长与留存提供一个「望梅止渴」的机会。

AI 耳机:亲技术,远市场

相较而言,AI 原生硬件公司「万物科技 VVAN Technology Inc.」创始人、前风险投资人张硕何会认为目前 AI 耳机的市场机会要大于 AI 眼镜。原因在于,AI 硬件目前还没有催生全新品类的能力,大模型还没有迭代到最完整的多模态形态,更多的实际应用还是基于大语言模型的语义理解能力在做,AI 硬件的刚需性场景究竟是什么也无法判断。

在这个前提下,体积更小的耳机,会比其他可穿戴设备更适配大语言模型的服务场景。对比手机,耳机的长时间佩戴属性更强,得到唤醒的概率更高;对比眼镜,耳机的功耗更小,特别是 OWS(全开放穿戴式耳机)耳机相比入耳式或半入耳式耳机的佩戴舒适度更高,能够满足至少 7-8 小时的连续使用需要,适合长时间待机,为用户提供即时唤醒服务。

字节跳动收购的十大未来在 2022 年就推出了首款采用 OWS 技术的耳机产品 Oladance。对于拥有一定硬件操盘经验的字节跳动而言,这次收购的作用主要是补上其在 OWS 耳机这个具体品类上的实际研发能力积累,提升产品的研发效率。

张硕何的以上判断更多是从产品层面出发。

从市场竞争层面来看,相对成熟的 AI 耳机并不是 AI 硬件创业公司的理想选择,甚至也不算是字节跳动的理想选择。

当前的市场下,耳机更多是以手机的附庸形态出现,从 TWS 耳机的市场格局来看,2024 年 Q2 销量占比排名前五的是苹果、三星、小米、华为,以及印度品牌 boAt,几乎是以智能手机厂商为主导。在新兴的 OWS 耳机上,智能手机厂商依然可能延续这种市场统治力。

现阶段的大模型也很难解藕手机与耳机,让耳机完全独立调用各种功能。AI Pin 和 Rabbit R1 之所以遭遇滑铁卢,是因为用户预期管理的失败,导致货不对板,开售后口碑快速滑坡。造成这一切的原因有硬件能力上的局限,也有大模型的代理任务执行能力还不能带来区别于手机的交互体验的问题。

字节跳动想要依靠豆包大模型和豆包 App 来建立与手机的差异化体验也很难。即时响应是一个关键点,但这不是说服用户购买字节跳动的 AI 耳机的绝对理由。现在很难回答,通过耳机调用手机上的豆包 App,或是在耳机上操控豆包 App,是否需要专门购买一个字节跳动为豆包深度定制的 AI 耳机。

反倒是 AI 眼镜方向上,已经有诸如 Solos、李未可、蜂巢科技这样的公司,尝试在更大的不确定性下,找到做大做强的机会。无论是国内的互联网大厂,还是手机大厂,大多都还在通过投资进行着 AI 眼镜的代理人战争,还没有亲自下场,参与到 AI 眼镜的市场竞争中。

张硕何认为,在现有供应链的支持下,做出一款类似 Ray-Ban Meta 的眼镜产品,对字节跳动来说没有什么难度。做与不做,什么时候做,很大程度上是要跟着市场机会走。「硬件产品的销售预期会影响公司对投入和成本的控制,即使是字节跳动这个级别的公司,一开始肯定也是集中打一两个 SKU 和卖点。」张硕何表示。

要把硬件部分看得更重要

一种与大模型结合的更高可能性与一个竞争激烈的目标市场结合,让字节跳动布局 AI 耳机的趋势优劣相互抵消,拉升了基础产品能力的重要性。一个字节跳动发布的,具备更流畅的豆包 App 调用能力的,音质和体验超级好的耳机产品,在字节跳动流量能力的支持下,拥有爆发的可能性。

这会极大考验字节跳动的 AI 硬件团队的内功。

选将很重要,字节跳动的 AI 硬件业务看上去需要一个能打硬仗的人带队。现在的业务负责人是否匹配尚未可知,但字节跳动是一个体系,个人表现不会对大局产生根本性影响。

AI 硬件业务在字节跳动体系内的位置也可能会影响业务的爆发力。

在张硕何看来,字节跳动的 AI 硬件团队还是作为大中台的一部分,在服务字节跳动的细分业务。「AI 耳机作为一个能随时唤醒的云入口存在,豆包 App 承担实现功能价值的业务流程。硬件形式是服务于功能的,他们还是在作为一个基于大语言模型的 C 端调用生态的一部分存在。」

依附于豆包大模型发展的 AI 硬件,其战略的重要性及投入的持久性都具备很大的浮动空间。

特别是,豆包大模型也在接入三星、OPPO、荣耀、小米等手机厂商的语音助手,这种感觉就像是,讯飞耳机的卖点是能够进行电话会议录音,并转文字,但当小米耳机也自带了这个功能,还会有多少用户会专门去买一个讯飞耳机。

更何况,豆包大模型也有着通义大模型、元宝大模型等相当多的竞争对手,让硬件厂商有充足的模型能力供给。

强绑定的自主 AI 硬件产品并不是豆包大模型当前的唯一选择。

AI 硬件可能需要更长时间

硬件服务于软件的思路,从收购锤子手机时就已经显现出来,经历了教育硬件、VR 硬件的尝试,延续到了 AI 硬件上。

通过资本收购来的专业硬件团队,加持以强大的流量能力,总会让人觉得字节跳动在硬件领域能拥有「大力出奇迹的可能性」。特别是对以全球市场为目标的 AI 硬件而言,字节跳动是国内少有的具备全球流量加持能力的公司。

但 PICO 的经历表明,短时间内投入大量资金和流量资源去推广一款硬件产品,很难产生像推红一位主播或 App 一样的高回报率。

硬件有自己的发展节奏,不但受限于技术的成熟度,还会很依赖于张硕何所提到的市场成熟度,软件业务付出的流量和资本很难催熟硬件的产业周期。高期待反倒有可能揠苗助长。

Ray-Ban Meta 之所以能够获得成功,是因为它找到了一个产品成熟度与市场成熟度的契合点,给到用户的预期不再像 VR 眼镜一样,是一个可以替代智能手机的头戴式终端,而是一个可以很好完成听音乐和拍视频任务的眼镜。首先是一个眼镜,其次它有更多智能功能。

AI 硬件同样需要寻找这样一个契合点。理论上,AI 硬件能够为大模型提供更便捷的调用触点,给用户带来更便捷的大模型能力调用形式。

现实情况是,现在大模型产品依然需要进行更大的能力提升,面向全新交互体验和内容分发方式进行探索,创新用户体验,做到有用、可用。在手机和电脑上不能获得留存的大模型产品,非但不能帮助 AI 硬件实现破圈,反倒会像 VR 设备一样将更多用户的尝试欲望扼杀掉。

对于字节跳动而言,这样的 AI 硬件业务需要从业务与硬件两个方向同时发力,很可能需要付出更长时间和更多耐心。不像对手机和 VR 的投入,是为现有的成熟业务体系内找到属于字节跳动的入口,完成更大的闭环,有一目了然的路径。

预期管理很重要

目前很难判断字节跳动这一次在 AI 硬件方面会有多大的战略决心。对于硬件这种需要长周期布局的赛道来说,一定的耐心是非常必要的。但字节跳动的耐心和偏执会更多给到社交、硬件更宏观的目标,而不是 VR 眼镜、飞聊这样更具体的产品。

在字节跳动遇到风口就快速扩张,风口遇冷就马上收缩的惯有操作下,一旦 AI 硬件的表现不及预期,字节跳动很大概率会在 AI 硬件上延续此前快速断腕的操作,将精力和资源收回到大模型本身。

不可否认的是,每一次字节跳动在硬件领域的尝试和布局都会为增加其在硬件方面的火种储备,以便等待新的机会出现。锤子和 PICO 收缩之后,硬件团队会被保留。但仍然是对信心的一种极大消耗。

这一次,字节跳动可能需要更好管理自己对 AI 硬件的预期。