大模型竞赛加剧,OpenAI最大对手发布Claude 3,可预测美国经济
大模型竞赛加剧,OpenAI最大对手发布Claude 3,可预测美国经济
图片来源:Anthropic 官网
当地时间 3 月 4 日,没有任何预告,位于美国硅谷的人工智能创业公司 Anthropic 在社交平台 X 上宣布发布大模型 Claude 3,宣称全方位超越 GPT-4。Anthropic 被视为 OpenAI 最大的竞争对手,最初由 OpenAI 前高管层创立,背后的大投资者有谷歌和亚马逊,与 OpenAI 背后的微软形成阵营对比。
Anthropic 表示,Claude 有先进的高级推理、视觉分析、代码生成、多语言处理等功能。目前 Anthropic 发布了 Claude 3 的三个版本:Claude 3 Haiku(Haiku 意指俳句)、Claude 3 Sonnet(Sonnet 意指十四行诗)和 Claude 3 Opus(Opus 意指艺术作品),这三个版本功能依次增强,价格成本也依次上升,Opus 版本最强大。
据 Anthropic 官方发布的视频,Claude 可以使用一系列工具,来预测美国 GDP 走势。Claude3 Opus 可以使用网页视图工具,进入网页的 URL 链接并利用多模态中的视觉能力查看网 页信息。Claude 3 Opus 还使用 Python 解释器来写出代码,渲染图像,将数据生成折线图。结果显示 Claude 预测的 GDP 走向的准确度在 5% 以内。
Claude 3 预测的 GDP 走向准确度在 5% 以内。图片来源:Anthropic 官方 YouTube
在让 Claude 3 分析世界上几大经济体的 GDP 变化时,Claude 3 还使用了调度子代理的工具,能自行建立多个子模型代理(相当于 Claude 3 自身的多个版本),Claude3 给这些子模型写提示词,指挥几个代理平行进行 GDP 的运算和预测。
据博主 " 数字生命卡兹克 " 测评,Claude 有着目前大模型中一流的推理能力,甚至超越 GPT-4。Claude 官网给出的 Claude 3 测评结果显示,在使用 MMMU 多语言数学推理测试集来测试时,Claude 3 Opus 达到 90.7% 的准确率,用的是 0-shot,GPT4 是 8-shot,达到了 74.5%。0-shot 意味着大模型没有在 Prompt 里给任何示例,就直接被要求完成任务。而 8-shot 则是在提示词中给了 8 个示例。这说明 Claude 在不给出示例的情况下,利用提示词里的上下文来推理的能力更强,
Anthropic 表示,Claude 能处理超长的上下文,有着近乎完美的记忆力。Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而,所有三种模型都能够接受超过 100 万个词元的输入。为了有效地处理长上下文提示,模型需要强大的回忆能力。
一种叫 " 大海捞针 "(NIAH)的评估,是测试 Claude 大模型从输入的海量数据中准确回忆并找到某个细小信息的能力。Anthropic 使用开源文档,每个提示词中放置 30 个随机问题针,来训练 Claude,结果 Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率,而且在某些情况下,它甚至识别出提示词中的 " 针 " 语句似乎是人类特意插入到原文中的,并识别这个测试本身的局限性。
据科技自媒体 " 平凡的平凡 " 测评,把刘慈欣 2 万字的小说《乡村医生》分别给到 Claude 3 和 GPT-4 后,提问历史学家的名字,Claude 3 找出了历史学家名字所在段落,而 GPT-4 没找到。
另外,Anthropic 的官方视频还显示,最轻量的 Haiku 版本 Claude 3,可以做到将数千个扫描文档,这些 PDF 是扫描版而非文字版,即使对于不清晰的字迹,Claude 大模型可以用视觉能力,通过上下文的推理来识别文字。随后,Claude 3 分析并提取关键词,来转化为结构化的数据。这将简化出版商、医疗供应商、律师事务所的繁重的文件处理业务。
Anthropic 由 OpenAI 前高管 Daniela Amodei 和 Dario Amodei 兄妹于 2021 年创立。2023 年 9 月,亚马逊宣布投资高达 40 亿美元,谷歌随后在次月承诺投资 20 亿美元。2024 年 2 月,风险投资公司 Menlo Ventures 完成了一项额外投资 7.5 亿美元的交易。据纽约时报报道,Anthropic 在一年内融资 73 亿美元。
据 The Atlantic 报道,2022 年 11 月,当 OpenAI 高层得知 Anthropic 要发布 Claude 聊天机器人时,决定提前上线 ChatGPT,随后这场席卷全球的 AI 风暴就此开启。2023 年秋天,当 OpenAI 的首席执行官 Sam Altman 被董事会戏剧性地解雇时,董事会曾在那个混乱的周末邀请过 Anthropic 的首席执行官 Dario Amodei 来担任 OpenAI 的代理 CEO,但是被 Dario 拒绝。
在 Claude 3 发布的几天前,3 月 1 日,特斯拉首席执行官 Elon Musk 起诉 OpenAI 及其首席执行官 Sam Altman,称 OpenAI 放弃了最初的造福人类的非盈利使命,转向为盈利而开发人工智能。Claude 3 发布后,彭博社科技采访 Anthropic 联合创始人 Daniela Amodei,问及 Elon Musk 起诉 OpenAI 一事时,Daniela 表示 Anthropic 作为一家公益公司,致力于平衡 AI 的潜在力量,同时保证产品的可靠、安全,执行公司最初的愿景,即提高人工智能行业的水平,保证投入市场的模型产品尽可能安全。
-
- 现场解读:如何看待中方对菲律宾侵闯行为的管制措施
-
2024-03-06 04:11:01
-
- 死亡人数超3万,加沙战火何时休?
-
2024-03-05 03:19:55
-
- 阻击马化腾,丁磊“大出血”
-
2024-03-05 03:17:39
-
- 又抠又壕?这份《00后消费报告》真相了
-
2024-03-05 03:15:23
-
- 年轻人都想“上岸”,真正的“岸”是什么?
-
2024-03-05 03:13:07
-
- 历史首次!日本突传大消息,电视台紧急开设专栏
-
2024-03-05 03:10:51
-
- 全国人大代表、小鹏汽车董事长、CEO何小鹏:探索限定场景无人驾驶法规、助力
-
2024-03-05 03:08:35
-
- 连玉明委员提案:建议农民养老金统一上调,每月至少增加100元
-
2024-03-05 03:06:19
-
- 耶鲁华裔研究生遭枪杀案最新进展:嫌疑人案发三年后首次认罪
-
2024-03-05 03:04:03
-
- 全国政协委员刘尚希:对于平台经济的规范与治理,需要放在国际竞争的视野下
-
2024-03-05 03:01:47
-
- 乔布斯的牛皮信封,李想的公路高铁
-
2024-03-05 02:59:30
-
- 李飞飞,最火AI女王
-
2024-03-04 04:50:41
-
- 出海途中的战略对决:机器人企业的定制化与规模化
-
2024-03-04 04:48:26
-
- 马斯克和 Altman 的斗争,终于搞上了法庭
-
2024-03-04 04:46:10
-
- 留给谷歌CEO的时间不多了
-
2024-03-04 04:43:54
-
- 闷头搞钱的唯品会,难改夹缝生存现状
-
2024-03-04 04:41:38
-
- 炸串可串万店?继茶饮、咖啡后的下一个风口
-
2024-03-04 04:39:23
-
- 阿里云为何又“掀桌子”了?
-
2024-03-04 04:37:07
-
- 理想MEGA:为家而生,问界M9:技术使命
-
2024-03-04 04:34:51
-
- 阿里云大降价,谁最慌?
-
2024-03-04 04:32:35