这家芯片初创企业力求打破AI领域棘手的内存墙难题

fyradio.com.cn 7 2026-04-28 21:16:06

  超大规模 AI 模型令服务器不堪重负,高端芯片频繁闲置。一批谷歌与元宇宙(Meta)资深从业者称,他们已找到解决方案。

这家芯片初创企业力求打破AI领域棘手的内存墙难题

  内容摘要

  Majestic Labs AI 研发出全新服务器系统‘普罗米修斯’,旨在突破超大 AI 模型运行中的内存墙性能瓶颈。

  一支由谷歌(Alphabet 旗下)与 Meta 前核心高管组成的团队,研发出全新服务器架构,用以解决当下 AI 模型体量日趋庞大、复杂度飙升所带来的运行难题。

  Majestic Labs AI 由奥弗・沙查姆、真澄・莱德斯与沙・拉比伊联合创立。该公司于去年 11 月宣布完成 1 亿美元融资,投资方包括波威夫资本、勒克斯资本、格罗夫资本等机构。三位创始人曾就职于谷歌,负责设计并研发第一代数据中心及移动端芯片,后加入 Meta 现实实验室,牵头组建定制芯片研发团队。

  这家初创企业坐落于加州洛斯阿尔托斯一间布局简约、地处普通商业街区的办公楼内。目前,其自研全新芯片有望攻克内存墙—— 这一当下愈发普遍的算力瓶颈,严重制约 AI 模型的响应速度。

  Majestic 全新服务器系统命名为普罗米修斯(Prometheus),搭载数百颗自研 AIU(人工智能处理单元)芯片。创始人表示,该服务器的内存容量是英伟达等竞品 GPU 的1000 倍,完美适配数万亿参数级超大型 AI 模型的运行需求。

  拉比伊指出,受内存限制,当下顶级大模型依靠现有基础设施,商业化落地已越来越不具备可行性。即便高端芯片算力强劲,但因需要跨芯片调取额外内存,长期处于等待状态,造成算力空转、资源浪费。

  为破解该痛点,Majestic 新款单台服务器可扩容至128TB 高速内存,足以流畅运行 5 万亿至 10 万亿参数规模的 AI 模型,且内存配置支持按客户需求定制。

  公司首席执行官沙查姆常驻特拉维夫,在视频采访中表示:“这是行业内首款以内存为核心设计的 AI 处理器,专门适配超大型模型所需的海量内存规格。”

  智能体 AI 快速普及,各类自主 AI 机器人广泛应用于代码编写等场景,导致全球企业算力资源严重短缺。高端芯片租赁价格大幅上涨,不少 AI 服务频繁停机限流、被迫限制用户使用频次。

  市场对高算力、低功耗、可快速完成推理任务的芯片需求暴增,也为 Majestic 等数十家软硬件初创企业打开了发展窗口期。

  各大科技巨头也纷纷加码布局。超威半导体(AMD)大力宣传新一代芯片的推理适配能力;去年年末,英伟达斥资 200 亿美元收购芯片企业 Groq 的技术授权并吸纳其核心管理团队,近期又发布一款专为推理场景打造的自研芯片服务器。

  上周,谷歌云官宣新一代 TPU 张量处理器,采用训练芯片 + 推理芯片双芯片架构设计,重点强化高带宽内存配置。另一推理芯片新锐企业 Cerebras 今年与亚马逊云达成重大合作,并于 4 月初递交 IPO 上市申请。

  Majestic 创始人认为,当前市面所有推理解决方案,均无法满足未来超巨型 AI 模型的海量内存需求。拉比伊比喻称,这迫使企业用户被迫超额采购冗余算力,只为换取足够内存,“好比只是需要一个车库,却被迫买下一整栋房子”。

  企业后续发展面临一大挑战:服务器所需内存芯片持续紧缺,多数厂商预计短缺问题至少延续至明年。对此,Majestic 选择全面采用通用 DRAM 内存缓解供应链压力;相较于高带宽内存(HBM),通用 DRAM 应用更简单、成本更低。而 HBM 因需多层芯片三维堆叠的复杂工艺,生产周期更长、产能受限。

  创始人透露,公司核心技术壁垒在于自研互联架构,可在低功耗前提下,实现处理器与百 TB 级海量内存高速互联,数据传输速率超越传统 HBM。

  Majestic 已锁定多家合作客户,预计从 2027 年起落地合作,对应潜在营收规模达数亿美元;因协议仍处于保密阶段,暂未披露客户名称。

上一篇:人闲钱不闲!多家理财公司推出“五一”专属方案,买对多享7天收益
下一篇:长沙银行:2025年实现归母净利润81.08亿元,同比增长3.59%
相关文章