这家芯片初创企业力求打破AI领域棘手的内存墙难题- 安徽新闻

这家芯片初创企业力求打破AI领域棘手的内存墙难题

fyradio.com.cn 7 2026-04-28 21:16:06

　　超大规模 AI 模型令服务器不堪重负，高端芯片频繁闲置。一批谷歌与元宇宙（Meta）资深从业者称，他们已找到解决方案。

这家芯片初创企业力求打破AI领域棘手的内存墙难题

　　内容摘要

　　Majestic Labs AI 研发出全新服务器系统‘普罗米修斯’，旨在突破超大 AI 模型运行中的内存墙性能瓶颈。

　　一支由谷歌（Alphabet 旗下）与 Meta 前核心高管组成的团队，研发出全新服务器架构，用以解决当下 AI 模型体量日趋庞大、复杂度飙升所带来的运行难题。

　　Majestic Labs AI 由奥弗・沙查姆、真澄・莱德斯与沙・拉比伊联合创立。该公司于去年 11 月宣布完成 1 亿美元融资，投资方包括波威夫资本、勒克斯资本、格罗夫资本等机构。三位创始人曾就职于谷歌，负责设计并研发第一代数据中心及移动端芯片，后加入 Meta 现实实验室，牵头组建定制芯片研发团队。

　　这家初创企业坐落于加州洛斯阿尔托斯一间布局简约、地处普通商业街区的办公楼内。目前，其自研全新芯片有望攻克内存墙—— 这一当下愈发普遍的算力瓶颈，严重制约 AI 模型的响应速度。

　　Majestic 全新服务器系统命名为普罗米修斯（Prometheus），搭载数百颗自研 AIU（人工智能处理单元）芯片。创始人表示，该服务器的内存容量是英伟达等竞品 GPU 的1000 倍，完美适配数万亿参数级超大型 AI 模型的运行需求。

　　拉比伊指出，受内存限制，当下顶级大模型依靠现有基础设施，商业化落地已越来越不具备可行性。即便高端芯片算力强劲，但因需要跨芯片调取额外内存，长期处于等待状态，造成算力空转、资源浪费。

　　为破解该痛点，Majestic 新款单台服务器可扩容至128TB 高速内存，足以流畅运行 5 万亿至 10 万亿参数规模的 AI 模型，且内存配置支持按客户需求定制。

　　公司首席执行官沙查姆常驻特拉维夫，在视频采访中表示：“这是行业内首款以内存为核心设计的 AI 处理器，专门适配超大型模型所需的海量内存规格。”

　　智能体 AI 快速普及，各类自主 AI 机器人广泛应用于代码编写等场景，导致全球企业算力资源严重短缺。高端芯片租赁价格大幅上涨，不少 AI 服务频繁停机限流、被迫限制用户使用频次。

　　市场对高算力、低功耗、可快速完成推理任务的芯片需求暴增，也为 Majestic 等数十家软硬件初创企业打开了发展窗口期。

　　各大科技巨头也纷纷加码布局。超威半导体（AMD）大力宣传新一代芯片的推理适配能力；去年年末，英伟达斥资 200 亿美元收购芯片企业 Groq 的技术授权并吸纳其核心管理团队，近期又发布一款专为推理场景打造的自研芯片服务器。

　　上周，谷歌云官宣新一代 TPU 张量处理器，采用训练芯片 + 推理芯片双芯片架构设计，重点强化高带宽内存配置。另一推理芯片新锐企业 Cerebras 今年与亚马逊云达成重大合作，并于 4 月初递交 IPO 上市申请。

　　Majestic 创始人认为，当前市面所有推理解决方案，均无法满足未来超巨型 AI 模型的海量内存需求。拉比伊比喻称，这迫使企业用户被迫超额采购冗余算力，只为换取足够内存，“好比只是需要一个车库，却被迫买下一整栋房子”。

　　企业后续发展面临一大挑战：服务器所需内存芯片持续紧缺，多数厂商预计短缺问题至少延续至明年。对此，Majestic 选择全面采用通用 DRAM 内存缓解供应链压力；相较于高带宽内存（HBM），通用 DRAM 应用更简单、成本更低。而 HBM 因需多层芯片三维堆叠的复杂工艺，生产周期更长、产能受限。

　　创始人透露，公司核心技术壁垒在于自研互联架构，可在低功耗前提下，实现处理器与百 TB 级海量内存高速互联，数据传输速率超越传统 HBM。

　　Majestic 已锁定多家合作客户，预计从 2027 年起落地合作，对应潜在营收规模达数亿美元；因协议仍处于保密阶段，暂未披露客户名称。