西班牙AI独角兽发布全球最小AI模型, 量子压缩技术成核心竞争力
2019年,在自己和其他两位合作者的论文发表之后,西班牙物理学家罗曼·奥鲁斯(RománOrús)的电话开始响个不停。电话那头是摩根大通等大型机构的工作人员,他们对论文结果表现出浓厚兴趣。这让奥鲁斯和其他论文作者意识到,他们掌握了一项强大且独特的技术,于是决定成立一家公司,并由奥鲁斯担任联合创始人和首席科学家。
如今这家名为MultiverseComputing的西班牙公司已经6岁了,它被西班牙发行量最大的日报之一《国家报》(ELPAÍS)称之为西班牙在量子计算领域的巨大希望[1]。
近日,该公司发布了两款极为小巧的AI模型,它们的命名灵感源自于鸡脑和苍蝇脑,并采用了量子压缩技术。该公司称这两款模型是全球体积最小却仍保持高性能的模型,其中一款甚至能同时处理聊天、语音及推理任务。这些微型模型旨在嵌入物联网设备,同时支持在智能手机、平板电脑和个人电脑等设备上本地运行。据了解,该公司能将模型压缩到足以适配各类设备的程度,用户可以在本地运行它们,也可以直接在iPhone或AppleWatch上使用。
其中:
第一款模型的名字叫做“超级苍蝇(SuperFly)”,是该公司基于HuggingFace开源模型SmolLM2-135打造的压缩版。原版模型拥有1.35亿参数,专为设备端使用开发。而SuperFly的参数缩减至9400万,奥鲁斯将其大小比作苍蝇的大脑。他表示,SuperFly可用于在受限数据上接受训练。该公司设想将其嵌入家用电器,让用户能通过语音指令操作设备,比如对洗衣机说“启动快速洗涤”,或提出故障排查问题。在相关演示中,该公司还展示了该模型可以借助小型处理器来支持语音交互的能力。
第二款模型的名字叫“鸡脑(ChickBrain)”,参数规模更大达到了32亿,但是功能也更强大,具备一定的推理能力。它是该公司基于MetaLlama3.18B模型打造的压缩版,但却小巧到能在MacBook上运行,并且无需联网。更重要的是,在多项标准基准测试中,ChickBrain的表现甚至略优于原版模型。
这两款新模型的体积非常小,几乎能为所有物联网设备赋予聊天AI功能。目前,该公司尚未公开SuperFly的基准数据,不过该模型的目标场景本身就不涉及到推理需求。基于此,其仅仅公布了针对ChickBrain的内部基准测试结果。
总的来说,此次推出的全球最小的高性能AI模型,挑战了AI系统日趋庞大复杂的传统趋势。其能在不降低性能的前提下大幅缩减现有AI模型的规模,这一突破有望改变AI的部署格局,推动设备端处理成为可能,并能带来离线功能、增强隐私保护、降低延迟及减少运营成本等优势。
据了解,MultiverseComputing公司总部位于西班牙多诺斯蒂亚,目前在全球拥有约100名员工。如前所述,一切要始于2019年。当时奥鲁斯与目前在该公司担任CTO的塞缪尔·穆格尔(SamuelMugel)、以及目前在该公司担任CEO的恩里克·利萨索·奥尔莫斯(EnriqueLizasoOlmos)共同发表了一篇关于量子计算在金融领域应用的论文。
这篇论文指出尽管机器学习算法通常效率极高,但其训练过程的计算成本可能很高。通过使用量子退火器训练神经网络,这种开销可大幅降低。一旦完成训练,该算法即可在任何经典计算机上运行。这篇论文在当时给出了如下推测:与标准训练方法相比,这种方法更不易陷入局部最小值。在相关理念的早期实现中,已有研究团队利用D-Wave量子计算机高效训练玻尔兹曼机。这一成果得以实现的原因在于,神经网络的运行并不需要通用量子计算机。玻尔兹曼机在物理上可理解为经典伊辛模型,其中自旋间耦合和局部磁场经过精细调节,使得部分自旋的热残余概率分布能模拟输入的训练概率。尽管玻尔兹曼机并非深度学习网络,但是这篇论文预计当时这些原理性研究将成为后续实现突破性进展的第一步。
与传统计算使用0和1的经典比特不同,量子计算采用一种名为“量子比特(qubit)”的单位。这使得单个量子比特能承载比普通比特更多的信息,从而能够开启新的计算可能。奥鲁斯告诉媒体,与MultiverseComputing公司签订首份合同的机构是西班牙对外银行。该银行希望解决金融领域最棘手的难题之一:投资组合优化,即确定精准的买卖时点,以实现收益最大化和风险最小化。这是金融领域的一个“硬骨头”问题,因为要得出最优解“需要调动全部的计算能力”。
2022年11月30日对于奥鲁斯来说是一个激动人心的日子。当天,ChatGPT的商业版本正式上市。奥鲁斯认为这是测试量子计算潜力的最佳案例,但他发现OpenAI的这款明星产品效率低下,因为其训练过程耗费了大量能源和资源。因此他和同事意识到,他们可以运用自身经验来压缩语言模型,同时无需牺牲精度。压缩之后不仅能大幅节省能源,还能让这项技术在无需联网的便携式设备上运行。此外,用户无需将信息分享给第三方,同时也解决了隐私问题。他们将这款模型压缩技术命名为CompactifAI。CompactifAI是一种受量子技术启发的压缩算法,能够在不牺牲模型性能的前提下减小现有AI模型的体积。与此同时,这一压缩技术不同于计算机科学或机器学习领域常用的传统压缩技术,因为这一技术源自量子物理学,所以是一种更精妙、更精细化的压缩算法。
后来,这项技术为该公司打开了在卫星、无人机、潜艇乃至汽车上部署技术的大门。与此同时,也吸引到了相关政府的关注,比如西班牙政府通过西班牙技术转型公司于2025年3月向这家企业投资6700万欧元。2025年6月,凭借CompactifAI这一模型压缩技术其完成了1.89亿欧元(约合2.15亿美元)的融资,这也是西班牙本年度规模最大的融资交易之一。
除了上述两款模型之外,该公司在更早之前已经发布了多个开源模型的压缩版本,比如Llama4Scout、MistralSmall3.1等热门小型模型。此外,它还推出了基于OpenAI两款新开源模型的压缩版,同时也对部分超大型模型进行了压缩,例如它研发了DeepSeekR1Slim版本。由于该公司的核心业务是缩小模型体积,因此它格外专注于研发体积最小却性能最强的模型。该公司将这一系列模型命名为“模型动物园(ModelZoo)”,因为所有产品的名称均以动物大脑尺寸为灵感命名。需要注意的是,该公司并未宣称“模型动物园(ModelZoo)”能在这类基准测试中击败最先进的大型模型,甚至这一模型库的性能可能还无法跻身排行榜。但是,该公司表示关键在于其技术能够在不损失性能的前提下缩小模型规模,在增强隐私保护的同时还能降低成本,这将让AI从对云端的依赖转向消费设备中的本地化处理。
奥鲁斯称,公司目前正在和家电制造商洽谈合作。比如,其曾和苹果、三星、索尼、惠普等公司洽谈。惠普公司在最近一轮融资中还成为了投资方。与此同时,在最近一轮融资中东芝公司也是投资方之一。另据悉,这家公司还为图像识别等其他机器学习形式提供技术支持,自创立以来已经获得巴斯夫、博世等客户。除了直接向大型设备制造商销售模型外,该公司还通过亚马逊云科技上托管的API提供其压缩模型,不仅任何开发者都可以使用,而且其表示token费用低于竞争对手。总的来说,该公司已经成为全球最大的量子计算与AI软件公司之一,并被CBInsights评为全球最具潜力的AI公司之一,以及被欧洲媒体Sifted评为南欧增长最快的100家初创企业之一。
另据悉,担任该公司联合创始人兼首席科学家的奥鲁斯是一名西班牙理论物理学家,他同时也在西班牙多诺斯蒂亚国际物理中心(DIPC,DonostiaInternationalPhysicsCenter)担任教授,专攻量子信息科学和量子张量网络领域。早年,他在西班牙巴塞罗那大学取得博士学位。之后,他先后工作于澳大利亚昆士兰大学、德国马克斯·普朗克量子光学研究所、德国美因茨约翰内斯·古腾堡大学担任初级教授。此前,他曾撰写大量关于量子研究的论文,累计被引用数千次,在复杂量子系统和应用量子计算领域做出了一定贡献。
该公司的创始人兼CEO恩里克·利萨索·奥尔莫斯(EnriqueLizasoOlmos),则拥有西班牙巴塞罗那大学生物统计学博士学位,并拥有一定的银行业从业经验。
该公司的CTO塞缪尔·穆格尔(SamuelMugel)博士毕业于英国南安普顿大学。目前,主要致力于将公司的量子技术用于赋能业界。
参考资料:
运营/排版:何晨龙