芯间通信提速80倍!IBM实现下一代高速光互联技术

OFweek光通讯网 中字

新的共封装光学(CPO)技术创新,将有望取代数据中心内部的电气互连,为人工智能(AI)及其他计算密集型应用带来速度和能源效率方面的大幅提升。

近期,IBM宣布在光学技术领域取得了一项重大突破,该突破将深刻改变数据中心训练和运行生成式AI模型的方式。IBM的研究团队开发了一种全新的CPO工艺,这是下一代的光学连接技术,能够通过光速在数据中心内部实现连接,与现有的短距离电线形成互补。

为了实现这一技术,IBM的研究人员成功设计和组装了首个公开宣布的聚合物光波导(PWG)系统。这一成果展示了CPO如何重新定义计算行业在芯片、电路板及服务器间传输高带宽数据的方式。

目前,光纤技术已在远距离数据传输方面展现出卓越性能,几乎全球所有的商业和通信流量都依赖于光而非电进行管理。然而,在数据中心内部,机架间的通信仍主要依赖基于铜的电线。这些电线连接的GPU加速器在等待来自其他设备的数据时,可能有一半以上的时间处于闲置状态,这不仅造成了高昂的费用,还消耗了大量能源。

IBM的研究团队提出了一种将光学的速度和容量引入数据中心的新方法。在arXiv上发表的一篇论文中,IBM介绍了一种新的CPO原型模块,该模块能够实现高速光连接。这一技术将显著提升数据中心通信的带宽,最大限度减少GPU的闲置时间,并极大加速AI处理过程。具体而言,这项创新将带来以下变革:

与传统电气互连相比,能耗降低五倍以上,从而降低了扩展生成式AI的成本,同时使数据中心互连电缆的长度从1米延伸至数百米。

AI模型训练速度大幅提升,开发人员能够以传统电线五倍的速度训练大型语言模型(LLM),训练时间从三个月缩短至三周。

数据中心能源效率显著提高,每个AI模型所节省的能源相当于5000个美国家庭一年的用电量。

IBM高级副总裁兼研究总监Dario Gil表示:“随着生成式AI对能量和处理能力的需求不断增加,数据中心必须持续进化,而CPO技术正是推动数据中心迎接未来挑战的关键。”

“这一突破意味着未来的芯片将像光纤电缆一样,在数据中心内外以光速传输数据,开启一个更快、更可持续的通信新时代,足以应对未来AI工作负载。”

此外,CPO技术提供的带宽比现有的芯片间通信快80倍。随着芯片技术的不断进步,晶体管在芯片上的密度不断增加,IBM的2纳米节点芯片技术已能容纳超过500亿个晶体管。CPO技术旨在扩大加速器间的互连密度,使芯片制造商能够在电子模块上添加光通路,从而突破当前电通路的限制。

IBM的论文详细描述了这些新的高带宽密度光学结构,它们通过每个光通道传输多个波长,与电气连接相比,能将芯片间的带宽提高80倍。与目前最先进的CPO技术相比,IBM的创新使芯片制造商能够在硅光子学芯片的边缘添加六倍的光纤,即“海滨密度”。这些光纤的直径大约是人类头发的三倍,长度从几厘米到几百米不等,每秒能传输太比特的数据。IBM团队使用标准的组装封装工艺,在50微米间距的光学通道上组装了一个高密度PWG,与硅光子波导绝热耦合。

论文还指出,这些具有50微米间距PWG的CPO模块已通过了制造所需的所有压力测试,包括高湿环境、-40°C至125°C的温度以及机械耐久性测试,确保了光互连在弯曲时不会损坏或丢失数据。此外,研究人员已将PWG技术演示到18微米的间距,堆叠四个PWG可实现多达128个通道的连接。

这一突破延续了IBM在半导体创新领域的领先地位,包括首个2nm节点芯片技术、7nm和5nm工艺技术的实现、纳米片晶体管、垂直晶体管(VTFET)、单细胞DRAM和化学放大光刻剂等。CPO技术为满足AI日益增长的性能需求提供了新的解决方案,并有望取代模块外的电气通信方式。

IBM的研究人员在纽约奥尔巴尼完成了CPO的设计、建模和仿真工作,而原型组装和模块测试则在位于加拿大魁北克布罗蒙特的IBM工厂进行,该工厂是北美最大的芯片组装和测试基地之一,几十年来一直在芯片封装领域处于世界领先地位。

声明: 本网站所刊载信息,不代表OFweek观点。刊用本站稿件,务经书面授权。未经授权禁止转载、摘编、复制、翻译及建立镜像,违者将依法追究法律责任。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存