院校浏览 > 正文

清华大学新突破:“太极-Ⅱ”光芯片首次实现大规模光训练

2024-08-12 14:13:26 | 清华大学 |

  据清华大学官方消息,该校电子工程系方璐教授课题组、自动化系戴琼海院士课题组另辟蹊径,首创了全前向智能光计算训练架构,研制了“太极-II”光训练芯片,实现了光计算系统大规模神经网络的高效精准训练。

  该研究成果以“光神经网络全前向训练”为题,于北京时间 8月7日在线发表于《自然》期刊。
  该论文由清华大学电子系作为第一单位,方璐教授和戴琼海教授担任通讯作者,博士生薛智威和博士后周天贶为共同第一作者,博士生徐智昊和之江实验室虞绍良博士参与研究。课题得到国家科技部、国家自然科学基金委、北京信息科学与技术国家研究中心、清华大学-之江实验室联合研究中心的支持。
  Nature审稿人在审稿评述中指出“本文中提出的想法非常新颖,此类光学神经网络(ONN)的训练过程是前所未有的。所提出的方法不仅有效,而且容易实现。因此,它有望成为训练光学神经网络和其他光学计算系统的广泛采用的工具。”
  该研究利用光子传播对称性,将神经网络训练中的前向与反向传播都等效为光的前向传播。在太极-II架构下,梯度下降的反向传播转化为光学系统的前向传播,训练过程仅需两次前向传播,具有天然对齐特性,确保了物理梯度的精确计算。这种训练方法精度高,支持大规模网络训练,且不再依赖电计算进行离线建模与训练。
  太极-II光训练芯片以光为计算媒介,利用光的全前向传播实现训练,大幅提升了光网络训练的速度与能效。研究表明,太极-II能够对多种不同光学系统进行训练,并在各种任务下表现出卓越性能。在大规模学习领域,太极-II将数百万参数的光网络训练速度提升了1个数量级,智能分类任务的准确率提升了40%。在复杂场景智能成像方面,太极-II在弱光环境下实现了5.40×10^6 TOPS/W的全光处理,系统级能效提升了6个数量级。在非视域场景下,实现了千赫兹帧率的智能成像,效率提升了2个数量级。在拓扑光子学领域,太极-II能够自动搜索非厄米奇异点,为解析复杂拓扑系统提供了新思路。
  太极-II的问世,进一步揭示了智能光计算的巨大潜力。太极I和II分别实现了高能效AI推理与训练,共同构成了大规模智能计算的完整生命周期。方璐表示,太极系列将为未来AI大模型注入算力发展的新动力,构建光算力的新基座。
  目前,研究团队正积极推进智能光芯片产业化,在多种端侧智能系统上进行了应用部署。预计智能光计算平台将以更低的资源消耗和更小的边际成本,为人工智能大模型、通用人工智能、复杂智能系统的高速高能效计算开辟新路径。
清华大学 太极-Ⅱ光芯片

今日TOP10