AI控制量子纠错系统能够学习
学习量子误差校正:图像在解决任务时,图像可视化erlangen研究人员神经网络中的人工神经元的活动。© Max Planck光明科学研究所
神经网络能够为基于量子物理学的计算机进行纠错策略的学习
量子计算机可以解决超出传统计算机功能的复杂任务。然而,量子状态对他们的环境不断干扰非常敏感。该计划是使用基于量子纠错的主动保护来打击这一点。Max Planck Light科学研究所的主任Florian Marquardt,他的团队现在已经介绍了一种夸张的纠错系统,可以感谢人工智能学习。
2016年,计算机程序Alphago赢得了四场比赛中的四场比赛,反对世界上最好的人类球员。鉴于去的游戏比宇宙中的原子有更多的动作组合,这需要不仅仅是纯粹的处理能力。相反,alphano使用人工神经网络,可以识别视觉模式并且甚至能够学习。与人类不同,该计划能够在短时间内练习数十万场比赛,最终超过最好的人类播放器。现在,基于Erlangen的研究人员正在使用这种神经网络来开发量子计算机的纠错学习。
人工神经网络是计算机程序,其模仿互联神经细胞(神经元)的行为 - 在埃尔兰根的研究的情况下,大约两千人的人造神经元彼此相连。“我们将最新想法从计算机科学中应用于物理系统,”弗洛里安马克斯解释道。“通过这样做,我们从人工智能领域的快速进步获利。”
人工神经网络可以超过其他纠错策略
第一个应用领域是量子计算机,如最近的纸张所示,其中包括托马斯Fösel,Max Planck Institute in Erlangen的博士生博士生的重要贡献。在论文中,该团队展示了具有alphago启发架构的人工神经网络能够学习 - 为自己 - 如何执行一个对未来量子计算机的操作至关重要的任务:量子误差校正。甚至存在展望,具有足够的培训,这种方法将超过其他纠错策略。
要了解它涉及的内容,您需要查看量子计算机的工作方式。量子信息的基础是量子位或QUBit。与传统的数字位不同,Qubit不仅可以采用两个状态零和一个,还可以采用两个状态的叠加。在量子计算机的处理器中,甚至存在多个Qubits作为关节状态的一部分。这种纠缠在解决传统计算机注定失败的某些复杂任务方面,解释了量子计算机的巨大处理能力。缺点是量子信息对来自环境的噪声非常敏感。Quantum World的这种特性和其他特点意味着量子信息需要定期维修 - 即量子误差校正。但是,这需要的操作不仅是复杂的,而且还必须将量子信息本身完好无损。
Quantum exter-Crotention就像一个与奇怪的规则一起去的游戏
“你可以想象量子电脑的元素就像一个去的董事会一样,”Marquardt说,在他的项目背后的核心想法上。Qubits在板上分布在板上。然而,与传统的GO游戏有某些关键差异:所有这些碎片已经分布在电路板上,并且每个部分都在一侧是白色的,另一侧是白色的。一种颜色对应于状态为零,另一个颜色为一个,并且在Quantum的游戏中的移动涉及转动碎片。根据量子世界的规则,该件还可以采用灰色混合,代表量子态的叠加和纠缠。
谈到玩游戏时,一名球员 - 我们会叫她的爱丽丝 - 使旨在保留代表某个量子状态的模式的动作。这些是量子纠错操作。与此同时,她的对手尽一切都可以摧毁模式。这代表了来自其环境的真正Qubits经验的血红蛋白的恒定噪声。此外,通过特殊量子规则尤其困难,Quantum Go的游戏:爱丽丝在比赛中不允许看看董事会。任何揭示揭示Qubit块的状态到她摧毁了游戏目前占据的敏感量子状态。问题是:尽管如此,她怎样才能做出正确的动作?
辅助额度显示量子计算机中的缺陷
在量子计算机中,通过定位存储实际量子信息的Qubits之间的附加Qubits来解决这个问题。可以采取偶尔测量来监视这些辅助额度的状态,允许量子计算机的控制器识别故障位于这些区域中的信息携带Qubits上的校正操作。在我们的量子游戏中,辅助Qubits将由分布在实际游戏件之间的额外部分来表示。允许爱丽丝偶尔看,但只在这些辅助件。
在Erlangen研究人员的工作中,Alice的角色由人工神经网络进行。这个想法是,通过培训,网络将变得如此擅长这个角色,即他们甚至可以通过智力人体思想所设计的校正策略来实现这一角色。然而,当团队研究了一个涉及五个模拟Qubits的示例时,对于传统计算机仍然可管理的数字,他们能够仅表明单独的一个人工神经网络是不够的。由于网络只能收集有关量子位状态的少量信息,或者更改量子的游戏,它永远不会超越随机试验和错误的阶段。最终,这些尝试摧毁量子状态而不是恢复它。
一个神经网络利用其先前的知识来训练另一个
该解决方案以额外的神经网络形式,其作为教师到第一网络。凭借其要控制的量子计算机的先验知识,该教师网络能够培训其他网络 - 其学生 - 因此指导其对成功量子校正的尝试。然而,首先,教师网络本身需要对量子计算机或其组件来学习足够的。
原则上,人工神经网络使用奖励系统培训,就像他们的自然模型一样。提供了通过量子纠错成功恢复原始量子状态的实际奖励。“但是,如果只有实现这一长期目标的成就给出了奖励,那么它将在众多纠正尝试中出现太迟的阶段,”Marquardt解释道。因此,基于Erlangen的研究人员制定了奖励系统,即使在培训阶段,也会激励教师神经网络采用有希望的策略。在Quantum Go的游戏中,这个奖励系统将在给定时间提供Alice指示游戏的一般状态,而不会赠送细节。
学生网络可以通过自己的行动超越老师
“我们的第一个目的是为教师网络学习在没有进一步的人类帮助的情况下学习成功的量子纠错操作,”Marquardt说。与学校学生网络不同,教师网络不仅可以基于测量结果,还可以在计算机的总量子状态上进行。由教师网络训练的学生网络首先将同样擅长,但通过自己的行动可能会变得更好。
除了在量子计算机上的纠错之外,Florian Marquardt还设想了人工智能的其他应用。在他看来,物理学提供了许多可以从人工神经网络使用模式识别中受益的许多系统。
出版物:ThomasFösel等,“用Quantum反馈的神经网络加固学习,”物理评论X,2018; DOI:10.1103 / physrevx.8.031084