后香农时代ICT领域的十大挑战问题 |《中国科学:数学》特邀综述
未来的世界将是一个万物互联的智能社会。任何人与物可以在任何时间、任何地点进行通信,信息基础设施可以为每个家庭、每个企业和每个社会提供数字化的智能服务。华为公司董事、战略研究院院长徐文伟等在《中国科学:数学》发表《后香农时代ICT领域的十大挑战问题》,文章从信息论的角度,重点阐述了在信息产生、信息传输和信息处理方面将面临的重大挑战,提出了解决这些挑战所要解决的重大数学问题。
信息编码和信息建模是信息产生环节的基本问题。信息论自从香农在1948年创立以来,一直沿着可靠通信的主旋律不断发展。信息未来将面临一个全行业的数字化,将有更多的传感器被部署,将产生更多的数据,现有的信息编码方式遇到前所未有的挑战,需要从信息产生的源头出发,研究更高效的信源编码方法从而实现信息的高效表示。未来信息服务的对象不仅仅是人,也包含机器,需要研究面向机器任务的高效的编码机制。语义通信作为高等生物通信的手段,需要研究语义通信的基本理论问题,超越经典的信息论,为未来的通信开辟一个新的理论体系。DNN作为智能化的一个重要手段,需要从基础上解决DNN的理论可解释性问题,确保DNN在信息系统中的安全可信、泛化和高效。信息联接模型作为信息世界的基本问题,近百年来一直吸引科学家不断探索。人-人、人-机和机-机联接的基本规律是什么?这将是解决网络服务质量与资源效率之间规律的本质问题。
图1 信息论-香农
文中提出语义信息论、通用数据的极致无损压缩、DNN的可解释性和网络流量建模及性能分析的数学问题。初步从概率论、逼近理论和统计物理的角度来探索语义信息论的进展和未来方向;充分利用序列之间的相关特性,发展一个通用的预训练模型,将提升编码中预测模型的准确率,并有望在无损压缩领域实现新的突破,大幅度提高信源编码的效率。信息论、偏微分方程理论和逼近论等有潜力突破DNN的可解释问题,为下一代人工智能奠定良好的基础。非线性期望理论作为概率论领域的一个新的工具,它从非独立同分布的假设出发,将给业务建模带来新的思路。基于非线性概率统计模型和微分方程的思路有可能发现新的业务模型,最终实现业务性能的可计算和可分析,支撑科学的网络建设。
信息传输效率是信息传输的核心问题。现代信息的传输方法在香农信息论的指导下,已经发展了70年,在点到点的信道容量方面已经趋近容量限。信道编码技术从卷积码、Turbo码发展到LDPC码和Polar码,编码效率已经逼近经典的香农限,需要进一步拓展空间等新的自由度,实现频谱效率的提升。传统的研究从点对点传输的角度去研究和探索信息效率问题,存在很大的局限性,需要从网络的视角来思考信息的整体传输效率问题。整体的信息系统存在信息的存储和计算,给信息的传输带来新的维度,需要从系统角度来探索整体最优性。自从1939年康托洛维奇创立了线性规划的方法以来,最优化理论不断得到发展,为建模和求解这一类问题奠定了基础。信息网络是一个十分复杂的巨系统,需要探索信息网络的最优和可达容量。人们也在探索新的信息网络覆盖模式,如空天地网络和海洋网络,从而把通信延伸到更加广阔的未知地带,如深海通信、深空通信、人体网络和分子网络。这些都为未来提供了新的创新空间和新的挑战。
图2 优化理论 康托洛维奇
文中提出了Massive MIMO容量域、光纤通信的非线性信道补偿和大规模通信网络的最优化控制的问题,提出建立新的信道模型将是解决无线信道容量的可能手段,并初步讨论通过新的模式去求解薛定谔方程来解决光的非线性问题。优化理论的突破给通信传输提供了一个新的思路,而通信网络面临的多目标、非线性、时变、非平稳的大规模优化问题,在很多场景下目标函数都无梯度,很难使用经典的凸优化理论,需要寻找新的优化工具和建立新的优化理论。
信息处理的效率问题将是制约未来可持续发展的瓶颈。传统的冯·诺依曼架构,有内存墙和功耗墙的问题。数据处理的搬移延迟太大,频繁访问内存导致的功耗太大,难以持续发展。新的计算模式不断涌现,诸如内存计算和存算一体等新的形态出现,大大提高了算力发展的潜力。从理论上我们需要探索传统的基于精确计算的模型是否可以持续发展的问题,需要找到一个理论体系解决高效计算问题,实现算力的可持续增长。
图3 计算机架构 冯·诺依曼 图4 计算数学 冯康
文中提出了反问题高精度快速求解、高性能代数几何码的快速译码和大规模网络近似计算的问题。反问题是解决存储和计算的介质材料发现和信号处理的重要问题,文中还初步讨论了光的反问题在存储上的潜在突破方向。在1964年,冯康提出了数值求解偏微分方程的有限元法,对于这一类问题作出了重要的贡献,他在有生之年积极推动反问题研究,并培养了大量的优秀人才。受未来半导体向更快和更低功耗发展的影响,半导体的物理电气特性将由确定型向概率型转变,存储和计算的出错将成为常态,需要考虑由不可靠元件来实现可靠存储和计算功能,需要探索更高效的编码技术,寻找更好性质的代数曲线和快速变换方法有助于实现代数几何码的突破。功耗问题已经成为制约信息传输容量进一步提升和信息深度计算的首要问题,而传统的精确计算的范式将难以为继,需要从算法理论和计算模型上寻找近似计算方法,压缩感知、Sketch理论、高维随机采样和张量理论将有助于建立新的近似计算理论,实现近似计算领域的突破。
总而言之,本文从信息的产生、传输、处理三大领域讨论了可能影响未来信息产业发展的十个挑战以及相关的数学问题,并给出每个问题的可能的研究方向,希望以此吸引数学领域的专家关注此问题,并与产业界共同开展研究,通过解决这十大问题而推动信息产业的持续发展。
(文中图片来源于网络)
作者简介:
徐文伟,现任华为公司董事、战略研究院院长。长期致力于通信产品研发和产业拓展,是我国通信产业赶超欧美、跻身世界先进的领军人物之一。目前负责华为5-10年基础技术研究和产业布局。2018年提出并实施华为创新2.0战略,以愿景及世界级难题出发,将工业界的挑战与高校科研相结合,牵引华为从工程创新到技术发明的转变,布局未来,确保华为“不迷失方向,不错失机会”。主要研究包括:信息与通信领域相关的下一跳技术,以及光子计算和裸眼3D等关键技术研究,致力于推动通信产业的创新和发展。
徐文伟担任中国通信学会副理事长、中国光学工程学会副理事长、北京大学兼职教授等。提出《后香农时代,面向数学的十大挑战问题》,引起学术界广泛关注,并成为《中国科学院院刊》2020年最受公众欢迎的十大热文第一名。受邀在IEEE GLOBECOM 2020年会上做主旨报告,于2021年在《中国科学:数学》上发表了《后香农时代ICT领域的十大挑战问题》。
徐文伟1991年加入华为研发部,是华为第一代创业者和核心技术提出、规划和攻关组织者。早在1991年就开发了华为第一颗芯片,并创立了芯片设计中心并任主任,后改名海思半导体,并担任首任总裁,创建了“系统创新+芯片设计一体化”产品研发模式,为华为产品竞争力的构建和海思半导体成为全球领先芯片设计公司打下基础。
30年来先后主持华为第一代局用程控交换机、第一套GSM移动交换系统、第一台数据中心核心交换机等一系列重大产品的研发,为华为从自立到自强再到引领和卓越、以及我国通信产业发展作出了突出贡献。
阅读全文可点击链接:https://www.sciengine.com/publisher/scp/journal/SSM/51/7/10.1360/SSM-2021-0013?slug=fulltext
本文转载自《中国科学》杂志社微信公众号(scichina1950)