您现在的位置:主页 > 新闻动态 >

周礼栋:现在是盘算机系统和网络研究“最好的时代”

时期:2023-05-05 02:47 点击数:
本文摘要:编者按:随时随地使用种种系统和工具,对现代人来说早已是司空见惯的事,但这一切完美事情的技术和服务并不是凭空泛起的。正是因为微软亚洲研究院副院长周礼栋博士和他领导的团队这样从事系统和网络研究事情的研发人员在幕后不停的努力和创新,才气保证种种技术无缝、稳定、高效、连续地协同举行。

im体育 官网

编者按:随时随地使用种种系统和工具,对现代人来说早已是司空见惯的事,但这一切完美事情的技术和服务并不是凭空泛起的。正是因为微软亚洲研究院副院长周礼栋博士和他领导的团队这样从事系统和网络研究事情的研发人员在幕后不停的努力和创新,才气保证种种技术无缝、稳定、高效、连续地协同举行。在本文中,周礼栋博士接受访谈,先容了在这个系统拥有前所未有的庞大性的时代,如何精进系统与网络的研究事情,解释了像CloudBrain这样的项目针对实时故障排查来解决云规模问题,也探讨了网络相关的“灰色故障”问题,并告诉我们为什么现在是系统和网络研究的“最好的时代”。

本文编译自微软研究院播客“The brave new world of cloud-scale systems and networking with Dr. Lidong Zhou”。周礼栋,微软亚洲研究院副院长主持人:作为微软亚洲研究院的副院长,您向导着盘算机系统和网络方面的研究,我知道您自己也从事许多研究。先简朴告诉我们您做了些什么,为什么要做这些事情。

让您天天起床的动力是什么?周礼栋:我认为现在是研究系统和网络最激感人心的时刻之一。系统和网络的进步推动了众多技术的生长,好比互联网、网络搜索、大数据、人工智能、云盘算等,现在我们每小我私家都依赖这些服务。

反过来,所有的这些技术希望又为系统和网络带来了前所未有的庞大性、规模性、动态性。而系统就是在杂乱中带来秩序,把所有那些原本毫无关联的部门整合成一个统一的整体。近年来,随着系统的生长,一些传统的系统专业知识,好比漫衍式系统、操作系统或网络,已经不足以解决我们面临的挑战。我们还必须掌握其它领域的知识,好比数据库系统、编程语言、编译器、硬件、人工智能、机械学习和深度学习等。

在微软亚洲研究院,我们把一个拥有差别专业知识的团队聚集起来,一起解决那些最具挑战性的问题。主持人:近20年的职业生涯中,您一直致力于推进漫衍式系统的理论和实践。请谈谈这些年来您到场的项目,以及您为漫衍式系统所做的技术孝敬。刚刚提到了系统的庞大性,您如何看待这些年的演变呢?周礼栋:我们正进入漫衍式系统的时代。

作为漫衍式系统研究人员,我们总是相信,我们在做最重要的部门。微软研究院拥有奇特而优越的联系理论和应用的研究和实践情况,让我们有时机相识产物团队面临的的技术挑战。在帮他们解决难题的同时,我们也有足够的灵活性,不局限于解决当前详细的问题,而是从更久远的视角深入思考问题的本质,思考开发什么样的新理论、新方法来应对这些挑战。

2000年头,当微软开始做网络搜索时,我和Roy Levin、Leslie Lamport等其时的同事一起和搜索的开发司理开会,相识他们遇到的漫衍式系统方面的挑战,并分享我们研究的漫衍式系统协议,它能保证漫衍式系统在种种故障下连续正常运行,并提供可靠的故障搜索服务。刚开始,开发司理认为他们可以自己实现故障处置惩罚和容错。

可是几个月之后,面临众多庞大的情况,他开始与我们互助,来支持和实现那些协议。在开发种种协议时,我们倾向于做一些假设,好比可以容忍的故障数量。当我们做研究时,这些假设是可行的。

但在实践中,我们必须思量假设不建立的极端情况。理论和实践是有区此外。在微软研究院事情的利益是,你可以接触真正的问题,让你相识哪些假设是合理的,哪些假设不合理,然后思考从更广泛的意义上解决这些问题的最好方法,而不只是停留在解决某个特定的问题。

主持人:除了技术难题的研究,您也一直致力于推动系统研究人员的社区生长,能否分享一下您推动亚太地域系统研究人员社区生长的履历?尤其是亚太系统研讨会(APSys)的生长及结果。周礼栋:一直以来,美国都拥有很是强大的系统社区。最近十几年,我们看到欧洲系统界的发展和壮大,欧洲的系统研讨会开始兴起,并生长成乐成的EuroSys集会。

康健的学术社区和学术集会可以极大地促进一个区域内的学术研究,吸引更多研究人员的到场。2010年,我已经在微软亚洲研究院事情,我和同事们想为亚太地域的系统社区孝敬一些气力。

于是,我们举行了第一个亚太系统研讨会(APSys)。那是一个很是小的开端,但今后它的生长远远超出了我们的预期。

今年8月我们将在杭州举行第十届APSys研讨会,来自世界各地的研究人员和专家都在为研讨会的乐成做孝敬,它的影响力已经远远超出了某个特定的地域。主持人:您把这归功于什么?周礼栋:首先这是自然趋势,这些年亚洲泛起许多技术进步,研究社区向亚太地域扩展是一定的。另一个原因,是整个社区真正走到了一起。

许多顶尖的系统研究人员都来自亚太地域,我们想回馈亚太的愿望很是强烈。主持人:2017年,在您的争取下,盘算机系统领域顶级集会操作系统原理研讨会(SOSP)乐成在上海举行,据我所知,竞标的难度堪比承办奥运会!周礼栋:SOSP是盘算机系统界最重要的集会之一,最月朔直在美国举行,厥后开始在欧洲国家轮流举行。

2011年开始,我们和上海交通大学的陈海波教授开始为亚太地域争取SOSP的举行时机,并获得了ACM SIGOPS的两任主席和许多同行的鼎力支持。经由三次努力,SOSP最终在2017年来到上海,吸引了创纪录的800多名参会专家。这次集会对亚太地域的系统研究的意义重大,我们很兴奋看到越来越多来自亚太的高质量研究泛起在顶级的系统学术集会上。

主持人:让我们谈谈教育。微软亚洲研究院举行的中国盘算机系统教学研讨会今年已经是第四届。图灵奖得主John Hopcroft歌颂它是“迈向改善教育和造就世界级人才的一步”,请分享您对这个研讨会的看法?周礼栋:首先,系统教育需要更进一步。

对微软亚洲研究院来说,我们很是自豪能通过研讨会未来自世界的系统研究和教育人员联系在一起,促进西欧和亚太地域的的交流。另外,通过研讨会,我们也致力于造就下一代系统科学家和工程师。在这个历程中,我们获得了像Lorenzo Alvisi、Robbert Van Renesse、Geoff Voelker等知名教授和中国系统界一线教授的支持,他们全情投入到场研讨会。

相信有这些充满激情的教授,我们将看到中国生长出更强大的新一代系统研究人员。主持人:您曾经提到,在云盘算和人工智能时代,我们设计系统的方式要发生基础性转变。哪些事情发生了变化?如何构建下一代系统?周礼栋:已往的30年里,盘算机系统界致力于系统可靠性的事情,开发了许多相关技术和网络协议,以为它们可以解决所有的问题。

这套机制源自上世纪70年月末的飞机可靠性机制研究和设计。我们凭据这类系统故障做了一些合理的假设,提出了现在仍然适用的网络协议。

但比起之前的系统,云盘算系统要庞大得多,生长也更迅速,已往的许多假设被打破,有时应用了所有的现有方法和理论都无法解决这个僵局。另一方面,已往的盘算系统很容易明白,但现在的庞大性已经超出了我们的明白。但许多新技术能带来更有趣的改变,例如机械学习和深度学习,我们可以将其应用于处置惩罚系统的庞大性,这是一个很是有前景的偏向。

主持人:让我们聊聊云时代的故障。在不那么庞大的“前云时代”,您如那边理异常和故障,现在又在实验哪些新方法呢?周礼栋:已往,我们研究的系统可靠性机制是基于过时的故障假设。可是,随着某些故障假设不再建立,我们界说了一种新的故障类型,“灰色故障”,一个系统组件不再是“非黑即白”,从某种角度看,它的行为是正确的,但在另外一个角度却不是。

“灰色故障”是许多云盘算系统宕机背后的主要原因。对我们而言,云盘算服务故障时时刻刻都在发生,可是很难找出哪些故障越发重要。

我们要相识故障,并进一步相识整个系统的运行情况。我们在试图弄清什么时候、何种情况下,灾难性的故障会发生,进而阻止它的发生。CloudBrain是一个云盘算自动故障清除的研究,使用系统规模来资助我们诊断问题,找出问题所在。

它有三个组成部门:一是准实时监控和诊断系统现在的状况,而不是在事后检察和分析系统日志;二是全局视图,不仅是对系统举行单次视察,而是融合对系统的所有视察,明白整个系统如何运行,哪个部门存在问题;三是统计推断:用统计方法真正推断出存在问题的部门。这个项目把大规模数据处置惩罚的挑战,转化成相识决系统庞大性的新手段。主持人:这个灰色故障的研究希望到了哪个阶段?周礼栋:我们离彻底解决问题另有距离,可是已经可以解决一些特定的问题,如DeepView和CloudBrain两个项目已经整合到Azure来处置惩罚与网络有关的问题。我们也在探索其它有趣而实用的想法,好比从思维方式上基础改变法式设计的范式。

以前的防御性编程设计强调的是完善的异常处置惩罚,但在大型庞大的系统中仅仅处置惩罚异常是不够的。因此,在我们最新的研究事情中,我们将异常处置惩罚的逻辑改为异常陈诉和汇总分析。实际上,我们也在构建一个系统,可以自动将传统的处置惩罚错误的代码转酿成以我们期待的方式举行错误陈诉的代码,这样开发者不需要重写整个代码库。

这为我们解决灰色故障提供了全新的思路和可能。主持人:您是如何来到微软研究院的?为我们分享一下您的职业生长。周礼栋:在我博士结业的时候,导师给了我一个很是简朴的建议,就是去那些能找到最好的同事的地方,去和那些可能有图灵奖水准的同事一起事情,所以我最终选择了微软研究院,那时,我们并没有图灵奖得主,十年后我们有两个!我以为同事很重要,特别是在我职业生涯的早期。从某种意义上我学会了如何做研究,不是发几多论文,而是推动研究的内在激情。

我职业生涯的第一阶段更多是小我私家生长,第二阶段是来到微软亚洲研究院,成为一个研究组的卖力人,这不仅关乎小我私家生长,也关乎着如何组建团队,如何资助他人乐成,为他人的乐成发生影响也可以带来极大的成就感。也是在那段时间里,我意识到自己的职责不仅仅是建设亚太地域最好的系统研究团队,还要为社区做出孝敬。

所以我们启动研讨会,并将集会带入亚太地域,另有人才造就和许多其它事情。在我看来,随着我们的职业生长,这些变得越来越重要。这就是我职业生涯的三个阶段:始于小我私家生长、小我私家学习,爱你所做的,做你所爱的;然后开始不停为他人的乐成做出孝敬,提高影响他人的能力,并努力地影响他人;最后是思考自己能为整个社区、整个社会做些什么。

我很幸运在这个历程中能结识许多优秀的向导和同事,并从他们身上学习到许多。主持人:我想请您对刚刚涉足系统和网络研究的研究人员提供一些建议,您认为即将泛起哪些尚未解决的重大问题?周礼栋:在这个时代从事盘算机系统和网络的青年研究员是很幸运的。

Butler Lampson曾说过他自己很是幸运,因为他履历了70年月末、80年月初的盘算范式厘革。而现在,我们也正处在一个厘革时期。上一次的盘算范式厘革中,施乐帕克研究中心的研究人员界说了以后30年的盘算机。

纵然是现在,我们仍然生活在他们界说的世界里:电脑、手机、鼠标、激光打印机、用户界面。上一次的盘算范式厘革的原因是盘算机变得越来越强大,能把一台巨型盘算机的盘算能力装进一台小我私家电脑里。现在的盘算能力到达了另一个里程碑,盘算能力将隐形于我们周围,盘算支持的智能将无处不在。

盘算机的虚拟世界和我们的物理世界之间的界线将会消失,这将带来新一次的范式厘革,我们的首要任务是要探索在接下来的十年二十年里,盘算到底意味着什么。我们必须从一个差别的角度来看待未来世界,而不仅仅是关注系统和网络协议的渐进式革新。

未来,我们不会是在电脑前才气举行盘算,而是可以使用身边无所不在的盘算能力。这一切都亟待我们年轻的研究人员通过研究和创新来实现。


本文关键词:周礼,栋,现在,是,盘算机,系,统和,网络,研究,im体育 官网

本文来源:im体育 官网-www.szhynm.com



Copyright © 2007-2022 www.szhynm.com. im体育 官网科技 版权所有 备案号:ICP备98216813号-5