从Caffe到PyTorch,贾扬清的AI架构大神之路

2019-03-04 08:44:26来源:新智元  

知乎上爆出一则AI人事变动大消息——Caffe作者贾扬清将从Facebook离职。

短短数小时,就有近10万人浏览这个问题。不仅如此,据AI前线爆料,贾扬清离开Facebook之后将加盟阿里硅谷研究院担任VP,于今年3月11日正式入职。

新智元向贾扬清本人及阿里方面求证,对方均未回复。3月27号的ScaledML会议议程中,贾扬清也是作为Facebook AI架构总监出席。

另一方面,贾扬清离职的消息在业内已经传播,杜克大学教授陈怡然也发微博称:阿里硅谷研究院从此开启“一硬一软”两大学霸天王领导模式,在AI研究领域势如破竹。

陈怡然指的“硬”,就是美国某高校计算机架构方向的教授,而“软”就是贾扬清。

或许,对贾扬清本人来说这只是又一次“普通的换工作”,但考虑到他目前在Facebook的职位——AI架构总监,以及传言中的下一站——阿里达摩院硅谷实验室,这都将成为2019年最重要的人事动态之一。

从Caffe到PyTorch,贾扬清的AI架构大神之路

贾扬清以深度学习框架Caffe作者的身份闻名。清华本硕毕业后,在加州大学伯克利分校取得计算机科学博士学位,先后工作于新加坡国立大学、NEC美国实验室、谷歌大脑,2016年加入Facebook担任研究科学家,现任Facebook AI架构总监,负责前沿AI平台开发及人工智能研究。

贾扬清在伯克利读博期间开发了深度学习框架Caffe,全称“Convolutional Architecture for Fast Feature Embedding”,以优异的结构、性能和代码质量成为迄今最受欢迎、最成功的开源深度学习框架之一,对领域发展起到了极大的推动和影响。

后来,贾扬清加入谷歌大脑实习,期间参与了TensorFlow平台的开发。2016年2月,贾扬清加入Facebook,当时这一消息也在圈内引发了广泛讨论。详见新智元报道Caffe作者贾扬清:我为什么离开Google,加入Facebook?

此后,贾扬清在AI架构的大道上一路进击:

2016年11月,Facebook推出轻量级模块化的深度学习框架Caffe2Go,能在手机上运行深度神经网络模型。贾扬清代表团队在FB官网发文,“我们在移动设备上开发了一个新的深度学习平台,首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。……Caffe2Go 与Torch等研究工具链一起,构成了Facebook机器学习产品的核心。”

2017年4月,Facebook宣布开源产品级深度学习框架Caffe2,带来跨平台机器学习工具。Caffe2是 Caffe实验性的再造,制作时重点考虑了表现力、速度和模块化等特性。在2017年9月的一次测评中,Caffe2以79%的精度和149秒的运算时间,在TensorFlow、PyTorch、MXNet、CNTK等框架中排名第一。

2018年5月,Facebook正式公布PyTorch 1.0,这是基于PyTorch 0.4与Caffe2合并而成的框架,还整合了ONNX格式,旨在一个框架中统一研究和生产的能力。

从深度学习开源框架群雄割据,到现如今TensorFlow和PyTorch分庭抗礼,贾扬清也从Caffe作者走到了Facebook AI架构总监。

他担任了PyTorch 1.0项目的共同负责人,2017年创建了首个开放模型格式的原型,后来成了FB、微软、亚马逊和许多硬件供应商一起发布的ONNX。

从谷歌大脑、Facebook到阿里,换个地方继续飞

对于贾扬清的离职,Facebook软件工程师晓飞在知乎上给出了这样的回答:

对于大牛来说,从来不迷恋大公司的光环,平台只是实现自己职业发展的跳板。

或在大神环绕的环境里努力成长,学习核心技术,最终成为独当一面的技术大牛;或凭借自身优异的情商智商脱解决问题,和团队一起创造更多价值,最终成为能带领众人的团队领袖。

所以,在Caffe2+Pytorch合并,我司内部动荡,负面新闻不断的情况下,贾扬清的选择,无非是找到一个更适合自己发展的平台,换一个地方继续飞。

贾扬清是浙江绍兴人,早先在彭博新闻的一次采访中,当被记者问到未来是否会有回中国工作的可能性时,贾扬清表示:“这是一个比较复杂的问题,需要考虑到家庭和各方面的原因。”

过去几年,BAT等公司大举建立AI研究院,并且在美国尤其是硅谷、西雅图等IT重镇开设分部,吸引了一大美国的AI人才,当然其中有很多是华人。

这不仅仅是BAT在走出去,很大一部分原因也是为了降低已经在国外工作和生活多年的华人工程师和研究人员“回到”中国公司的门槛。就好像马化腾把研究院开到了微软对面,是因为很多研究人员“不愿意离开西雅图”。

2017年10月的云栖大会上,阿里巴巴宣布成立全球研究院——阿里巴巴达摩院,3年投入1000亿人民币吸引人才。达摩院在全球各地组建前沿科技研究中心,包括美国的圣马特奥(临近旧金山湾区)、贝尔维尤(华盛顿州)。

这次传言中贾扬清的下一站,大概率就是位于圣马特奥的达摩院硅谷研究院。

来源:Google Earth

来源:Google Earth

在Facebook最新的一篇文章中,贾扬清贴出了他参观杭州保俶塔的照片。

贾扬清在Facebook最新一篇文章中分享了游览杭州保俶塔

贾扬清在Facebook最新一篇文章中分享了游览杭州保俶塔

虽然保俶塔距离阿里巴巴总部仍然有很远的距离,但要入职阿里,哪怕是在硅谷研究院工作,但肯定先要去杭州总部办理相关手续,因此这张照片也为贾扬清加入阿里一说增加了可信度。

AI开源框架生态方兴未艾,业界还有诸多好戏

根据贾扬清LinkedIn页面介绍,他加入Facebook后,创建、发展和分拆了多个团队,现在统称为Facebook AI架构组 (Facebook AI Infrastructure)。

作为AI架构总监,他领导一支由研究人员和工程师组成的团队,全面构建Facebook的大规模人工智能平台,支持广告、Feed、搜索排名、计算机视觉、语音、自然语言处理、VR和AR应用程序等AI产品用例。

机器学习有可能解决世界规模的难题。但是,要支持重大工程问题,也就需要大规模可扩展的机器学习。如今,AI架构和平台的研究和开发具有越来越大的现实意义。

2018年4月,贾扬清在ScaledML大会上介绍了Facebook如何利用机器学习,包括Facebook用于机器学习的硬件和平台、框架。

Facebook的机器学习系统是一个支持20亿用户的平台

Facebook的机器学习系统是一个支持20亿用户的平台

针对Caffe2和PyTorch的合并,贾扬清在知乎上表示,将这两个框架整合起来可以极大提升开发效率,为广大开发者提供便利。

因为 PyTorch 有优秀的前端,Caffe2 有优秀的后端,整合起来以后可以进一步最大化开发者的效率。目前 FAIR 大概有超过一半的项目在使用PyTorch,而产品线全线在使用Caffe2,所以两边都有很强的动力来整合优势。

开发效率是我在 Facebook 非常重视的一个方向:去年年中的时候启动了ONNX项目(初版的代码是我亲自上手写的),然后帮助搭建了 ONNX team,增强不同框架甚至不同公司之间的协作;Caffe2 和 PyTorch 在代码层的合并也是从那个时候开始逐渐推动的一项内容。

2018年12月,阿里开源深度学习框架XDL,面向广告、推荐、搜索等场景,重点打造工业级分布式运行能力,并且能与TensorFlow、PyTorch等现有开源框架无缝对接。

贾扬清在朋友圈评价,XDL是“非常实际的工作,不在框架这个层面上重复造轮子,而是关注框架以上,应用以下的大规模计算抽象和系统抽象,这应该是开源框架稳定以后业界的大趋势”。

或许相比两年前,如今深度学习开源框架和编译器的生态似乎已经走入了较为稳定的时期,但竞争远远没有平息。接下来,随着AI技术大规模应用以及渗透到更多领域,或将涌现更多的AI引擎和产业级深度学习框架。

更重要的是,在目前AI框架领域,还缺乏出自中国的产品。无论是百度的PaddlePaddle,还是腾讯的Angel,都没有与TensorFlow、PyTorch或MXNet一较高下的实力。

如果贾扬清真的加入阿里,或许可以期待一个中国的框架登上大规模AI架构的舞台。总之,无论如何,期待大神的选择和未来。

标签: Caffe PyTorch 贾扬清 AI 架构

相关阅读

相关词

推荐阅读