查看原文
其他

AlphaFold2领队Jumper奇人 - 我们需要什么样的复合型人材?

小王随笔 小王随笔 2023-01-13
在知乎和微信上看到多篇文章在探讨、分析AlphaFold2之余,将关注点移到 AlphaFold2 团队,而团队帅气的领头人 John M. Jumper 毫不例外地进入了大家的视野。

我想结合我对 John 的认识,浅浅地谈一谈我们需要什么样的复合型人才。

【图】来自 Deepmind。


John 是我的师兄,早我一年入校,早我两年入组。我们共有两位导师:卡尔和托宾。

卡尔是理论高分子物理与理论化学方向的老教授,美国艺术与科学院院士;他有一位长得极像的亲哥哥杰克是康奈尔大学化学系教授,美国科学院院士;兄弟俩出生于布鲁克林,毕业于哥伦比亚。

卡尔出生于1942年,银白头发,患有帕金森病,看上去比他的年龄还要老些;他的手很软很暖,握手时能感到因为帕金森病而产生的轻微颤抖;像是一个孩子,总爱说冷笑话,每三句就有一句笑话,常常是他自己先笑起来;老派的理论化学家,在黑板上裸推公式讲课的那种;一旦谈到学术,双眼直直的看着你,炯炯有神,此刻仿佛对他而言周围都不存在了似的,退休后也没有任何要离开研究一线的意思,—— 每年到了都去申请经费,时常铩羽,偶尔成功,每年还要发只有一个作者的 research article。

【图】卡尔(左,芝大化学系官网),杰克(右,康奈尔化学系官网)。


托宾是生物物理系的主席,哈佛毕业的冷原子实验物理博士,博后转向生物物理实验。托宾出生于1961年的加州圣迭戈,犹太人,戏称自己是California Jew,意为超世俗化的无神论犹太人;鹰钩鼻,浅棕头发,中等身材,胸围极阔,胳膊孔武有力;热爱运动,读博时卧推120公斤,同时全马跑进3小时30分,近60岁了还每周踢足球,曾一度让楼里与他不熟的中国学生以为他是40岁的老博后;思维跳跃,对数据和图标物理直觉极好,对学术问题一丝不苟,穷根问底,对发表的数据一定要查验再三,结论一定要求建立在坚实的数据和严密的逻辑上 —— 这也让组里的文章发得极慢。

【图】摄于2015.4,托宾持球。


卡尔和托宾对学生都极好,几乎在我们需要问问题时无时不在,也几乎在学术上完全放羊,给予学生在选题和研究方面极大的自由。

John 和我都受益于两位导师的教学法。



John 的成功得益于他四方面的知识和能力。

1

深厚的数学、物理学功底



John 出生于阿肯色的一个小农场主家庭,青年时帮家里养马,做农务;本科就读于离家不远的私立名校,范德比尔特大学(Vanderbilt U),学习理论物理。学士毕业后,他前往英国剑桥大学读理论凝聚态,但在剑桥只待了一年便回了美国。—— “Don’t like the weather there.” 他不喜欢那的天气。

严格的数学与物理学的科班训练,使得 John 在日后研究蛋白质折叠的分子动力学问题时,能够始终关注到模型背后的物理含义,特别是从统计力学方面的角度;而扎实的数学物理基础又使得他能准确、迅速地理解并掌握深度学习模型。

2

足够的蛋白质领域知识



从研究方向而言,这是我们的专业知识domain knowledge),John 本人对此的积累起始于他回到美国后。返美后,他去了位于纽约的“D. E. Shaw 研究所D. E. Shaw Research),研究蛋白质折叠和易辛模型 (Ising model)

D. E. Shaw 是一个很传奇的人。他从斯坦福大学计算机系博士毕业后敏锐地用优化的代码,在彼时还使用着低效代码的股票市场,以高频交易赚取了巨额利润,身家钜万。而后,他出于对科学研究的理想,创立了以自己名字命名的研究所,延揽软硬件方面的人才,从最基础的硬件架构开始设计专门用于模拟蛋白质的超级计算机以及程序。Shaw 成功了。他的研究所一度模拟出世界上最接近真实时间尺度的蛋白质运动轨迹。

John 是 Shaw 研究所的早期员工,参与了 2010 年其发表的著名 Science 论文 —— 《蛋白质结构动力学的原子级别刻画》。

【图】Shaw et al., Science 2010.


John 在 Shaw 研究所不仅积累了丰富的蛋白质折叠相关知识,而且实践了各种计算化学工具。例如,他自己为 Shaw 研究所开发了方便的轨迹可视化工具 —— 可同时检查轨迹内分子结构、体系能量、结构偏差值(RMSD)等多种分析函数曲线。

另一方面,公司内不同于学校的的工作研究环境令 John 的工作风格非常职业化(professional)。关于这点,我们后面展开说。

值得一提地,2010年前后,Shaw 给 John 的年薪超过20万美元。2011年,因为 John 的爱人来芝大读博,他也辞去工作同来芝加哥读书。入校后,学校提供的助教、助研工资不到3万。

3

高超的编程技能



John 的编程能力可能是我见识过的同学、同事里最高的;当然,我不了解 CS 专业,比较的对象都是身边化学、物理等方向的师友。

John 是很自负的,他不称自己是化学家,尽管我们都在化学系中,称自己是物理学家;与此同时,用他自己的话来说,“I’m a self-taught computer scientist.”(我是一个自学成才的计算机学家)。

熟悉并熟练地运用多种编程语言,如 python, C++, R, bash 等,现在已经被视为计算化学家的基本素养之一。我仍然想强调,会写和写得好,二者区别极大。

John 的博士工作,完全由他自己一人写了一套完整的原子精度的粗粒化的蛋白质分子动力学软件,名为 Upside,在GitHub上完全开源。—— 完全开源是我们组的一贯风格,任何我们发表的学术成果,都应当能够不仅能被我们自己完全重复,也必须能被他人重复。

极强的编程能力使得 John 一方面能快速实现自己的想法(idea)并测试,另一方面在得到测试反馈后能迅速进行新一轮的实验

一件逸事:
John 出于自己的性格原因,不喜远行开会,例如他从来不去领域内的生物物理年会。老板托宾每每代他讲解、展示、宣传实验方法和结果。我第一次看到托宾帮 John 做展示 PPT 和海报时依然震惊地问,你是教授,居然代学生做PPT海报?托宾的回答很直接,“我想让 John 有更多时间写程序,他走了,我招不到代码写得这么好的人了。


John 对电脑硬件也很熟。我刚入组时,John 得知芝加哥市政府的公共交通管理部门要处理一批一百多块旧CPU,他主动联系了他们,带着我去了他们的机房,一块块地将CPU拆下来,带回学校,再装到了我们自己的超算上。

【图】John 的博士工作简介。


4

深刻的深度学习理解 



John 很懂深度学习(deep learning),比组内任何人都懂得多得多得多。研究上,能与 John 在学术上交流乃至交锋的只有与我们合作的芝大丰田中心的王晟博士。

这也意味着,无论是卡尔还是托宾,都无法在深度学习模型方面给予他指导。实际上,卡尔和托宾都说过,John knows much more than I do.(John懂得比我们多得多。) 

当然,读博士本来就是要自己学很多东西。导师能给一个方向性指导已经可以了。



下面谈谈 John 的工作风格。


1

非常职业化(professional) 



即使在学校,John 的工作风格也非常职业化。

具体表现为:对上级(导师)和同事,关于学术问题有问必答尽快回复对方的邮件。托宾常调侃无论何时给 John 发邮件,总能得到他迅捷的回复,而有时候,John 回复邮件的时间却显示为凌晨45点。

John 在入学后第二年就与爱人生了大女儿,由于夫妻俩都要读博,那么 John 索性在家工作,由妻子去学校实验室做实验。这样,仅在每周组会时,John 会来学校,有时抱着女儿一起来开组会。其余时间,John 会偶尔下午来学校一小会,和老板汇报一下进度,讨论数据。

第四年时,John 的长子出生令他更忙了,工作都是利用带宝宝的间隙做的

另一方面,John 对正在进行的项目有明确的阶段性的 ETF(estimated time to finish,估计完成时间),会不断和托宾汇报更新。也就是说,John 不会埋头一个人做做做,让导师处于盲然状态;相反,他会自觉、主动地与上级交流,保持沟通,更新目标。

2

非常实际(practical)



对待学术问题,建立模型,处理数据,John 追求数学和物理意义上的严格(rigor),但不追求数据上的极致拟合。他理解做计算需要在精度和计算速度等方面作平衡。他时常挂在口边的一句话是:

All models are wrong, but some are useful. (George Box)
所有模型都是错的,只是一些有用而已。

他的毕业论文扉页上也用了这一句话。

另一方面,他不拘纹饰小节。比如,即使是他自己的博士毕业答辩,他也只用了白板PPT,和没有对齐的图片,没有调整的字体。—— 当你的科学内容足够重要,足够引人兴趣时,谁还关注你用了什么字体,用了什么PPT花边?

在生活方面,不只有一位同事问过他,为何在毕业后不继续学术生涯,以他的才能,做教职不是难事。他的回答也很直接,我存的钱快花完了,我还要养孩子啊。—— 不顾家式地追求个人理想绝不是好的选项。

现在,他在 Deepmind,既享受着高薪,也继续自己热爱的学术课题,两全其美!

到英国后一年,他的二女儿出生了。家庭事业双美是因为不将家庭置于事业之下。


3

非常善于教学(heuristic) 



John 不熟悉的人,在观察他的言行后,很容易得出结论,“John 是个倨傲的人。” 


我最初就认为 John 的说话方式总是居高临下(condescending),而与我同届的隔壁组做计算的印度同学拉米特也曾向我抱怨 John 说起话来总是一副屈尊俯就的感觉(patronizing)。

这并不奇怪,似乎恃才的人总须傲物。

但 John 并不是这样的人。渐渐与John熟悉后,我发现,John 十分愿意分享他的知识。如果向他提问的人愿意倾听,他能够恰到好处地、精准地,从提问人水平之下一点点开始讲解,耐心地,逐步深入,直至讲到提问人无法短时间理解的难度。

说实话,我很少到如此善于教学的人。这体现出,John 本人非常全面且熟练地掌握那些知识,而且他能够准确估计出对方的水平,并因材施教;在此过程中,John 还非常耐心。

芝大的办校宗旨之一是成为众师之师,从这个意义上说,John 是母校培养的合格人才。

4

很幽默(humorous) 



爱幽默是性格,置于工作中则是调节工作氛围、增进人际关系的良好润滑剂。

我在学习 John 代码时,注意到 Upside 中,他设定的随机数种子(random seed)是42,闲聊时便对他提起。“Of course, IT’s 42.” 当然是42。

懂的都懂吧?

42 是英国科幻作家道格拉斯·亚当斯的被誉为世界最幽默科幻小说的《银河系漫游指南》中宇宙的终极答案。

爱笑的人更显帅气。

【图】来自公众号“科工力量”。




综上,John 在知识储备上具备:

  1. 深厚的数学、物理学功底

  2. 足够的蛋白质领域知识

  3. 高超的编程技能

  4. 深刻的深度学习理解


在工作风格上,

  1. 非常职业化(professional)

  2. 非常实际(practical)

  3. 非常善于教学(heuristic)

  4. 很幽默(humorous)


一位拥有深厚专业知识和工作经验的,善于教学的,言谈幽默的,工作高效的,注重实际效果的人,很自然在一个团队中能成为核心和领导。

高智商、高情商的正常的不怪不乖的人,就是我们需要的复合型人才。

最后,John 喜欢喝可乐。


以上。
2020.12.11 于深圳

推荐阅读

>专访 | AlphaFold2是一艘曲率飞船
>> 本周Science谈美、俄、中、英、印五国新冠疫苗
>> Science谈辉瑞Moderna新冠疫苗副作用
>> 【科大往事】孟道骥:我们的浪漫是什么?
   >> 我仅做真理的党人:哈维与血液循环论
>> 华罗庚:影响了最多人类的数学家
>> 极限条件下的群体心理:《三体》中的“球殇派”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存