细分赛道,人皆为王
今天在上班的地铁上看到一篇神奇通稿:某新的 AI 新药公司获得某资本数千万元融资。通稿不长,先介绍这家新 AI 新药公司想要做什么,再介绍公司创始人做过什么。其中有几句话让小王先感惊讶,再感可笑,而后感觉荒诞。
通稿介绍:该AI 新药公司是“目前业内唯一具备多种分子形态设计平台,可同时应用于小分子、大分子药物研发方向的公司”。
“业内唯一”,好强的口气。这句话的意思就是,目前整个业内的创新药公司,无论有没有 AI,做实验还是搞计算,都没有这种“多具备多分子形态设计”的平台,有的呢,不是只能设计小分子药,就是只能设计大分子药。
我冒昧问一句,难道业内的公司不能有两个或者多个平台么,一个平台设计小分子,一个设计大分子?或者,难道不能把设计小分子的平台A和设计大分子的平台B合起来叫做可大可小的平台AB么?
行吧,说不定真没有公司把两种平台捏合到一起呢。也算个细分赛道。看到这,我只感觉惊讶。
接着,通稿介绍该公司的创始人曾经实现过“全球最大规模的膜蛋白分子动力学模拟”,以及搭建过“全球首家新冠一站式科研数据共享平台和新冠药物筛选平台”。
看到这,小王愣了一下。可笑 —— 这年头还有人把做过超大体系的模拟拿出来说。重读一遍,没看错,”全球最大规模膜蛋白……“。
好吧,既然说到了小王的专业:膜蛋白 + 分子动力学。
首先,分子动力学 和 人工智能 AI 不是一回事,这个晓得吧?
分子动力学,最根本地,利用半经验方法获得一系列描述体系的力场参数,诸如键长、键角、旋转角、静电力、范德华力等等,忽略电子的运动,仅仅考虑原子核,在原子精度下使用牛顿力学,也就是 F = ma 和 v = v0 + at,通过统计力学方法控制体系等温度、压力和体积,根据上一步的状态,计算下一步时每个原子的位置和受力,进而获得加速度和速度。这里提一下,模拟中的每一步,通常为1 ~ 2飞秒,即 10^(-15)秒。
这样就可以获得每个时态体系中所有原子的坐标——体系不就动起来了嘛,在经典物理法则下动力来了。Physics-based approach.
相对而言,人工智能则基于神经网络模型,对输入信息进行学习,提取信息,而后应用已学习的知识作推断。Knowledge-based approach.
所谓模拟是对现实体系的仿真。譬如膜蛋白体系,蛋白质镶嵌在磷脂双分子膜内,而膜与蛋白则浸没在水溶液中。为了尽可能地逼近真实,这个体系(1)要尽可能地含有真实体系所含有的分子,例如多种磷脂分子、配体分子等;(2)要尽可能大一些以减小热扰动和周期性边界的影响;(3)模拟的时间要尽可能长一些,因为生化反应的时间尺度通常在微妙级 (10^-6 s) 以上。
这三点的任何一点都不太容易做到。
针对第一点。里海大学的韩国人 Im Wompil 研究团队,年复一年地将各种常见、不常见的脂分子参数化,以便其他团队在模拟中添加这种新分子,从而更接近真实。千万不要以为这种看似琐碎、冗长的工作很容易做。这个过程中,Wompil 和他的学生开发了各种膜蛋白的模拟工具,并且将大部分做成了自动化服务器,免费开放给整个学术界。
针对第三点。最有代表性的莫过于神人 DE Shaw 的团队和他们著名的超算 Anton。2010 年,DE Shaw 团队史无前例地将蛋白质动力学模拟做到毫秒量级,论文发表到了Science。今天 AlphaFold2 的首席科学家 John Jumper 正是那篇文章的作者之一。
回到这篇通稿。
意思就是这家新的 AI 新药公司的创始人,针对第二点,体系规模,做到过全球第一呗。
不过,小王冒昧问一句,听过 UIUC 的生物物理大神舒克劳(Klaus Schulten)吗?舒老爷子虽然仙逝,UIUC 团队依然在分子动力学的各个方向开拓,这其中就包括模拟超大体系。
在2019年巴尔的摩举办的生物物理年会上,小王偶然听了一场他们的博后的报告,全原子模拟了含有超过 1亿个原子 的细胞器。当时,我完全惊了。
小王认为模拟这样尺寸的体系所需要克服的实际技术困难远大于信念上的困难。什么意思?就是,不是不敢想,而是即便敢想敢干,怎么干成,才是关键。—— 搭建一个全封闭的、弯曲的磷脂膜,恰当地在其中嵌入上百个膜蛋白,并使得整个体系能长时间稳定。膜体系会塌陷或者爆炸啊!
Abhishek Singharoy et al., Cell (2019).
所以,这家新的 AI 新药公司的创始人,曾经做过比 UIUC 团队更大的膜蛋白体系呗?不是小王不信啊,只是想开开眼,学习学习。又或者,细胞器不算,这是仅含有一个膜蛋白的细分赛道?
小王非常尊敬的校友,一位发表过100篇JACS的林教授曾经说,任何人在一个足够细分的领域都可以宣称自己做到了世界第一。
∀ person P,
∃ track T,
s.t. P is No. 1 in T.
关于“全球首家新冠……数据共享平台…药物筛选平台”,小王不想评论了,只问一个投资人应该问的问题:筛出来了什么没有,除了瑞德西韦?
最后。
这些“全球首家”、“全球第一”、“业内唯一”等等大词,究竟是创业者的豪言,还是投资人的壮语,只为了击鼓传花的游戏能接下去?谨慎地说,拥有如此水平的调研团队,这样的资本所领投的其它项目,恐怕也不大靠得住。
在工业界,所谓细分赛道,不过是区别于他人的一个 idea,然而 idea 不挣钱也不值钱。实现不了或者实现不好的 idea 一样没用,落不了地或者硬着陆。例如,近日某会议上某计算药物公司发言人说他们的算法是唯一的真端到端,别家是假的。可是,你有个什么平台也好,是真这个端到真那个端也好,谁关心?各个新药公司比的是啥?争这个有甚用?能做出药,做出好药,做出比别人都好的药才算数。
以上。
2021.11.5 深夜于出韶关的火车