当前位置:主页 > 业界动态 > WEB3.0 > AI for Science突出重围:遭海外巨头围剿的“中国OpenAI”

AI for Science突出重围:遭海外巨头围剿的“中国OpenAI”

2024-05-22 23:30:02来源:界面新闻

文章导读
2017年夏天,一趟从北京飞往纽约的国际航班上,张林峰正在反复比对两组几乎一模一样的数字,以确认它们真的如此接近。 这两组数字都代表64个水分子在10皮秒内(10的-11次方秒,比一瞬间 ...

2017年夏天,一趟从北京飞往纽约的国际航班上,张林峰正在反复比对两组几乎一模一样的数字,以确认它们真的如此接近。

这两组数字都代表64个水分子在10皮秒内(10的-11次方秒,比一瞬间还短暂)模拟运动的计算结果。其中一组是在1985年用量子力学原理算出来的,消耗了2亿核时,即便在算力发达的今天,也需要大约2000万的计算费用才能实现。另一组就来自张林峰手里这台笔记本,上面正运行着他与合作者完成的某套算法,因为从上飞机就插着电,大概只消耗了一些航空公司的电费——这可能吗?他甚至觉得自己抄错了。

下飞机之后,张林峰立刻写了一封邮件,将模拟的结果发送给自己在普林斯顿大学的导师、中国科学院院士鄂维南。来自远方的回复简洁而有力:“Too good to be true(好得难以置信)。”

人类团队写的AI算法读懂了微观世界的某种客观规律——这像是一颗投向分子模拟领域的普罗米修斯火种,很多事情将就此遭永远改变,但当时没人清晰预见。

再次回国后,一场老友见面,张林峰将飞机上发生的故事讲给了自己的北大元培校友,一边从事科技方向投资一边寻找合适创业项目的孙伟杰。

AI for Science突出重围:被海外巨头围剿的“中国OpenAI”

孙伟杰关注过市面上绝大多数AI项目,早就发现这个行业的共性问题是缺乏Golden Standard(黄金准则)来衡量成果。张林峰带来的故事是一种认知冲击——如果AI的核心是发现并学习某种规律,其价值等同于它所学到的规律价值,那当今世界还有什么规律的价值高于科学规律?

用AI来学习和发现科学规律,没错,他们应该做这样一套东西——达成这一共识之后,张林峰和孙伟杰开始筹划共同创业,他们为新公司取名“深势科技”,致力于用人工智能深度学习解决微观尺度的问题。

时间快进到2024年GTC大会,英伟达CEO黄仁勋在演讲中谈到了AI领域的三个关键方向,LLM(大语言模型),具身智能,以及AI for Science(科学智能)。

在前两个领域,OpenAI和Tesla两家美国公司已经形成鲜明主导地位,全球范围内的竞争者均对其亦步亦趋。鲜有人知的是,第三个领域——AI for Science——早在七年前就在鄂维南院士的推动下在东方世界定下根基。

更加反直觉的在于,过去几年来,AI for Science领域声名在外的两家科技巨头Google DeepMind和微软并未形成实质上的引领地位,而是一直在与那个年轻东方团队相互追赶。

2017年,在鄂维南院士的带领下,张林峰与团队合作发布DeePMD,紧接着Google DeepMind完成一套十分相近的技术框架;随后,张林峰团队做出了DeePWF,一种电子波函数的AI计算方法,次年,DeepMind发布相同方向的解决方案FermiNet;2020年,张林峰团队再度发布DeePKS,而DeepMind的对标框架DM21在2021年诞生。

2020年底,在鄂维南、张林峰等人因DeePMD相关工作获得有高性能计算领域“诺贝尔奖”之称的戈登贝尔奖时,DeepMind AlphaFold-2的工作改变了整个结构生物学领域。而到了2021年底,深势科技成为了全球首家成功复现AlphaFold-2并完全开源训练代码的机构。

AI for Science突出重围:被海外巨头围剿的“中国OpenAI”

深势科技创始人兼首席科学家张林峰

大概只因为AI for Science才刚刚起步,人们无从发现这个前沿科技领域正在上演一场激烈的全球竞逐。

AI for Science有多重要?任正非曾指出中国的基础科学薄弱,在最基础的科研和工业问题上遭“卡着脖子”。中国实体产业已经在新能源汽车、光伏等领域诞生多个全球第一,但回到电池研发层面,仍在基础科学问题上破茧无门。而大量重要科学问题的终极答案都指向微观世界。

事实上,AI for Science的重要性已经与大国竞争的新局面挂钩。大洋彼岸,在美国白宫一份行政命令要求下,PCAST(美国总统科技顾问委员会)近日撰写了题为《加速研究:利用人工智能应对全球挑战》的报告。其中,由知名数学家陶哲轩领衔的一份技术报告概述了AI for Science的潜在影响。

报告指出,AI将从根本上改变人类进行科学研究的方式。其阐述了AI在材料、半导体设计、气候、物理、生命科学等领域已经做出的改变,并高度总结了AI如何通过提供研究工具来加速科学发现和技术进步,从而革命性地改变人类解决最紧迫问题的能力。

这恰恰是深势科技决心投入并试图引领中国产业去突破的问题。成立近六年时间,深势科技已经把当初那颗火种衍生为一套完整的产品框架。用多尺度建模、机器学习和高性能计算去解决微观尺度下的工业设计难题。这件事天然地适合药企、材料研发和科研机构,是真正有可能四两拨千斤的魔法工具。

但这趟旅程并不完全是一个天之骄子的爽文故事。因为人才难寻,这家AI for Science领域的“中国OpenAI”在创业之初甚至有一半以上的员工是实习生。深势科技在天使轮拿到了1600万人民币融资,听上去不少,但去年由谷歌孵化,并由谷歌创始人挂帅的Sandbox AQ首轮单笔公开融资就已达到5亿美金。孙伟杰说,当他看到海外对手可能是以每年数十亿美⾦为计在投⼊的时候,他知道自己还得做到更好。

AI for Science突出重围:被海外巨头围剿的“中国OpenAI”

深势科技创始人兼CEO孙伟杰

作为深势科技创始人兼首席科学家,张林峰判断,AI for Science领域的科学大模型正处在GPT-2阶段,这意味着涌现时刻已经不会太远。他对未来的终局想象是无论半导体工业、电池、合金,还是药物,都能从原子开始生产制造。一个形象的比喻大概就是,原⼦尺度下的“活字印刷术”。

而作为公司CEO,孙伟杰说,他们的创业出发点是做一家真正源自中国、引领世界的科技公司。他认为一代公司有一代公司的使命,中国已经走过了拿来主义的阶段,这个时代在呼唤更多有底层创新技术的公司。

以下是界面新闻对孙伟杰、张林峰的采访实录(略作编辑):

打开微尺度的大门:看到光照不进的地方

问:你们的官网一打开就写着"分子模拟未来",为什么要用这句话?什么是分子模拟?

孙伟杰:分子模拟就是基于物理规律模拟原子、分子这些微观粒子的排布和运动,就好像我们给分子的运动拍了一个视频。我们团队的第一个突破就是在AI助力分子模拟领域,把分子模拟的时间和空间规模提升了上万倍。这样我们就能用分子模拟来研究很多面向未来的新分子、新材料了。

我们觉得在分子模拟里,可以发现人类的未来,所以就把公司口号定成了这句话。

问:为什么要模拟,而不是直接观察呢?

孙伟杰:因为原子的尺寸甚至小于可见光的波长了。这意味着我们无法用可见光看到它,必须得借助一些非常昂贵的仪器,像电子显微镜,而这些仪器效率又非常低。

另一个问题则是它动的太快了。对于常见的物质来说,原子间振动的常用时间尺度是是十的负十五次方秒,也就是百万亿分之一秒。刚才过去的一秒钟,它动了一百万亿次。

所以是真的“看不到”它怎么动,只能模拟。

问:看清楚分子原子是怎么运动的很重要吗?

孙伟杰:当然,现在的重要科学问题其实大部分都是微观问题。

比如生命和非生命的界限到底在哪?一个细胞可以是一个生命,但是细胞也是由无生命的原子构成的,那为什么它会变成一个生命体呢?如果我们从最小的地方一点点开始模拟,一个原子,两个原子,三个原子,直到组成蛋白质,组成线粒体,一点点往上加,加到什么样的时候,它突然就有生命了?这是人类的一个终极问题,生命是“涌现的",你怎么知道那个界限在哪?

再比如说,中国目前在电动车和电池行业已经世界领先,但是我们仍然不完全了解锂枝晶的生长原因。锂枝晶是一种会让锂电池失效的机制,它会在负极界面和电解质界面上形成,这个过程涉及至少数十万个原子在微秒甚至毫秒的时间尺度内发生变化。

问:模拟分子很难吗,以前是怎么解决这些问题的?

孙伟杰:主要有两种方法,第一种是用第一性原理,基于量子力学来算。它的好处是可以算得准,坏处就是算得非常慢,而且它只能算个几十个几百个原子。

靠量子力学这样的算法,随原子数量的上升,计算量是三次方指数上升。一百个原子和一万个原子,差的原子数量是一百倍,但是差的计算量是一百万倍。这就导致我们想要算一个真正感兴趣的问题,如果里面有几十万个原子,可能把全球的算力加起来都不够用,这个叫做维数灾难。

第二种方法就是经验力场,靠归纳。我就简单地把原子间的力抽象成一个化学键,像个皮筋一样。它不那么准,但至少能算,在相当长的历史阶段里面也解决了很多问题。但一旦面临精度很高的体系,就不管用了。

问:所以说要算得准就算得慢,要算得快就算得不准。

张林峰:对,算得快的就不准,或者使用范围非常受限。而这是我们用AI能解决的问题,让精度和效率可以兼得。

问:那算到多大规模的模拟才算是真正完成了任务呢?

张林峰:要到我们用光学显微镜能够观察到运动变化的这个尺度。对于生物学来说,可能是到一个细胞层面,我们模拟出来的这个细胞的运动和变化和我们光学上观察的是一致的,我觉得这个时候分子模拟的任务首先从规模上解决了。

在分子模拟领域有三个终极问题:第一是否所有的元素和构型,第二就是模拟的规模,第三就是模拟的时间尺度。在这三个问题上其实我们基本上未来的路已经比较清楚了,未来两三年之内应该这个领域应该会遭颠覆。

问:达到目标对于业界的影响会是什么,对于人们的日常生活又会有什么影响?

张林峰:比如可以帮助电池企业发现让电池续航更高的方法,帮助药物公司研发出更好的药物。

我们研究新材料,比如说一块橡皮泥,为什么它有这种弹性形变?现在是没有原理能够解释的。我们只是观察到了,它一捏可以这样,但我们不知道为什么会这样。

而当我们有了分子模拟,就有可能通过模拟的方式搞明白背后的原理,这样在我们需要有弹性形变的材料时可以尝试把这个原理使用上去。

中国团队扛起AI for Science的大旗

问:你们是怎么发现AI可以解决分子模拟效率和精度不可兼得的问题的?

张林峰:主要是因为我的两位导师。其中一位是鄂维南老师,他是应用数学家。鄂老师给我最核心的insight是机器学习能解决维数灾难问题。

热门文章
日榜 周榜
1 草根网红“郭有才”出道即惹争议,背后机构透露打赏收入

一个月内涨粉1000多万,不断游走的互联网流量又涌向了山东菏泽的一位25岁的年轻人。 据《娱...

1 草根网红“郭有才”出道即惹争议,背后机构透露打赏收入

一个月内涨粉1000多万,不断游走的互联网流量又涌向了山东菏泽的一位25岁的年轻人。 据《娱...

2 投诉湘潭移动

我移动号码13873248859,我想要降消费去了营业厅,然后营业员和我说我有个合约做了个贷款,要...

3 长沙移动通信资费乱收

一直对移动通信对消费者产生不合事实的费用 现在一直末解决 工作人员也不联系本人 里面的...

4 移动霸王条款,敷衍老用户

我是一个十来年的移动号码用户,十来年都没有换过号码,最近移动业务员打电话给我移动业...

5 因工作原因多打电话遭电信限制通话权

1、电信推销宽带不真诚说明产品优缺点 电信办理宽带的区域经理(王,电话号码:18073452466)...

6 中国电信股份有限公司湖南分公司随意停机

事实与理由:1:2024年4月8号18:17收到10001发来的短信尊敬的用户,您的号码可能存在超频呼叫、异...

7 关于客服解决问题的问题

第一,账户会莫名其妙少了钱,而且要我翻找半年之前的付款记录才给退回,客服态度强硬说...

8 电信失信 客户多次投诉无果

大约2023年12月份,本人接到电信工作人员小黄的电话说:“可以上门办理电信卡,电信网络最...

9 未经本人同意恶意自动扣款两次同等金额64.5元

2024年4月29日10点11分,上海合合信息科技有限公司在本人毫不知情的情况下两次自动扣款64.5元...

10 湖南电信关停我通信严重影响我正常打电话

本人号码已使用很多年,莫名其妙遭湖南湘西电信公司关停我通信...

撤稿申请|

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有