Skip to content

科学家如何利用 Claude 加速研究与发现

发布日期: 2026 年 1 月 15 日

引言

Anthropic 于去年 10 月推出了 Claude for Life Sciences,引入了连接器和技能,增强了 Claude 作为科学协作者的能力。此后,公司大幅投入,持续提升 Claude 在各科学领域的表现。Opus 4.5 在图表解读、计算生物学和蛋白质理解基准测试中取得了显著进步——这些改进源于与学术界和产业界研究者的合作。

公司还运营 AI for Science 计划,向全球从事高影响力科学研究的顶尖研究者免费提供 API 额度。

科学家如何使用 Claude

研究者们基于 Claude 构建了定制系统,其应用远超文献综述或代码辅助。在参与的实验室中,Claude 作为协作者贯穿研究全流程:确定实验方向,调用多种工具将数月项目压缩至数小时,并从海量数据中发现人类可能遗漏的模式。该系统经常消除瓶颈,处理那些需要深度知识、此前无法规模化完成的任务,有时甚至促成全新的研究方法。

Biomni:通用生物医学智能体

斯坦福大学的 Biomni 解决了一个关键瓶颈:科学工具的碎片化。数百个数据库、软件包和实验方案并存,但研究者需要花费大量时间学习各种平台,而非开展实验或分析数据。

Biomni 将数百种工具、软件包和数据集整合为一个系统。研究者用自然语言提交请求,Biomni 自动选择合适的资源。该系统可以提出假设、设计实验方案,并在 25 个以上生物学子领域进行分析。

全基因组关联研究(GWAS)示例

以 GWAS 为例,研究者寻找与特定性状或疾病相关的遗传变异。他们扫描大规模人群的基因组,寻找在某一群体中出现频率更高的变异。虽然基因组扫描本身相对直接,但分析和解读结果耗时巨大。

基因组数据需要大量清洗和格式化;研究者必须控制混杂因素并处理缺失数据。识别到"命中"后,还需要确定附近基因、细胞类型表达模式以及受影响的生物学通路。每一步可能涉及不同的工具、文件格式和人工决策——这一繁琐过程通常需要数月。Biomni 在 20 分钟内完成了同样的分析。

验证与准确性

Biomni 团队通过多个案例研究验证了其系统:

  • 分子克隆: 在盲测评估中,Biomni 设计的实验方案与博士后的方案一致
  • 可穿戴设备数据分析: 在 35 分钟内处理了来自 30 人的 450 多个文件(人类专家估计需要三周)
  • 基因活性分析: 分析了来自胚胎组织的 33.6 万个单细胞,确认了已知的调控关系,同时发现了与胚胎发育相关的此前未知的转录因子

该系统包含防护机制,可在 Claude 偏离轨道时进行检测。当表现不足时,专家可以将方法论编码为技能——教导 Claude 专家如何解决问题。在与 Undiagnosed Diseases Network 合作进行罕见病诊断时,团队发现 Claude 的默认方法与临床实践不同,因此他们逐步记录了专家流程,并相应地训练 Claude。

Cheeseman Lab:自动化基因敲除解读

MIT 的 Cheeseman Lab 面临不同的瓶颈。他们使用 CRISPR 在数千万个人类细胞中敲除数千个基因,并对每个细胞拍照观察变化。功能相似的基因被敲除后会产生相似的损伤模式。软件检测这些模式,并使用 Brieflow(以奶酪命名的流程)自动对基因进行分组。

解读挑战

解读基因分组的含义——为什么基因会聚集在一起,这些关系是已知还是新发现——需要人类专家逐个基因地查阅科学文献。这一过程很慢;单次筛选产生数百个聚类,由于时间和人力限制,大多数聚类得不到深入研究。

MozzareLLM 方案

Cheeseman 估计他能从记忆中回忆约 5,000 个基因的功能,但分析仍需数百小时。博士生 Matteo Di Bernardo 开发了 MozzareLLM,这是一个基于 Claude 的系统,根据 Cheeseman 的解读方法训练。

该系统识别基因聚类中的共同生物学过程,区分研究充分与研究不足的基因,并突出需要后续跟进的候选基因。Cheeseman 报告称,Claude 持续发现被忽视的关联,这些关联经受住了验证。系统提供发现的置信度,帮助决定是否投入资源追踪结论。

在测试中,Claude 表现优于其他模型,正确识别了一个被其他模型视为噪声的 RNA 修饰通路。

Lundberg Lab:AI 主导的假设生成

斯坦福的 Lundberg Lab 进行规模较小、目标明确的筛选,瓶颈出现得更早:确定最初要靶向哪些基因。

成本与传统方法

目标明确的筛选成本超过 2 万美元,规模越大费用越高。实验室通常靶向几百个被认为最可能涉及特定条件的基因。传统流程是团队围坐在电子表格旁,添加候选基因并附上简要理由或论文链接——这是基于文献综述和直觉的有根据的猜测,但受限于人类能力和易错的记忆。

基于 Claude 的方法

Lundberg Lab 反转了这一方法:不再问"从已有研究中我们能做出什么猜测",而是问"根据分子特性,什么应该被研究?"

团队绘制了每个已知细胞分子——蛋白质、RNA、DNA——及其关系:蛋白质结合模式、基因产物编码、结构相似性。Claude 基于生物学特性和关系在这张地图中导航,识别候选基因。

初级纤毛研究

实验室正在使用初级纤毛——一种天线状的细胞附属物,研究有限但与发育和神经系统疾病相关——测试这一方法。他们比较人类专家(使用电子表格方法)与 Claude(使用分子关系图)的表现。如果 Claude 识别出比专家更多的影响纤毛形成的基因,该方法就得到验证。即使发现率相似,也可能展示 Claude 的效率优势,简化研究流程。

如果成功,这可能成为目标明确扰动筛选的标准做法,无需全基因组筛选基础设施即可实现有依据的基因选择。

展望

这些系统并不完美,但它们展示了科学家如何越来越多地将 AI 作为研究伙伴——其能力远超基本任务,越来越能够加速甚至替代研究的各个方面。

一个共同主题浮现:工具的实用性随 AI 能力增长。每次模型发布都带来显著改进。两年前的早期模型仅限于代码编写或论文摘要,如今更强大的智能体日益能够复现这些论文描述的工作。

随着工具进步和 AI 模型愈发智能,理解科学发现如何与这些技术同步发展仍然至关重要。


更多信息: Claude for Life Sciences 的扩展功能详见此处,教程在此。研究者可提交申请加入 AI for Science 计划,由领域专家审核。