科学家如何利用 Claude 加速研究与发现

发布日期： 2026 年 1 月 15 日

引言

Anthropic 于去年 10 月推出了 Claude for Life Sciences，引入了连接器和技能，增强了 Claude 作为科学协作者的能力。此后，公司大幅投入，持续提升 Claude 在各科学领域的表现。Opus 4.5 在图表解读、计算生物学和蛋白质理解基准测试中取得了显著进步——这些改进源于与学术界和产业界研究者的合作。

公司还运营 AI for Science 计划，向全球从事高影响力科学研究的顶尖研究者免费提供 API 额度。

科学家如何使用 Claude

研究者们基于 Claude 构建了定制系统，其应用远超文献综述或代码辅助。在参与的实验室中，Claude 作为协作者贯穿研究全流程：确定实验方向，调用多种工具将数月项目压缩至数小时，并从海量数据中发现人类可能遗漏的模式。该系统经常消除瓶颈，处理那些需要深度知识、此前无法规模化完成的任务，有时甚至促成全新的研究方法。

Biomni：通用生物医学智能体

斯坦福大学的 Biomni 解决了一个关键瓶颈：科学工具的碎片化。数百个数据库、软件包和实验方案并存，但研究者需要花费大量时间学习各种平台，而非开展实验或分析数据。

Biomni 将数百种工具、软件包和数据集整合为一个系统。研究者用自然语言提交请求，Biomni 自动选择合适的资源。该系统可以提出假设、设计实验方案，并在 25 个以上生物学子领域进行分析。

全基因组关联研究（GWAS）示例

以 GWAS 为例，研究者寻找与特定性状或疾病相关的遗传变异。他们扫描大规模人群的基因组，寻找在某一群体中出现频率更高的变异。虽然基因组扫描本身相对直接，但分析和解读结果耗时巨大。

基因组数据需要大量清洗和格式化；研究者必须控制混杂因素并处理缺失数据。识别到"命中"后，还需要确定附近基因、细胞类型表达模式以及受影响的生物学通路。每一步可能涉及不同的工具、文件格式和人工决策——这一繁琐过程通常需要数月。Biomni 在 20 分钟内完成了同样的分析。

验证与准确性

Biomni 团队通过多个案例研究验证了其系统：

分子克隆： 在盲测评估中，Biomni 设计的实验方案与博士后的方案一致
可穿戴设备数据分析： 在 35 分钟内处理了来自 30 人的 450 多个文件（人类专家估计需要三周）
基因活性分析： 分析了来自胚胎组织的 33.6 万个单细胞，确认了已知的调控关系，同时发现了与胚胎发育相关的此前未知的转录因子

该系统包含防护机制，可在 Claude 偏离轨道时进行检测。当表现不足时，专家可以将方法论编码为技能——教导 Claude 专家如何解决问题。在与 Undiagnosed Diseases Network 合作进行罕见病诊断时，团队发现 Claude 的默认方法与临床实践不同，因此他们逐步记录了专家流程，并相应地训练 Claude。

Cheeseman Lab：自动化基因敲除解读

MIT 的 Cheeseman Lab 面临不同的瓶颈。他们使用 CRISPR 在数千万个人类细胞中敲除数千个基因，并对每个细胞拍照观察变化。功能相似的基因被敲除后会产生相似的损伤模式。软件检测这些模式，并使用 Brieflow（以奶酪命名的流程）自动对基因进行分组。

解读挑战

解读基因分组的含义——为什么基因会聚集在一起，这些关系是已知还是新发现——需要人类专家逐个基因地查阅科学文献。这一过程很慢；单次筛选产生数百个聚类，由于时间和人力限制，大多数聚类得不到深入研究。

MozzareLLM 方案

Cheeseman 估计他能从记忆中回忆约 5,000 个基因的功能，但分析仍需数百小时。博士生 Matteo Di Bernardo 开发了 MozzareLLM，这是一个基于 Claude 的系统，根据 Cheeseman 的解读方法训练。

该系统识别基因聚类中的共同生物学过程，区分研究充分与研究不足的基因，并突出需要后续跟进的候选基因。Cheeseman 报告称，Claude 持续发现被忽视的关联，这些关联经受住了验证。系统提供发现的置信度，帮助决定是否投入资源追踪结论。

在测试中，Claude 表现优于其他模型，正确识别了一个被其他模型视为噪声的 RNA 修饰通路。

Lundberg Lab：AI 主导的假设生成

斯坦福的 Lundberg Lab 进行规模较小、目标明确的筛选，瓶颈出现得更早：确定最初要靶向哪些基因。

成本与传统方法

目标明确的筛选成本超过 2 万美元，规模越大费用越高。实验室通常靶向几百个被认为最可能涉及特定条件的基因。传统流程是团队围坐在电子表格旁，添加候选基因并附上简要理由或论文链接——这是基于文献综述和直觉的有根据的猜测，但受限于人类能力和易错的记忆。

基于 Claude 的方法

Lundberg Lab 反转了这一方法：不再问"从已有研究中我们能做出什么猜测"，而是问"根据分子特性，什么应该被研究？"

团队绘制了每个已知细胞分子——蛋白质、RNA、DNA——及其关系：蛋白质结合模式、基因产物编码、结构相似性。Claude 基于生物学特性和关系在这张地图中导航，识别候选基因。

初级纤毛研究

实验室正在使用初级纤毛——一种天线状的细胞附属物，研究有限但与发育和神经系统疾病相关——测试这一方法。他们比较人类专家（使用电子表格方法）与 Claude（使用分子关系图）的表现。如果 Claude 识别出比专家更多的影响纤毛形成的基因，该方法就得到验证。即使发现率相似，也可能展示 Claude 的效率优势，简化研究流程。

如果成功，这可能成为目标明确扰动筛选的标准做法，无需全基因组筛选基础设施即可实现有依据的基因选择。

展望

这些系统并不完美，但它们展示了科学家如何越来越多地将 AI 作为研究伙伴——其能力远超基本任务，越来越能够加速甚至替代研究的各个方面。

一个共同主题浮现：工具的实用性随 AI 能力增长。每次模型发布都带来显著改进。两年前的早期模型仅限于代码编写或论文摘要，如今更强大的智能体日益能够复现这些论文描述的工作。

随着工具进步和 AI 模型愈发智能，理解科学发现如何与这些技术同步发展仍然至关重要。

更多信息： Claude for Life Sciences 的扩展功能详见此处，教程在此。研究者可提交申请加入 AI for Science 计划，由领域专家审核。

科学家如何利用 Claude 加速研究与发现 ​

引言 ​

科学家如何使用 Claude ​

Biomni：通用生物医学智能体 ​

全基因组关联研究（GWAS）示例 ​

验证与准确性 ​

Cheeseman Lab：自动化基因敲除解读 ​

解读挑战 ​

MozzareLLM 方案 ​

Lundberg Lab：AI 主导的假设生成 ​

成本与传统方法 ​

基于 Claude 的方法 ​

初级纤毛研究 ​

展望 ​