全新生物学基准数据集LAB-Bench震撼开源！覆盖8大任务，超2.4K选择题（生物组学数据的数据特征）

AIGC动态欢迎阅读

原标题：全新生物学基准数据集LAB-Bench震撼开源！覆盖8大任务

，超2.4K选择题

关键字：模型,任务,解读,问题,能力

文章来源：HyperAI超神经

内容字数：0字

内容摘要：

lü作者：十九

编辑：十九，李宝珠

FutureHouse Inc. 的研究人员推出了 LAB-Bench 生物学基准测试数据集，用于评估 AI 系统在文献检索和推理、图形解释、表格解释、数据库访问、撰写协议、DNA 和蛋白质序列的理解和处理、克隆场景等实际生物学研究的表现。当被国外友人问候「How are you」时，你的第一反应是什么？

是不是经典的「I’m fine, Thank you. And you」？

其实，这种教科书式问答不仅存在于我们的英语学习交流中，也存在于大语言模型的训练和测试中。

如今，将大语言模型 (LLMs) 和 LLM 增强系统用于生物学、海洋科学、材料科学等领域的研究，进而提高科研效率、成果产出，已成为很多科学家关注的重点方向。比如，浙江大学团队曾在海洋领域推出大语言模型 OceanGPT，微软曾在生物医药领域开发大语言模型 BioGPT，上海交通大学曾在地球科学领域提出大语言模型 K2。

值得注意的是，随着 LLMs 在科研领域的日益普及，建立一套高质量、专业性强的评估基准变得至关重要。

然而，目前许多基准测试 (benchmarks exist) 聚

原文链接：全新生物学基准数据集LAB-Bench震撼开源！覆盖8大任务，超2.4K选择题