伴随着人工智能(AI)科学的工具重组工作流程,梦想着进行更系统的Sam转型。 Rodriques,他的创业公司FutureHouse于2023年在美国旧金山成立。
作为一个非营利组织,该公司获得了前谷歌CEOEric Schmidt的支持,其使命是利用AI技术加快科学进程,“培养”可以指挥AI科学家从假设生成到论文制作的整个研究过程。
现在,Rodriques团队正朝着这个方向迈出了一步。最近,他们发布了第一个真正的“推理模型”——ether0,专门为科学任务设计。
ether0是一个专门为化学领域设计的大语言模型。(LLM),它通过测试大约50万个问题来学习。ether0可以根据简单的英语说明给出一系列符合标准的药物分子配方。
ether0已经开源,可以公开使用。它加入了谷歌和日本公司Sakanana等其他企业,以实现科学过程的自动化。 AI的效果。
与以往的专业模式不同,ether0通过自然语言跟踪“思路”,为AI的“黑匣子”提供了一个窗口,让它能够回答通常需要复杂推理的问题。虽然一些通用的推理模式,比如OpenAI o1,在标准化科学测试方面取得了进步,但是没有针对性的训练,他们很难产生深刻的见解。
Kevininn德国耶拿大学的数字科学家在试用ether0预览版时,Jablonka发现这个模型可以对未经训练的化学性质做出有价值的推断,“以前的模型做不到”。
Ether0是FutureHouse的最新成果。在过去的一年里,该公司发布了“高级科学文献评论家”和“AI代理平台”。后者是专门为特定任务设计的基于LLM的工具。基于上述模型,FutureHouse团队在5月份提出了一种治疗年龄相关性黄斑变性的方法。
FutureHouse的研究人员来自法国创业公司Mistral AI获得了一个相对较小的LLM,足够紧凑,可以在笔记本电脑上运行。他们发现,与其在化学教材和论文的基础上训练模型,不如让它从考试中学习。所以,FutureHouse的化学工程师Andrew White选择了45篇学术论文的实验室产生的化学成果,跟踪了分子的溶解度和味道,并将其转化为57790个可验证的问题。
研究人员训练了7个版本的模型,每个模型都试图解决一个子集的上述化学问题。如果他们回到正确的地方,他们可以得到加强奖励。随后,研究人员将这些专业模型中的推理链结合成一个通用模型。再次浏览了上面的化学问题集后,他们得到了ether0。
这个团队利用另一组问题来评估ether0的性能,有些问题与训练集中的问题无关。ether0在所有方面的表现都优于其他前沿模型。对某些问题类型而言,ether0的准确性是竞争者的两倍多。
其他科学家对ether0表示高兴和担忧。它有自己的优势,当然也有问题。然而,Rodriques认为,将推理能力嵌入到一个特殊的模型中,不仅仅是化学方法,更是团队获得端到端的自动化科学方法。
赞一个