AI 快讯

用真实科研工作流给AI打分:LifeSciBench来了

为什么现有的AI评测测不出模型能不能帮科学家干活?答案在LifeSciBench:一个由173位博士级科学家设计的基准,直接对标真实科研中的多步推理、证据整合和判断决策。结果告诉你,模型在纯文本上还行,一遇到图表和序列文件就掉三成。到底差在哪,看这个就知道。

阅读详情用真实科研工作流给AI打分:LifeSciBench来了

近乎自主的AI化学家成功攻克药物化学中的一个棘手反应

OpenAI联手Molecule.one,让GPT-5.4像一位真实的化学博士后一样工作:独立提出科学猜想、设计实验方案、在自动化实验室里跑完10080个反应、分析数据、再提出下一轮假设。关键结果是,它推荐的TEMPO氧化剂让药物化学中最棘手的磺酰胺基团偶联反应产率翻倍。

阅读详情近乎自主的AI化学家成功攻克药物化学中的一个棘手反应