谷歌和 DeepMind 的科研人员在《自然》杂志上发表了一篇论文,提出了 MultiMed QA 评估基准,用于评测大语言模型在临床知识方面的表现。结果表明,大语言模型构建的 AI 医生在很多方面都强于人类医生。虽然这项技术尚未应用于临床实践,但在未来可能可以用于医疗求助热线。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验