中文
English

新研究:港大牵头多校发布牙科多模态大语言模型,基准测试超GPT-5三倍

编辑部
2025-12-08
图源:OralGPT-Omni:A Versatile Dental Multimodal Large Language Model
图源:OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

好的牙·讯|近日,中国香港大学牙医学院研究团队联合深圳大学、中国香港科技大学(广州)等多所院校发表论文,介绍首个牙科专用多模态大语言模型 OralGPT-Omni。

该模型可处理口内照片、根尖片、头颅侧位片、病理切片、口内视频等8种牙科影像。覆盖病变诊断、CVM分期预测、治疗方案推荐、视频理解和牙位定位计数5类任务。

研究团队设计了TRACE-CoT(透明放射学分析与临床证据)推理模式,使AI模仿放射科医师的诊断思维过程。该推理模式包含5个步骤:影像检查、假设生成、医学专业知识参考、基于特征的验证、循证结论。两名牙医对300个TRACE-CoT数据样本进行质量评估,结果显示其具有较高的质量和可靠性。

图源:OralGPT-Omni:A Versatile Dental Multimodal Large Language Model
图源:OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

值得注意的是,研究团队从31个公开数据集和1家中国香港牙科医院收集数据,构建了包含约321万文本词汇、近6万张图像和90个视频的大型数据集。采用四阶段训练策略:牙科知识注入、牙科概念对齐、监督微调和强化学习调优。在强化学习阶段,团队还引入了难度感知数据选择策略和TRACE奖励机制。

此外,研究团队构建了MMOral-Uni基准测试,包含2809个经过专业牙医验证的开放式问答对,涵盖5种影像模态和5类任务。OralGPT-Omni在该基准测试中获得51.84分,在MMOral-OPG全景片基准测试中获得45.31分。而对比数据显示,GPT-5在MMOral-Uni基准测试中得分仅15.42分。

据悉,研究团队邀请了一位拥有超过10年经验的放射科医师对GPT-5、Lingshu-7B和OralGPT-Omni三个模型的输出进行了临床有效性评估。评估结果显示,OralGPT‑Omni在准确性和临床可用性方面获得较高评价。

研究团队指出,OralGPT-Omni在复杂治疗方案制定方面仍存在局限性。治疗方案需要考虑患者的整体健康状况、经济能力和治疗偏好等更多个体化因素。在训练数据中,治疗方案数据仅占0.006%。此外,研究团队表示,将公开所有代码、数据和模型。

*扫描下方二维码添加小助手,可获取《OralGPT-Omni: A Versatile Dental Multimodal Large Language Model》等文件。

下一篇:这是最后一篇
上一篇:这是第一篇
快讯尾图广告(固定)-副本1
ABUIABACGAAgrOTSxAYo59uBjQcwsAk4ygI
插件代码
✉️
订阅我们的资讯
我们精心整理重要新闻与独家洞察,第一时间直达您的收件箱。
独家资讯、独家数据、独家故事
会员解锁·更多产业深度内容
1  /  30
自由容器
广告图
ABUIABACGAAg6qGpxwYouMDB-QMwsAk4rAI
去往PC端
更大视野·更多细节,点此去往PC端 >>
自由容器
插件代码
【好的牙】内容基于公开资料与专业判断,供行业参考,不构成决策建议,读者需自行判断与承担风险; 版权归属本平台,未经授权不得转载或商用。 🧾 如需勘误 / 投稿 / 合作,请联系客服微信:HDSW_001