14. 孙思邈中文医疗大模型(Sunsimiao) - 提供安全、可靠、普惠的中文医疗大模型
项目简介
孙思邈, 唐代医药学家、道士, 被后人尊称为”药王”. 其十分重视民间的医疗经验, 不断积累走访, 及时记录下来, 写下著作《千金要方》. 唐朝建立后, 孙思邈接受朝廷的邀请, 与政府合作开展医学活动, 完成了世界上第一部国家药典《唐新本草》。
孙思邈中文医疗大模型(简称: Sunsimiao)希望能够遵循孙思邈的生平轨迹, 重视民间医疗经验, 不断累积中文医疗数据, 并将数据附加给模型, 致力于提供安全、可靠、普惠的中文医疗大模型.
目前,Sunsimiao是由baichuan-7B及书生浦语InternLM在十万级高质量的中文医疗数据中基于LoRa微调而得, 后续将收集更多数据, 扩充模型能力, 不断迭代更新. 相关细节工作正在整理中。
项目组同时也发布了MindChat(漫谈)心理健康大模型。
项目由华东理工大学**信息科学与工程学院**薛栋副教授发起,, 于2023年6月发布于github上。
论文及源码
项目没有发布相关的技术报告或论文。
项目模型成果及测试脚本源码:
https://modelscope.cn/models/AI-ModelScope/Sunsimiao/summary
https://github.com/thomas-yanxin/Sunsimiao
https://github.com/X-D-Lab/Sunsimiao
(后两个页面的模型链接有问题)
数据构建及模型训练
项目没有给出模型微调训练所采用的数据集,仅给出了训练后的部分模型参数情况,模型存储在modescope社区(Baichuan模型为基座);项目也给出了使用模型进行测试验证的部分脚本。
开放程度
如前所述,该模型所开源的信息较为有限, github中的模型权重链接甚至存在无效的现象,看起来显得比较仓促。