“坤元”是专注于地理科学的专业语言大模型,由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发,具备“懂地理”“精配图”“知人心”“智生图”等特点。
全球首个多模态地理科学大模型“坤元”发布现场(9月19日摄)。新华社记者 李鑫 摄
据介绍,研发团队建立了涵盖4大类、16小类的地理全学科语料库,提供320亿词元供大模型自监督学习,并制作了4万余条高质量地理学指令进行模型微调。相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识。
9月19日,地理科学大模型研发组首席科学家、中国科学院地理科学与资源研究所研究员苏奋振发布地理科学大模型“坤元”。新华社记者 李鑫 摄