WAIC 2024 院士话AI丨大模型的定位：是智能决策还是辅助工具？

深圳新闻网2024年7月8日讯（记者吴炳然）7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议（WAIC2024）在上海开幕，深圳计算科学研究院首席科学家樊文飞院士应邀出席，在中信集团承办的投融资主题论坛发表了“AI=机器学习+逻辑推理”的主旨演讲，和与会嘉宾分享了AI领域前沿趋势和在垂直领域应用的重大机遇。

樊文飞院士是国际上囊括了数据库理论与系统顶级会议最佳论文和时间检验奖的两位学者之一，被誉为“极少数在数据库理论及系统两方面都做出突破性贡献的世界级科学家之一”。

大模型，目前挑战与机遇并存

樊文飞院士指出，通用大模型推动了行业的变革，引起社会的广泛关注，但也存在局限性。作为辅助工具，大模型表现优异；但在智能制造的应用前景还有待观察。

当下的大语言模型是基于统计类的机器学习模型，无法满足结果的可解释，且无法同时满足模型的“准确性”“公平性”和“鲁棒性”要求，逻辑推理能力不强，训练成本高（算力、数据、能耗），而且经常产生“幻觉” (hallucination)。

可否应用大模型在生产关键环节做出实时“决策”，解决行业痛点，提高生产效率？如何确保大模型在智能制造决策中的准确性和可靠性？如何减少它们所产生的幻觉？能否增强机器学习的逻辑推理能力？所以要讨论大模型的远景，首先要确定大模型的定位，不能企望大模型做到其所不能。

如何在工业界发挥人工智能的效能，解决行业痛点，是业界需要关注和解决的一项重大机遇和挑战。值得业界思考的是，在解决行业痛点问题时，大模型是否最优解，能否找到成本低、高精度、易解释的方法，为行业痛点提供实时解决方案。

以“AI+”的自动化、高精度、可解释、低成本赋能工业界

在人工智能技术的发展大潮中，中国应发挥在制造业规模大、垂直领域数据积累多等优势。樊文飞院士提出：以“机器学习+逻辑推理”的“AI+”发展思路，在提高模型结果准确度的同时赋予结果可解释性；与此同时，通过逻辑规则融入行业（小）模型预测，大幅降低模型的落地成本。

深算院通过独创的机器学习模型与业务逻辑规则的高效结合，研发填补国际空白的钓鱼城数据分析系统，并衍生出生产工艺、配方优化、网络安全、新药研发、金融风控、精准推荐等行业的AI应用创新，均已上线应用。

如在动力电池制造行业，助力头部企业在保证误差率0.06%-0.01%的同时，缩短80%化成分容生产周期，降低50%能耗，单条产线节省上千万设备成本，每GWh产能年节省上百万元电费，并可扩展优化更多工艺环节。钓鱼城系统已证明可以实现实时决策、精准解释、自动适配，并在算力不足、训练样本较少的情况下，得到远超大模型的精度，解决许多行业痛点。

语料准备与算力同等重要

樊文飞院士表示，目前社会广泛聚焦的是大模型以及与其相关的算力，忽视了大模型训练必需的语料准备这一关键环节。

大模型的精度和可用性取决于所训练的语料数据，如果致力于打造一个具备产线实时应用的大模型决策系统，那么语料清洗的重要性和算力同等重要。

基于“大数据质量保证模型与方法”原创理论，深算院研发的采石矶数据质量系统，为上海数据交易所的数据评估和数据交易流程提供底层能力支撑，落地国内首创的大数据精准量化质量评估，实现了自动化的数据质量评估和数据质量增强，真正打通数据要素进入流通的关键节点。

下一步该系统将继续为大模型的训练提供优质的语料数据和行业调优数据，以提升行业大模型的准确性。

走出国产基础软件的“寒冬”

樊文飞院士认为，标准化基础软件研发的重要性不亚于大模型，目前中国在芯片技术领域已经受制于人，如果开源软件被禁用，中国的大模型发展将何去何从？所以坚持自主源头创新和自研根技术，才能推动中国软件行业真正走出受制于人的困境。

例如，深算院以有界计算、跨模计算等创新理论，研发出全自研满足AI场景需求的崖山数据库系统，实现与国际主流数据库在高端场景提供1：1的平替能力，在中国人民银行数字货币场景，通过反复数十万次的故障和高可用测试，故障恢复和数据一致性得到强保证，在兼容、功能、故障、运维、备份、安全、性能等维度，满足数字货币场景对数据库的业务诉求。