龙石数据
咨询电话: 0512-87811036,18013092598
联系我们
商务联系微信

商务联系微信

0512-87811036,

18013092598

咨询电话

视频演示>AI智能用数>2025全球数据管理峰会|基于AI智能的顾问式数据分析实践

2025全球数据管理峰会|基于AI智能的顾问式数据分析实践

视频简介

2025年全球数据管理峰会于9月26日至28日在杭州举行。龙石数据的创始人兼总经理练海荣出席并发表了题为“基于AI智能的顾问式数据分析实践”的演讲。

练海荣指出数据治理存在离业务远、响应慢的痛点,而AI用数智能体可实现秒级响应,通过高效落地模式保障高准确率。龙石数据AI用数智能体坚持“把简单留给用户”,致力于让业务人员轻松用数。

视频内容

大家好,我是苏州龙石数据的创始人练海荣,很荣幸能在这里与大家分享我们在“AI智能用数”方面的一些实践。今天我想分享的内容主要有两点:
(1)我们为什么要做AI用数智能体
(2)怎么样来做AI用数智能体效果才会好
1.数据共享交换、数据中台、AI用数智能体三者的关系
数据共享交换、数据中台、AI用数智能体三者的关系

【图(1)】

很多朋友对我们比较熟悉,我们主要做三个产品——数据共享交换平台龙石数据中台第三方数据质量管理平台。今天中午我突然有一个灵感:我们可以把共享交换比作“数据高铁”,数据中台是数据的“加工厂”,而我们正在做的智能用数,则是一个“智能制造工厂”。具体来说,共享交换负责将数据的原材料从业务系统搬运到数据加工厂;龙石数据中台在加工厂内将原始数据加工成“半成品”;而AI用数则进一步将这些半成品加工成数据产品,交付给业务人员使用。
2.我们为什么做AI用数智能体
回顾龙石数据成立八年来的历程,其实颇为艰辛,相信很多同行也有同感。我们常常面临客户的质疑:“我投入了这么多资金、人力和物力,数据治理到底创造了什么价值?”以往我们的回答往往显得苍白:“我们是在打地基,只有把数据加工好,上层才能创造业务价值、实现业务洞察、推动数字化转型。”但自从接触AI之后,我感到非常兴奋。AI用数给了我们一个机会,让我们能够将基础性的数据工作以最便捷、最直观的方式呈现给用户,所以这就是为什么我们决定来做AI用数的原因。
3.数据治理的两大困境
在以往的数据治理实践中,我们主要面临两大困境:
一是数据治理离用户的业务价值太远。我们做了大量数据清洗、数据归集、数据质量管理和数据标准化等工作,但业务人员要想真正使用这些数据,仍需经过数据申请,他们申请完了以后还要请技术人员去把数据下载下来,把它加工成一个Excel报表或者说把开发成一个业务系统。
二是数据需求的响应时间太长了,少则三五天,多则数个月。在这样的情况下,业务人员早已失去耐心,对数据治理也失去了信心。因此,我们必须能够快速、高质量地响应用户需求,而这也正是今天分享的“AI智能用数”所能解决的问题。
产品定位

【图(2)】

4.AI用数智能体能干什么
面对这样的两个问题,那也正是今天分享的这个AI用数智能体能够解决的问题。我举一个简单的例子:当业务人员询问“我们今年的签约情况怎么样”或“今年的回款情况怎么样”时,AI能在几秒内给出回答。再复杂一些的问题,如“请分析各团队业绩对比”,AI也能根据签约、回款情况及考核规则生成报告。若用户进一步追问“为什么张三业绩这么好”,AI会基于张三的业绩、回款、签约等数据,在整个数据仓库中查找相关指标,分析可能的原因,如所在大区的营销活动或负责产品的偶发事件等。这样,AI不仅能快速获取数据,还能进行深层次的线索分析。不过,我称之为“线索性质”的分析,因为AI得出的结果业务人员还不能直接使用,其准确率尚未达到100%。
AI智能体价值目标

【图(3)】

5.AI用数智能体的落地原理
接下来,我将分享我们的实现原理,总结为“1个流程、2个准备和1个运营”。
AI智能体落地

【图(4)】

“1个流程”是指中间蓝色部分:业务用户提出问题后,如果知识库中已有核实过的问题,则直接查询数据、分析并生成可视化报告,这种情况准确率为100%。若知识库中触达不到这个问题,则由大模型进行意图识别、知识检索,生成查询脚本,再查询数据、分析并生成图表,这种情况准确率为95%。所以说这两种情况下,触达知识库,我们的准确率就是100%,触达不到知识库,那我们的准确率就是95%。
“2个准备”中,第一是数据治理和数据安全管理,这是AI用数的基础,在此不做展开。第二是将元数据和业务知识导入知识库,为大模型生成脚本做好准备。例如,用户问“神仙水今年销量如何”,“神仙水”作为业务黑话,实指SK-II精华露,若未将此类业务知识导入知识库,则难以得到准确结果。
“1个运营”是我今天最想强调的部分。由于AI并非100%准确,即使达到95%或99%,生产环境仍需要确定性。因此,我们建立了运营机制:用户若对数据有疑问,可提交工单,运营人员需第一时间响应,补充数据或修正脚本,并反馈用户。此外,运营还包括需求管理。以往数据治理中,业务人员不愿参与,但AI用数上线后,用户会尝试提问。若结果不符预期,他们可能放弃使用。此时,运营人员会通过AI收集问题,补数据或修脚本,并快速地反馈给用户。这样,即使用户未直接参与,也能感受到服务的及时性,从而更愿意参与进来。这套运营体系不仅提升用户体验,也是推动我们的AI用数准确率从95%无限接近100%的关键。
AI智能用数行业产品形态

【图(5)】

我们的AI智能用数时,不是生长在BI上面的,是生长在数据中台上面的,它只是数据中台的用数的一个环节。这样做的好处是为AI用数平台提供了更坚实的数据基础。
7.AI用数的七大组成部分
AI用数的七大组成部分

【图(6)】

经过多轮打磨,我将产品分为七大模块:大模型(主要使用DeepSeek和千问3)、流程编排工具(使用Dify)、知识库(包括数据知识库和业务知识库)、数据治理(没有好的数据治理,就没有AI用数平台)、AI问答、数据分析和智能体运营。其中,运营模块尤为重要,正如我们以往做数据治理时提倡的“三分产品、七分服务”,再好的工具也需配套紧密的服务才能发挥价值。
8.大模型测试报告
龙石AI用数平台-大模型对比报告

【图(7)】

关于测试报告,我们基于某大型互联网招聘平台的SQL面试题进行测试,结果显示DeepSeek和千问3在基础题上准确率均达100%,进阶题中DeepSeek为91%,千问3为85%。此外,测试互联网大厂面试题时,京东、百度、知乎和抖音的准确率均为100%,淘宝和滴滴各错一题。综合来看,产品可达95%的准确率,基本可用。
最后再强调两点:第一,智能用数并非针对整个数据仓库,而是将数仓划分为不同主题,缩小数据域,以提升问答效果;
AI智能用数-用数端效果

【图(8)】

第二,龙石数据本着“把简单留给用户,复杂留给自己”的理念,也就是说,我们要让用户的界面足够的简单,界面按钮尽可能少,用户提问后可直接生成饼图、柱状图等,并附简单数据解读。同时,若用户的提问击中了我们的知识库,会以绿色提示“逻辑已确认,可放心使用”;若是由AI生成的脚本,我们就会以橙色提示用户。
AI智能用数-用数端效果

【图(9)】

我的分享就到这里,欢迎交流讨论。
微信公众号
苏州龙石信息科技有限公司
咨询微信
苏州龙石信息科技有限公司
电话咨询
0512-87811036,18013092598
方案获取
合作交流