社区版能做什么?功能速览

Viewed 21

社区版围绕数据质量管理的核心链路设计:接入数据 → 配置规则 → 执行评测 → 查看报告。免费,但能力不缩水。


五大质量维度

遵循国标 GB/T 36344,覆盖数据质量评测的五个标准维度:

  • 规范性 — 数据格式是否符合标准(身份证号、统一社会信用代码等)
  • 完整性 — 必填字段是否缺失、数据归集过程中是否丢数据
  • 准确性 — 数据取值是否在合理范围内、跨表逻辑是否一致
  • 一致性 — 同一数据在不同系统/表中是否一致
  • 时效性 — 数据是否及时更新

12 类内置质检规则

全部可视化配置,不需要写 SQL:

规则类型 用途 举例
空值检查 必填项校验 学生姓名不能为空
数据缺失检查 数据归集/共享是否丢数据 源库有 1000 条,目标库只有 950 条
唯一性检查 重复数据检测 同一学号不能出现两次
值域检查 取值范围是否合理 交易金额必须大于 0
逻辑检查 多字段逻辑关系 毛利率 = (收入 - 成本) / 收入
格式规范性检查 格式是否符合标准 身份证号、邮箱、手机号格式
引用完整性检查 字段值是否在标准字典内 性别只能是男/女
一致性检查 跨表数据比对 CRM 和订单系统中的客户信息是否一致
交叉比对检查 多表联合验证 订单状态 vs 出库记录 vs 物流轨迹
SQL 检查 自定义 SQL 验证 复杂业务逻辑深度验证
关联关系检查 表间关系验证(1:1、1:N) 每个员工必须有且仅有一张工卡
自定义扩展 对接外部 API 调用第三方服务做专项校验

不用写 SQL?真的

这是社区版重点解决的问题之一。所有规则都提供了可视化配置界面:下拉选字段 → 选检查方式 → 填参数。没写过 SQL 的业务人员也能自己上手配质检任务。

当然,如果你有复杂需求(比如多表关联、自定义逻辑),也支持 SQL 脚本和 Java 代码扩展。


手动跑还是自动跑?

都支持。可以点一下「立即执行」马上跑一次,也可以设定时任务让它周期性自动巡检。定时策略很灵活:按天、按周、按月都行。

建议日常使用设定时任务,让系统自动盯着数据质量,出问题第一时间发现。


评测完能出报告吗?

能。自动生成两类报告:

  • 质量评测报告 — 质量评分、问题统计、各维度得分
  • 修复成效报告 — 修复率、趋势分析、修复前后对比

支持在线查看和导出,可以直接拿来汇报。


我的数据安全吗?

社区版完全部署在你自己的服务器上。所有数据都在本地,不上传、不回传到龙石服务器。 龙石无法访问你的任何数据。


适合什么场景?

  • 数据资产入表前的质量核验
  • AI 训练数据集的质量把关
  • 数据交易流通前的合规检查
  • 日常数据治理的质量监控

跟企业版有什么区别?

社区版和企业版用的是同一套内核——质检引擎、规则逻辑一模一样。

区别在于:

  • 社区版:单机部署,聚焦质量评测核心链路(规则→检测→报告),适合中小团队或部门级使用
  • 企业版:支持集群部署、多租户、完整治理闭环(问题派发→修复→督办→考核),另有数据归集、清洗、数据标准管理、数据资产目录等模块

如果社区版已经满足需求,不需要升级。如果后续需要更强的协同和治理能力,企业版无缝衔接。


0 Answers