社区版围绕数据质量管理的核心链路设计:接入数据 → 配置规则 → 执行评测 → 查看报告。免费,但能力不缩水。
五大质量维度
遵循国标 GB/T 36344,覆盖数据质量评测的五个标准维度:
- 规范性 — 数据格式是否符合标准(身份证号、统一社会信用代码等)
- 完整性 — 必填字段是否缺失、数据归集过程中是否丢数据
- 准确性 — 数据取值是否在合理范围内、跨表逻辑是否一致
- 一致性 — 同一数据在不同系统/表中是否一致
- 时效性 — 数据是否及时更新
12 类内置质检规则
全部可视化配置,不需要写 SQL:
| 规则类型 | 用途 | 举例 |
|---|---|---|
| 空值检查 | 必填项校验 | 学生姓名不能为空 |
| 数据缺失检查 | 数据归集/共享是否丢数据 | 源库有 1000 条,目标库只有 950 条 |
| 唯一性检查 | 重复数据检测 | 同一学号不能出现两次 |
| 值域检查 | 取值范围是否合理 | 交易金额必须大于 0 |
| 逻辑检查 | 多字段逻辑关系 | 毛利率 = (收入 - 成本) / 收入 |
| 格式规范性检查 | 格式是否符合标准 | 身份证号、邮箱、手机号格式 |
| 引用完整性检查 | 字段值是否在标准字典内 | 性别只能是男/女 |
| 一致性检查 | 跨表数据比对 | CRM 和订单系统中的客户信息是否一致 |
| 交叉比对检查 | 多表联合验证 | 订单状态 vs 出库记录 vs 物流轨迹 |
| SQL 检查 | 自定义 SQL 验证 | 复杂业务逻辑深度验证 |
| 关联关系检查 | 表间关系验证(1:1、1:N) | 每个员工必须有且仅有一张工卡 |
| 自定义扩展 | 对接外部 API | 调用第三方服务做专项校验 |
不用写 SQL?真的
这是社区版重点解决的问题之一。所有规则都提供了可视化配置界面:下拉选字段 → 选检查方式 → 填参数。没写过 SQL 的业务人员也能自己上手配质检任务。
当然,如果你有复杂需求(比如多表关联、自定义逻辑),也支持 SQL 脚本和 Java 代码扩展。
手动跑还是自动跑?
都支持。可以点一下「立即执行」马上跑一次,也可以设定时任务让它周期性自动巡检。定时策略很灵活:按天、按周、按月都行。
建议日常使用设定时任务,让系统自动盯着数据质量,出问题第一时间发现。
评测完能出报告吗?
能。自动生成两类报告:
- 质量评测报告 — 质量评分、问题统计、各维度得分
- 修复成效报告 — 修复率、趋势分析、修复前后对比
支持在线查看和导出,可以直接拿来汇报。
我的数据安全吗?
社区版完全部署在你自己的服务器上。所有数据都在本地,不上传、不回传到龙石服务器。 龙石无法访问你的任何数据。
适合什么场景?
- 数据资产入表前的质量核验
- AI 训练数据集的质量把关
- 数据交易流通前的合规检查
- 日常数据治理的质量监控
跟企业版有什么区别?
社区版和企业版用的是同一套内核——质检引擎、规则逻辑一模一样。
区别在于:
- 社区版:单机部署,聚焦质量评测核心链路(规则→检测→报告),适合中小团队或部门级使用
- 企业版:支持集群部署、多租户、完整治理闭环(问题派发→修复→督办→考核),另有数据归集、清洗、数据标准管理、数据资产目录等模块
如果社区版已经满足需求,不需要升级。如果后续需要更强的协同和治理能力,企业版无缝衔接。