社区版目前支持 8 种数据库的接入,覆盖主流关系型数据库和常见的国产数据库。
支持的数据库列表
关系型数据库:
- MySQL
- Oracle
- SQL Server
- PostgreSQL
国产数据库:
- Doris
- Vastbase G100
- KingbaseES V8
- GBase8a
能同时接入多个数据源吗?
能。在「数据源接入」模块分别配置即可,平台支持同时管理多个不同类型的数据源,统一在一个界面下操作。
不支持的数据源怎么办?
目前暂不支持 Hive、MongoDB、HBase 等非关系型数据库,也不支持 API、文件等非数据库类型的数据源接入。
如果你的数据在这些系统里,有两种办法:
- 先把数据同步到平台支持的数据库中(比如 MySQL),再接入
- 联系官方咨询企业版方案,企业版支持更丰富的数据源类型
数据源怎么接入?
- 进入「数据源管理」→「数据源接入」
- 选择数据库类型
- 填写连接信息:主机地址、端口、数据库名、用户名、密码
- 选择分类和分层(见下文)
- 保存后,系统会自动创建元数据采集任务
接入后建议先跑一次元数据采集,把表结构同步过来,后续配置质检规则时就能直接选表和字段了。
数据库分层是什么意思?
平台内置了数据仓库的标准分层,接入数据源时需要指定属于哪一层:
| 分层 | 含义 | 用途 |
|---|---|---|
| 来源库 SRC | 业务系统的原始数据库 | 接入 CRM、ERP 等业务系统的数据库 |
| 贴源库 ODS | 原始数据的镜像层 | 存放从来源库同步过来的、未经处理的原始数据 |
| 治理库 DW | 数据加工的核心仓库 | 经过清洗、转换、标准化后的数据,质检主要在这一层 |
| 应用库 ADS | 面向业务的数据服务层 | 报表、指标、宽表,直接给业务人员查询使用 |
| 共享库 DS | 对外数据共享出口 | 跨部门数据共享的发送端和接收端 |
不确定选哪一层?大多数情况选「来源库 SRC」或「治理库 DW」即可。