常见问题与排障

Viewed 8

部署和使用过程中可能遇到的几个典型问题,附排查步骤和解决办法。


镜像拉取失败

现象: 执行安装命令后,卡在拉取镜像阶段,或者报连接超时。

排查:

curl -I https://longshidata-registry.cn-hangzhou.cr.aliyuncs.com

正常返回:

HTTP/2 200
date: ...
cache-control: no-cache

如果返回连接超时或无响应,说明服务器无法访问阿里云容器镜像仓库。

解决: 联系网络管理员,开放服务器对 longshidata-registry.cn-hangzhou.cr.aliyuncs.com 的出站访问(HTTPS 443 端口)。


部署中途失败了,怎么办?

现象: 安装脚本跑到一半报错中断。

解决: 直接重新执行安装命令就行。脚本会自动跳过已完成的步骤,不会重复安装已有组件。

curl -**** https://www.longshidata.com/****** | bash

如果重复执行仍然在同一位置失败,记下错误信息,到社区发帖。


应用启动了但页面访问不了

现象: 部署脚本跑完了,浏览器打开 http://<IP>:90/data-quality-community 显示无法连接。

排查步骤:

1. 确认端口是否在监听:

ss -tlnp | grep 90

如果没有输出,说明应用没启动成功。

2. 查看应用日志:

tail -f /data/longshidata-dq-community/data-quality-community/logs/data-quality-community.log

日志里通常有明确的错误原因(端口冲突、数据库连不上等)。

3. 确认防火墙:

CentOS 7 默认开启 firewalld,可能需要放行 90 端口:

firewall-cmd --add-port=90/tcp --permanent
firewall-cmd --reload

如果在云主机上部署,还要检查云服务商的安全组规则是否放行了 90 端口。


Doris BE 没有注册到 FE

现象: 部署完成后,数据同步或评测任务报 Doris 相关错误。

原因: Doris 的 BE(Backend)节点启动较慢,可能还没向 FE(Frontend)完成注册。

排查: 等 1~2 分钟后执行:

docker exec doris-fe mysql -h 127.0.0.1 -P 9030 -uroot -e "SHOW BACKENDS\G"

看返回结果里的 Alive 字段。如果是 true,说明正常;如果是 false,再等一会重试。

如果等了 5 分钟还是 false,检查 BE 容器日志:

docker logs doris-be --tail 50

DataX / Spark 任务执行失败

现象: 数据同步或质量评测任务报 SSH 连接失败。

原因: 社区版通过 SSH 免密登录来调度本机的执行引擎。如果宿主机的 sshd 没启动或者公钥认证没开,任务就跑不起来。

排查:

# 检查 sshd 是否在跑
systemctl status sshd

正常返回应包含:

Active: active (running) since ...

如果不是 active (running),启动它:

systemctl start sshd
# 检查公钥认证是否开启
grep PubkeyAuthentication /etc/ssh/sshd_config

正常应返回:

PubkeyAuthentication yes

如果不是 yes,执行:

echo "PubkeyAuthentication yes" >> /etc/ssh/sshd_config
systemctl reload sshd

最后验证免密登录是否正常:

ssh -o StrictHostKeyChecking=no -i /root/.ssh/id_rsa root@127.0.0.1 "echo ok"

输出 ok 就说明没问题了。


还没解决?

发帖时最好附上:操作系统版本、部署过程中的错误信息截图、相关的日志片段。信息越完整,定位越快。

0 Answers