mgmt/pve/pve-debug-report.md

2.7 KiB
Raw Blame History

PVE集群调试报告

执行时间

2025年10月8日 10:21-10:23 UTC

集群概览

  • 集群名称: seekkey
  • 节点数量: 3个
  • 节点名称: nuc12, xgp, pve
  • 连接方式: Tailscale MagicDNS
  • 认证信息: root / Aa313131@ben

1. 连接性测试

Ping测试结果

  • nuc12: 可达
  • xgp: 可达
  • pve: 可达

节点间连通性

  • nuc12 ↔ xgp: 成功
  • nuc12 ↔ pve: 成功
  • xgp ↔ pve: 成功

Tailscale状态

  • 所有节点都正确连接到Tailscale网络
  • 使用MagicDNS解析主机名
  • 网络延迟正常0.4-2ms

2. PVE集群状态

服务状态

  • pve-cluster: active
  • pveproxy: active
  • pve-firewall: active
  • pvedaemon: active

集群配置

  • 配置版本: 7
  • 传输协议: knet
  • 安全认证: 启用
  • Quorum状态: 正常 (3/3节点在线)
  • 投票状态: 正常

节点信息

  • Node 1: pve (192.168.31.4)
  • Node 2: nuc12 (192.168.31.2)
  • Node 3: xgp (192.168.31.3)

3. SSH配置分析 ⚠️

当前状态

  • SSH服务: 运行正常
  • Root登录: 允许
  • 公钥认证: 启用
  • 密码认证: ⚠️ 可能被禁用
  • 键盘交互认证: 禁用

SSH公钥

  • authorized_keys文件存在且包含所有节点公钥
  • 文件权限: 600 (正确)
  • 文件所有者: root:www-data (PVE特殊配置)

连接问题

  • SSH密码认证失败
  • 达到最大认证尝试次数限制
  • 可能原因: KbdInteractiveAuthentication=no 导致密码认证被禁用

4. 系统资源状态

磁盘空间

  • 所有节点磁盘空间充足

内存使用

  • 所有节点内存使用正常

系统负载

  • 所有节点负载正常

5. 问题诊断

主要问题

  1. SSH密码认证失败: 由于KbdInteractiveAuthentication=no配置
  2. 认证尝试次数超限: MaxAuthTries限制导致连接被拒绝

解决方案建议

  1. 启用密码认证:

    # 在/etc/ssh/sshd_config.d/目录创建配置文件
    echo "PasswordAuthentication yes" > /etc/ssh/sshd_config.d/password_auth.conf
    systemctl reload ssh
    
  2. 或者使用SSH密钥认证:

    • 公钥已正确配置
    • 可以使用SSH密钥进行无密码登录

6. 结论

  • PVE集群: 完全正常
  • 网络连接: 完全正常
  • 服务状态: 完全正常
  • SSH连接: ⚠️ 需要配置调整

7. 建议操作

  1. 修复SSH密码认证配置
  2. 或者使用SSH密钥进行连接
  3. 集群本身运行完全正常可以正常使用PVE功能

报告生成时间: 2025-10-08 10:23 UTC Ansible版本: 2.15+ PVE版本: 最新稳定版