## 3.1.1首页
首页中心区域展示系统概况,包括系统资源使用情况、分区资源使用情况、节点状态、以及任务执行情况。
![](https://img.kancloud.cn/4c/e2/4ce2f86e40e60397455816e366c236bd_1920x947.png)
图3-1-1-1
### **已申请资源**
![](https://img.kancloud.cn/ed/47/ed47f34d8c0d9b047bee4adead3b6c2f_1099x162.png)
图3-1-1-2
① 集群GPU申请配额占比为167% :所有分区申请的GPU核心数总和 / 集群GPU总核心数
每个分区申请的GPU核心数**总和**:点击左侧菜单“分区”,在“分区”界面中将各个分区申请的GPU数量相加。
集群GPU总核心数:集群物理硬件GPU信息。
② 集群CPU申请配额占比为183% = 所有分区申请的CPU核心数**总和** / 集群CPU总核心数(图3-1-1-2示例集群每个分区申请的CPU核心数总和为176核,集群物理CPU核心数为96核)
每个分区申请的CPU核心数**总和**:点击左侧菜单“分区”,在“分区”界面中将各个分区申请的CPU数量相加。
③ 集群内存申请配额占比160%:所有分区申请的内存容量**总和** / 集群内存容量(图3-1-1-2示例集群每个分区申请的内存数总和为803GB,集群物理内存容量为503GB)
### **已用资源**
![](https://img.kancloud.cn/d7/e1/d7e1093e9baceed3b564df7792ee4bcc_1074x314.png)
图3-1-1-3
GPU:集群GPU实时使用占比情况。
CPU:集群CPU实时使用占比情况。
内存:集群内存实时使用占比情况。
### **分区**:各个分区GPU、CPU、内存资源的使用情况。
![](https://img.kancloud.cn/47/4b/474bc2ae0ca00fe154b5dad2c7016e4c_556x397.png)
图3-1-1-4
分区Z1中GPU、CPU、内存的已分配数量和总数的比例。点击“查看”、“创建分区”按钮,进入分区功能的对应界面。(详细请看“集群资源\-分区”)
### **节点**
![](https://img.kancloud.cn/39/b9/39b9b3183655f32ab9e4d320c4bd7c82_1103x345.png)
图3-1-1-5
图3-1-1-5为集群内节点信息。
节点在线与离线数量:
n 服务状态:
正常为 ![](https://img.kancloud.cn/d8/5e/d85ef27c1bfd8a32015b46e3f8f60a72_30x23.png) ;异常为 ![](https://img.kancloud.cn/1a/28/1a289591d43b48dc678e7a0af49a4ed7_25x22.png) (节点网络异常或关机)。
n 健康状态:
正常为 ![](https://img.kancloud.cn/d8/5e/d85ef27c1bfd8a32015b46e3f8f60a72_30x23.png) ;异常为 ![](https://img.kancloud.cn/1a/28/1a289591d43b48dc678e7a0af49a4ed7_25x22.png)(节点CPU、GPU、内存、硬盘异常)。
n 节点(最近添加):展示最近添加节点的物理配置信息,管理员具有查看所有节点的权限。
n 点击“查看”按钮,进入“节点”管理界面。详细请看“集群资源\-节点”。
### **任务统计:( “任务训练”中任务)**
![](https://img.kancloud.cn/51/ea/51ea69612b182ccea96e9c14f348e292_566x340.png)
图3-1-1-6
用户任务信息展示:
任务统计(今天 ):共4 .(4为今天创建的任务数量。)
已计划:“任务训练”中已计划的任务数量。
已完成:“任务训练”中已完成训练的任务数量。
运行中:“任务训练”中正在运行的任务数量。
暂停中:“任务训练”中已暂停的任务数量。
- 1.产品介绍
- 2.基本操作
- 2.1登录与登出
- 2.2更改系统语言
- 2.3激活系统与更新授权
- 2.3.1首次激活
- 2.3.2更新License
- 2.4管理员手册
- 2.5版本升级
- 2.6用户信息
- 3.首页
- 3.1首页
- 4.集群资源
- 4.1分区
- 4.1.1创建分区
- 4.1.2修改分区
- 4.1.3删除分区
- 4.2节点
- 4.2.1节点列表
- 4.2.2自动添加节点
- 4.2.3为节点添加标识
- 4.2.4查询节点
- 4.2.5节点开关机控制
- 4.2.6查看节点详细信息
- 4.2.6.1节点信息
- 4.2.6.2节点资源监控
- 4.2.6.3节点内服务详情
- 4.2.6.4节点控制台
- 5.模型训练
- 5.1任务统计
- 5.2任务训练
- 6.数据存储
- 6.1公共数据
- 6.1.1创建目录、刷新、上传数据
- 6.1.2文件列表(文件及文件夹管理)
- 6.2数据卷
- 6.2.1查看卷列表
- 6.2.2创建NFS卷
- 6.2.3创建GLUSTER卷
- 6.2.4查看卷使用情况
- 6.2.5扩容卷
- 7.任务镜像
- 7.1公共镜像
- 7.1.1上传镜像
- 7.1.2搜索镜像
- 7.1.3删除镜像
- 7.1.4制作镜像
- 7.1.5删除镜像标签
- 7.2下载镜像
- 7.2.1Docker Hub
- 7.2.2AIMAX机器学习镜像
- 7.3镜像仓库
- 7.3.1上传镜像
- 7.3.2查询镜像仓库
- 7.3.3查看镜像仓库详情
- 7.3.4将用户私有镜像设为公开
- 8.用户权限
- 8.1用户
- 8.1.1查看用户
- 8.1.2修改用户默认配额
- 8.1.3创建用户
- 8.1.4修改用户信息
- 8.1.5删除用户
- 8.1.6查询用户
- 8.2用户组
- 8.2.1查看用户组
- 8.2.2创建用户组
- 8.2.3查询用户组
- 8.2.4删除用户组
- 9.监控中心
- 9.1监控中心
- 9.1.1节点
- 9.1.2分区
- 9.2监控报表
- 9.2.1查看指定时间段的资源利用情况
- 9.2.2选择监控对象(集群、节点、分区)
- 9.2.3下载监控结果
- 10.服务条款