网站地图 | Tags | 热门标准 | 最新标准 | 订阅

T/CES 128-2022 电力人工智能平台总体架构及技术要求

  • 名  称:T/CES 128-2022 电力人工智能平台总体架构及技术要求 - 下载地址2
  • 类  别:团体标准规范
  • 下载地址:[下载地址2]
  • 提 取 码
  • 浏览次数:3
下载帮助: 发表评论 加入收藏夹 错误报告目录
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
新闻评论(共有 0 条评论)

资料介绍

《T/CES 128-2022 电力人工智能平台总体架构及技术要求》主要内容的详细总结,结构力求丰富:

​文档核心目标:​​ 规范电力行业人工智能平台的构建、技术要求以及算法模型共享应用,为平台的规划、设计、开发、运维和模型应用提供标准化依据。

​一、 范围与基础 (第1-4章)​

  1. ​适用范围:​​ 明确适用于电力人工智能平台的规划、设计、开发、运维和算法模型应用。
  2. ​规范性引用文件:​​ 列出支撑本标准的技术基础,涉及信息技术词汇、安全评估准则、OCR规范等。
  3. ​术语和定义:​​ 定义了33个关键术语,是理解文档的基础。核心包括:
    • ​人工智能 (AI):​​ 研究模拟人类智能功能的交叉学科。
    • ​训练、推理、样本数据:​​ AI模型开发的核心过程和数据。
    • ​深度学习框架:​​ 如 PyTorch, TensorFlow, MXNet, Caffe。
    • ​电力人工智能平台:​​ 整合机器学习框架,支持电力样本管理、模型开发训练、服务发布全流程的一站式系统,包含电力模型库和样本库。
    • ​电力专用模型/任务:​​ 服务于电力生产特定场景的模型及任务类型(如图像分类、目标检测、数值回归等)。
    • ​管理信息大区/互联网大区:​​ 电力行业关键的信息安全分区概念。
    • ​容器部署 (Docker/Kubernetes):​​ 平台要求的模型部署方式。
  4. ​缩略语:​​ 解释了文档中出现的20个专业缩略语(如OCR, ROC, AUC, FRR, SER, FAR, FPR, TPR, F1, TP, FP, RPA)。

​二、 架构要求 (第5章)​

  1. ​总体架构要求:​

    • ​核心组成部分:​​ 平台由 ​​训练环境、模型库、样本库、运行环境、管理中心​​ 和 ​​统一服务门户​​ 六大块构成。
    • ​数据来源:​​ 样本数据应直接来源于电力业务数据中台。
    • ​环境隔离:​​ 生产环境和训练环境的样本库与模型库内容需严格区分(如生产模型库仅含验证通过的模型)。
    • ​服务提供:​​ 服务层通过资源层(算力、中间件、模型服务)为应用层提供支持。
    • ​通用能力:​​ 服务层提供计算机视觉、自然语言处理、智能语音、知识图谱、RPA等通用算法组件。
    • ​样本与模型关系:​​ 样本库支撑训练,训练结果输出至模型库;模型库支持管理、封装、共享、发布。
    • ​部署分区:​
      • 主要在​​管理信息大区​​部署。
      • ​互联网大区​​仅部署模型管理和业务模型服务组件,模型由管理信息大区通过隔离装置同步。

     

     

  2. ​技术架构要求:​

    • ​分层结构:​​ 分为 ​​应用层 (API/SDK/GUI访问)、服务层 (平台功能)、能力层 (核心引擎/组件)、资源层 (基础设施)​​。
    • ​模型管理:​​ ​​必须​​采用容器化部署 (Kubernetes & Docker)。
    • ​算法集成:​​ 需包含主流算法模块 (SVM, SVD, PCA, YOLO等)。
    • ​学习框架:​​ 需支持主流开源深度学习框架 (PyTorch, TensorFlow, MXNet, Caffe)。
    • ​数据处理:​​ 数据接入宜用 Kettle/Sqoop;特征预处理宜支持 Numpy, Scikit-learn;数据存储宜支持 Ceph。
    • ​多租户与配置:​​ ​​必须​​支持多租户;配置管理宜采用配置引擎开发。
    • ​硬件支持:​​ AI芯片计算资源包括但不限于 FPGA, ASIC。

     

     

  3. ​数据架构要求:​

    • ​数据存储:​​ 原始数据按图像、视频、语音、文本等类型存储,经标注后形成样本库。
    • ​核心数据流:​
      • ​样本数据流:​​ 经数据总线/消息总线 -> 样本中心 -> 预处理/标注 -> 训练/推理/测试组件。
      • ​模型数据流:​​ 训练组件使用样本 -> 生成模型 -> 入库模型中心。
      • ​业务应用流:​​ 业务应用数据 -> 推理组件 (调用模型中心模型) -> 返回结果给业务应用。
    • ​中心功能:​​ 样本中心和模型中心需支持同步功能。
    • ​边缘协同:​
      • 模型中心模型可下发至物联管理平台 -> 边缘端。
      • 边缘端样本/异常结果可上传至物联管理平台 -> 样本中心,用于模型迭代优化。

     

     

​三、 技术要求 (第6章)​

  1. ​功能要求:​

    • ​训练中心:​
      • 项目管理: 项目全生命周期管理 (创建、删除、状态监测、切换)。
      • 训练框架:​必须​​兼容 PyTorch, TensorFlow, MXNet, Caffe。
      • 训练方式: 支持 Notebook式、命令式、GUI任务式。
      • 资源调度:​宜​​支持 GPU 显存分配。
      • 算法评估:​必须​​按算法类型提供评估指标:
        • 分类:准确率、召回率、F1值。
        • 聚类:准确率、精确率、召回率、紧密性、间隔性。
        • 回归:均方误差、均方根误差、决定系数、校正决定系数。
      • 算法管理: 支持算法文件分类上传、下载、保存。
    • ​模型中心:​
      • 模型管理: 支持接收、发送、删除、版本管理、收藏模型。
      • 推理服务: 支持一键式/引导式自动部署发布,​​必须​​支持 GPU 显存分配管理,提供服务测试、接口管理、请求审核。
    • ​样本中心:​
      • 样本管理: 支持接入、发送数据,数据集管理。
      • 数据导入:​必须​​支持本地、数据库、HDFS、FTP、NFS等方式。
      • 数据预处理: 提供通用预处理方法 (缺失、异常处理),按数据类型提供特定方法:
        • 文本:标记化、归一化、替换。
        • 图片/视频:特征提取、图片增强、去噪。
        • 语音:特征提取、数据增强、预加重、分帧。
      • 数据标注: 标注流程管理,支持文本、图像、语音、视频标注,​​宜​​提供基于模型的智能标注。
  2. ​性能要求:​

    • ​响应时限 (系统负载 < 80%时):​
      • 前端页面响应 ≤ 5s。
      • 后端服务响应 ≤ 3s。
      • 训练任务创建/推理服务申请响应 ≤ 3s。
      • 推理调用响应 ≤ 3s。
    • ​可靠性 (724h服务不中断):​
      • 需冗余设计保证:数据完整性、算力完整性、消息完整性、任务调度完整性、网络完整性。故障修复后应能自动恢复运行。
    • ​可扩展性:​​ 支持软硬件扩展升级,不影响现有样本、任务、服务。
  3. ​安全要求:​

    • ​基础安全:​​ 符合 GB/T 18336-2015 及《中华人民共和国数据安全法》。
    • ​容错安全:​​ 考虑模型计算结果偏差、精度降低、响应超时对业务系统的影响。
  4. ​硬件要求:​

    • 服务器​​必须​​具备 GPU 算力资源,支持 CUDA 和 CUDNN 加速。
    • ​显存要求:​
      • 训练任务:​​不应低于 16GB​​,宜 ≥ 32GB,宜用 SSD 缓存样本。
      • 推理服务:​​不应低于 8GB​​,宜 ≥ 16GB。
      • 系统运行:​​不应低于 8GB​​,宜 ≥ 16GB。

​四、 算法模型共享要求 (第7章)​

  1. ​共享基础:​​ 算法模型文件和描述性文档。
  2. ​算法模型文件:​
    • ​模型源文件:​​ 训练得到的参数存储文件,框架不同格式不同:
      • Caffe: .caffemodel (参数) + .prototxt (结构)。
      • PyTorch: .pth (结构和参数)。
      • TensorFlow: .meta, .data, .index.h5/.pb (整合)。
      • MXNet: .params (参数) + .json (结构)。
      • 其他框架: 可采用通用 PMML (.xml) 描述。
    • ​模型配置文件:​​ 描述运行时可调参数,​​必须​​包含 BatchSize, Width, Height, Channel, GPU ID 等关键字段。
    • ​模型运行脚本文件:​​ 提供模型加载、训练/推理的代码,按配置文件参数运行。
  3. ​算法模型描述性文档:​
    • ​数据集描述:​​ 来源、类型、标注格式、样本量、数据格式等。
    • ​属性描述:​​ 版本、作者、发布时间、框架、语言、运行环境、硬件配置等。
    • ​性能描述:​​ ​​必须​​提供核心性能指标,类型不同指标不同:
      • 目标检测: 准确率、精确率、召回率、AP、mAP、IoU、ROC、AUC、P-R曲线等。
      • 语音识别: 词错误率(WER)、句错误率(SER)。
      • OCR识别: 拒识率(FRR)、误识率(FAR)。
      • 人脸识别: 准确率、精确率、召回率、AP、mAP、F1值、ROC、FPR、TPR等。
      • 自然语言处理: 准确率、精确率、召回率、F1值、ROC、AUC、BLEU、偏差与方差。
      • 知识图谱: 准确率、覆盖率、响应时间。
  4. ​算法模型共享应用方式:​
    • ​部署应用:​​ ​​必须​​支持至少一种:
      • 模型文件部署: 根据源文件、配置文件、依赖说明手动部署环境。
      • 容器部署: 利用 Docker 封装模型及运行环境进行部署。
    • ​二次训练应用:​​ ​​宜​​支持基于提供的开发语言、框架、数据集和文档进行参数调优。

​总结:​​ 该标准为电力行业构建统一、高效、安全的人工智能平台提供了全面的技术蓝图。它明确了平台的分层架构(总体、技术、数据)、核心功能组件(训练、模型、样本中心)、严格的性能与安全指标、详细的模型共享规范(文件格式、描述文档、部署方式),并特别强调了电力生产环境(如分区部署、专用模型任务)的特殊要求,是推动电力人工智能规范化应用的重要依据。

2351370426235
下载排行 | 下载帮助 | 下载声明 | 信息反馈 | 网站地图  360book | 联系我们谢谢