FleetX
latest

分布式训练概述

  • 整体介绍与内容概览

如何设计分布式训练的搭建方案

  • 公有云配置
  • Kubernetes 部署
  • 安装Paddle

前置基础配置

  • 优化算法

配置分布式训练

  • Collective训练
  • ParameterServer训练
    • 1. 快速开始
    • 2. 性能基准
    • 3. 设计思想
    • 4. 性能优化
    • 5. 增量训练
    • 6. 流式训练
    • 7. 分布式指标
    • 8. 分布式预测
    • 9. 二次开发
    • 10. 整体示例

高阶内容

  • 大规模蒸馏
  • 自监督训练
  • 弹性训练
  • FleetX扩展工具包

分布式训练FAQ

  • 用户FAQ
FleetX
  • »
  • ParameterServer训练
  • Edit on GitHub

ParameterServer训练¶

参数服务器分布式训练¶

  • 1. 快速开始
    • 1.1. 版本要求
    • 1.2. 操作方法
  • 2. 性能基准
  • 3. 设计思想
    • 3.1. 综述
    • 3.2. 存储设计
    • 3.3. 通信设计
    • 3.4. 简介
    • 3.5. 原理
  • 4. 性能优化
    • 4.1. 计算图拆分与优化
    • 4.2. 使用InMemoryDataset/QueueDataset进行训练
    • 4.3. 低频通信参数服务器训练算法
  • 5. 增量训练
    • 5.1. 简介
    • 5.2. 原理介绍
    • 5.3. 功能效果
    • 5.4. 使用方法
    • 5.5. 运行成功提示
    • 5.6. 常见问题与注意事项
    • 5.7. 论文/引用
  • 6. 流式训练
    • 6.1. 简介
    • 6.2. 原理介绍
    • 6.3. 功能效果
    • 6.4. 使用方法
    • 6.5. 运行成功提示
    • 6.6. 常见问题与注意事项
    • 6.7. 论文/引用
  • 7. 分布式指标
    • 7.1. 简介
    • 7.2. 原理
    • 7.3. 分布式指标
    • 7.4. 使用方法
  • 8. 分布式预测
    • 8.1. 简介
    • 8.2. 原理
    • 8.3. 使用方法
  • 9. 二次开发
  • 10. 整体示例
Next Previous

© 版权所有 2020, PaddlePaddle. Revision fb2531d5.

Built with Sphinx using a theme provided by Read the Docs.