Skip to content
/ yolov5 Public
forked from ultralytics/yolov5

在幻方萤火集群上优化训练 YOLOv5 🚀

License

Notifications You must be signed in to change notification settings

HFAiLab/yolov5

 
 

Repository files navigation

YOLOv5 在幻方萤火集群上的训练优化

简体中文 | English

幻方 AI 在萤火集群上对 YOLOv5 进行了训练优化,通过自研的 3FS数据集仓库hfreduce 多卡通信、算子等优化工具,实现了近 50% 的训练提速。

Requirements

Training

通过 hfai 工具提交任务至萤火集群,使用4张显卡训练:

HF_ENV_NAME=py38-202111 hfai python train.py -- -n 4 --name train_yolov5

集群的默认环境 202111 已经集成了训练所需的依赖。

Dataset

hfai 数据集仓库集成了 COCO 数据集,可以访问集群地址 /public_dataset/1/ffdataset/COCO/ 获取 FFRecord 格式的高性能训练样本数据。

使用方式如下:

from hfai.datasets import COCODetection
from ffrecord import FileReader
from ffrecord.torch import Dataset, DataLoader

class LoadImagesAndLabels(Dataset):
  def __init__(self, ...):
    self.data_dir = COCODetection('train').data_dir
    self.reader = FileReader(self.data_dir / "train2017.ffr", check_data=True)

    ...

训练效果:

About

在幻方萤火集群上优化训练 YOLOv5 🚀

Resources

License

Code of conduct

Security policy

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 80.9%
  • Jupyter Notebook 17.9%
  • Other 1.2%