码迷,mamicode.com
首页 > 其他好文 > 详细

深度之眼PyTorch训练营第二期 ---5、Dataloader与Dataset

时间:2019-10-21 19:18:53      阅读:127      评论:0      收藏:0      [点我收藏+]

标签:输出   loader   迭代   test   data   类别   sample   last   set   

一、人民币二分类

描述:输入人民币,通过模型判定类别并输出。

 

  • 数据:四个子模块

    数据收集 -> img,label 原始数据和标签
    数据划分 -> train训练集 valid验证集 test测试集
    数据读取 -> DataLoader ->(1)Sampler(生成index) (2)Dataset(读取Img,Label)
    数据预处理 -> transforms

1、DataLoader

  •   torch.utils.data.DataLoader  功能:构建可迭代的数据装载器
    •   dataset:Dataset类,决定数据从哪里读取及如何读取
    • batchsize:批大小
    •        num_works:是否多进程读取数据
    •        shuffle:每个epoch是否乱序
    •        drop_last:当样本数不能被batchsize整除时,是否舍弃最后一批数据
  • Epoch、Iteration、Batchsize关系

    Epoch:所有训练样本都已输入到模型中,称为一个epoch

    Iteration:一批样本输入到模型中,称之为一个Iteration

    Batchsize:批大小,决定一个Epoch有多少个iteration

    例如:样本总数:80 batchsize:8 

      1    epoch = 10  iteration  一次iteration输入8个样本,所以一次的epoch=8

        样本总数:87 batchsize:8

      if drop_last = true  1 epoch = 10  iteration

                      else drop_last = false 1  epoch = 11 iteration

2、Dataset

  • torch.utils.data.Dataset   功能:Dataset抽象类,所有自定义的Dataset需要继承它,并且复写
    •   __getitem__()  :接收一个索引,返回一个样本及标签

3、数据读取:

思考:读哪些数据?从哪里读数据?怎么读数据?

 

 

二、Dataloader与Dataset

---恢复内容结束---

一、人民币二分类

描述:输入人民币,通过模型判定类别并输出。

 

  • 数据:四个子模块

    数据收集 -> img,label 原始数据和标签
    数据划分 -> train训练集 valid验证集 test测试集
    数据读取 -> DataLoader ->(1)Sampler(生成index) (2)Dataset(读取Img,Label)
    数据预处理 -> transforms

1、DataLoader

  •   torch.utils.data.DataLoader  功能:构建可迭代的数据装载器
    •   dataset:Dataset类,决定数据从哪里读取及如何读取
    • batchsize:批大小
    •        num_works:是否多进程读取数据
    •        shuffle:每个epoch是否乱序
    •        drop_last:当样本数不能被batchsize整除时,是否舍弃最后一批数据
  • Epoch、Iteration、Batchsize关系

    Epoch:所有训练样本都已输入到模型中,称为一个epoch

    Iteration:一批样本输入到模型中,称之为一个Iteration

    Batchsize:批大小,决定一个Epoch有多少个iteration

    例如:样本总数:80 batchsize:8 

      1    epoch = 10  iteration  一次iteration输入8个样本,所以一次的epoch=8

        样本总数:87 batchsize:8

      if drop_last = true  1 epoch = 10  iteration

                      else drop_last = false 1  epoch = 11 iteration

2、Dataset

  • torch.utils.data.Dataset   功能:Dataset抽象类,所有自定义的Dataset需要继承它,并且复写
    •   __getitem__()  :接收一个索引,返回一个样本及标签

3、数据读取:

思考:读哪些数据?从哪里读数据?怎么读数据?

 

 

二、Dataloader与Dataset

深度之眼PyTorch训练营第二期 ---5、Dataloader与Dataset

标签:输出   loader   迭代   test   data   类别   sample   last   set   

原文地址:https://www.cnblogs.com/cola-1998/p/11715284.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!