PaddleSeg图像分割源码疑问

首页版块访问AI主站注册发帖

PaddleSeg图像分割源码疑问

inhumanday 发布于2021-03 浏览:1423 回复:2

PaddleSeg图像分割源码疑问

快速回复

有无佬儿讲解一下，PadddleSeg新版及近期的几个版本的源码里的 train.py 文件，具体位置在 PaddleSeg-release-v2.0.0-rc\paddleseg\core\train.py，我看这个文件里定义的 train 函数，在 .py 文件中的大概 120-130 行处，在加载训练集数据的时候对每个 batch 的 data 拆包得到了 3 个元素：images、labels 和 edges，如下图所示。我就有点不明白，为什么图像分割一个批次的数据拆包可以得到 3 个元素呢？不应该是两个元素，一个是 images，另一个是表示 batch 中每个图片各个像素对应位置属于哪一类的单通道或者多通道整形张量 mask 吗？我说的 mask 和文件中的 labels 与 edges 都分别是什么关系呢？也有可能是我学艺不精，各位佬轻喷。

飞桨深度学习500问

技术问答

文档

个赞

共2条回复最后由inhumanday回复于2021-03

#3inhumanday回复于2021-03

已经弄明白了，打扰了

#2inhumanday回复于2021-03

图中清晰代码如下：

    timer = Timer()
    avg_loss = 0.0
    iters_per_epoch = len(batch_sampler)
    best_mean_iou = -1.0
    best_model_iter = -1
    train_reader_cost = 0.0
    train_batch_cost = 0.0
    timer.start()

    iter = start_iter
    while iter < iters:
        for data in loader:
            iter += 1
            if iter > iters:
                break
            train_reader_cost += timer.elapsed_time()
            images = data[0]
            labels = data[1].astype('int64')
            edges = None
            if len(data) == 3:
                edges = data[2].astype('int64')

            if nranks > 1:
                logits_list = ddp_model(images)
            else:
                logits_list = model(images)
            loss = loss_computation(
                logits_list=logits_list,
                labels=labels,
                losses=losses,
                edges=edges)
            loss.backward()

快速回复

小编推荐

企业账户充值

小骗子942 3回复

【工单提交手册】如何提交工单反馈问题

用户已被禁言 39回复

如何查看自己的appid号码

付洋洋carrie 51回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服