当前位置:首页 > 深度学习 > 正文内容

深度学习计算机视觉技巧合集大体框架

青鱼9个月前 (07-15)深度学习259

1.png

如何读取数据

  1. 如何读取目标识别的数据集

  2. 如何读取目标检测的数据集

    1) 如何读取xml格式的数据。

    2) 如何读取coco格式的数据。

如何设计dataset类

    1. 调用torchvision提供的dataset类

    2. 设计和定制自己的dataset类:

        1) 定制目标识别任务的dataset类。

        2) 定制目标检测任务的dataset类。

数据增强

  1. 讲解常用的数据增强方法,比如旋转、平移、仿射、缩放等数据增强方法。

  2. 讲解一些基于目标检测任务的数据增强方法:Mosaic、Mixup、Cutout等数据增强方法。

  3. 在dataset类中如何排列组合各种数据增强方法,从而实现不错的数据增强效果,增强数据集的多样性和复杂度,防止模型过拟合,提高模型的性能。

模型的各种注意事项

  1. 讲解关于卷积操作的一些注意事项,比如高宽减半,通道翻倍,1x1卷积的使用等。

  2. 讲解全连接层的一些妙用。

  3. 讲解注意力机制:重点说明自注意力和交叉注意力这2种注意力机制。

如何设置优化器

    1. 讲解一些主流的优化器,比如SGD、adam、adamW等。

    2. 说明不同的优化器的优势和劣势,以及各自的使用场景。

如何设置损失函数和编写自己的损失函数

    1. 讲解目标识别方法中常用的2种损失函数:交叉熵损失函数和二叉熵损失函数,以及什么情况下使用哪个损失函数。

    2. 讲解目标检测的一些常用算法,比如欧式距离、IOU、GIOU、DIOU、CIOU等边界框损失函数,并解释为什么要做出这些改进。

如何设置学习率调度器

    1. 讲解学习率是什么,在训练过程中起到什么作用。

    2. 为什么需要使用学习率调度器,学习率调度器在训练过程中发挥了什么作用。

    3. 讲解一些常用的学习率调度器,比如steps阶梯下降算法,退火算法(cosine)等

如何打印日志,记录训练过程中的各种信息

    1. 日志是什么,为什么我们需要打印日志。

    2. 如何打印日志,便于我们更好地检查整个训练周期中模型的状态变化,帮助我们预测训练的趋势。

如何保存权重

    1. 为什么需要保存权重,以及如何保存权重。

如何装载预训练权重

    1. 如何让模型装载已经训练好的权重。

    2. 学会装载预训练权重对于断点重启很重要,极大帮助我们避免训练中断造成的损失。

如何断点重启

我们难免会遇到各种突发状况,比如断电,不小心点了停止按钮等等,如果重新开始训练模型,那么之前训练的结果势必就白费了,不仅花费更多的时间,而且对于租用服务器的小伙伴也很不友好,要花更多的钱,因此非常需要掌握断点重启这个技巧!!!

    1. 断点重启是什么,为了实现断点重启,我们需要保存哪些训练参数。

    2. 如何进行断点重启,断点重启时有什么注意事项。

如何单机多卡运行

一张卡有局限,多张卡无极限,当我们学习完单机多卡训练技巧,就再也不用担心显存不足的问题了!!!

    1. 什么是单机多卡训练,Pytorch提供哪些方法可以实现单机多卡训练

    2. 单机多卡训练具体如何实现,有哪些地方的实现要非常小心。

使用多种训练技巧

分享常用的模型训练技巧,比如ema、标签平滑、退火cosine、warmup等。

如何使用chatGPT帮助我们阅读理解别人的代码

分享一些魔法,并提供一些阅读代码的相关提示词(个人一直试,发现的高质量提示词)

返回列表

没有更早的文章了...

没有最新的文章了...

“深度学习计算机视觉技巧合集大体框架” 的相关文章