pytorch环境之mask-rcnn源码实现
创始人
2025-05-29 18:59:01
0

pytorch环境之mask-rcnn源码实现

  • 1.下载源码及配置环境
    • 1.1 mask-rcnn源码下载
    • 1.2 安装项目依赖包
    • 1.3 coco2017数据集下载
    • 1.4 气球数据集下载
  • 2. 使用coco2017数据集训练模型
    • 2.1 修改数据集类别名称和类别数量
    • 2.2 修改配置文件
    • 2.3. 代码运行报错问题解决
  • 4.气球数据集训练模型
    • 4.1 修改数据集类别名称和类别数量
    • 4.2 修改配置文件
    • 4.3 代码运行
    • 4.5 优化模型
      • 4.5.1 打印损失
      • 4.5.2 调整超参数

本文参加新星计划人工智能(Pytorch)赛道: https://bbs.csdn.net/topics/613989052

  • 文章参考链接
    • Mask rcnn代码实现_pytorch版_适用30系列显卡

1.下载源码及配置环境

1.1 mask-rcnn源码下载

  • mask-rcnn,pytorch版本链接:https://github.com/open-mmlab/mmdetection
  • pytorch相关环境文章配置链接:https://blog.csdn.net/m0_46926492/article/details/129544634
  • 使用pycharm打开源码,并选择pytorch虚拟环境的python解释器

1.2 安装项目依赖包

  • 在虚拟环境中安装相关项目库
    pip install openmim
    mim install mmcv-full
    pip install mmdet
    

1.3 coco2017数据集下载

  • 官网链接:https://cocodataset.org/
    在这里插入图片描述
  • 创建data/coco2017文件夹,将文件解压到coco2017
  • annotations_trainval2017/annotations文件夹剪切到与train2017,val2017同目录
    在这里插入图片描述
  • train2017.zip,val2017.zip,annotations_trainval2017.zip,annotations_trainval2017,四个文件都可以删除了
  • data整个文件放入项目的根目录
    在这里插入图片描述

1.4 气球数据集下载

  • 官网链接:https://github.com/matterport/Mask_RCNN/releases
    在这里插入图片描述
  • 将气球VIA格式的数据集改为coco数据集
    • 相关文章链接:VIA数据集格式转COCO格式(以气球数据集为例)

2. 使用coco2017数据集训练模型

2.1 修改数据集类别名称和类别数量

  • 需要修改为自己数据的类别名称,才能预测
  • 修改文件位置
    • mmdetection-master/mmdet/datasets/coco.py
    • mmdetection-master/mmdet/core/evaluation/class_name.py
  • 我使用的是coco2017数据集,所以现在不用修改
    在这里插入图片描述

2.2 修改配置文件

  • 找到配置文件目录mmdetection-master/configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    在这里插入图片描述

  • 修改mask_rcnn_r50_fpn.py 文件类别数,将80改为自己的分类个数

    • coco2017数据集不用修改
      在这里插入图片描述
  • 修改coco_instance.py 文件,data_root数据集路径

    • 数据集文件路径放的位置是固定的,但是coco2017这个名称可以根据自己的名称修改即可,其他的不需要动
      在这里插入图片描述
    • 为什么需要加../,因为train.py数据集在tools文件夹中,不在根目录,需要找到根目录位置

    在这里插入图片描述

  • 修改coco_instance.py 文件数据集路径,查看自己的文件名称,进行相应修改
    在这里插入图片描述

  • 修改schedule_1x.py 文件中的学习率修改自己的数值
    在这里插入图片描述

  • 修改default_runtime.py 文件,不知道为什么修改
    在这里插入图片描述

  • 添加train.py 文件参数
    在这里插入图片描述

2.3. 代码运行报错问题解决

  • 运行train.py代码
    • 报错了ImportError: Please run pip install future tensorboard to install the dependencies to use torch.utils.tensorboard (applicable to PyTorch 1.1 or higher)
      • 根据提示命令安装
        pip install future tensorboard
        
    • 再次运行,又报错了AttributeError: module distutils has no attribute version
      • 查阅资料表示setuptools版本太高,采用低版本的setuptools
        pip install setuptools==59.5.0
        
      在这里插入图片描述
  • 重新运行,成功训练
    • 数据集太大,没有跑完,所以下面使用balloon数据集测试是否正常跑通
      在这里插入图片描述

4.气球数据集训练模型

4.1 修改数据集类别名称和类别数量

  • 需要修改为自己数据的类别名称,才能预测
  • 修改文件位置
    • mmdetection-master/mmdet/datasets/coco.py
    • mmdetection-master/mmdet/core/evaluation/class_name.py
      在这里插入图片描述

4.2 修改配置文件

  • 找到配置文件目录mmdetection-master/configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    在这里插入图片描述

  • 修改mask_rcnn_r50_fpn.py 文件类别数,将80改为自己的分类个数,我改为1
    在这里插入图片描述

  • 修改coco_instance.py 文件,data_root数据集路径

    • 路径根据自己的数据集修改
      在这里插入图片描述
  • 修改coco_instance.py 文件数据集路径,查看自己的文件名称,进行相应修改

    • 注意自己的json文件名称,我修改为了train.json,val.json
      在这里插入图片描述
  • 在训练过coco2017数据集之后修改了其他的配置,其他都不需修改

4.3 代码运行

  • 运行train.py代码,成功训练
    在这里插入图片描述

4.5 优化模型

4.5.1 打印损失

  • 代码运行成功,但是效果非常差
  • 原超参数
    batch_size=2,epoch=12
  • 使用balloon数据集train数据集个数为63val数据集个数为13,批次2太小,轮次12也小
    • 打印出来显示的是这样的,惊呆了,,,
      在这里插入图片描述

4.5.2 调整超参数

  • batch_size改为8【后期又改回来了】

  • 电脑只有一个gpu,源码有8gpu,所以他的samples_per_gpu=2,实际batch_size16
    在这里插入图片描述

    • 我将samples_per_gpu改为16报错显示内存溢出

    • 改为8使用训练集测试,一个图片都没有检测出来【不知道什么问题】

      • 网上说batch_size太大,会影响模型的泛化能力,我的数据集比较少,可能会是这个原因
      • 文章链接: BatchSize的数值并不是设置的越大越好
    • 改为了4,有检测出来的,但是还有没有检测出来的
      在这里插入图片描述

    • 所以我又改为了2,就是没修改batch_size,好浪费时间啊
      在这里插入图片描述

  • epoch改为150,改为100下面这个图片没有检测出来,又改为150了,150也不行,还是100吧,这个图片算了,我放弃了
    在这里插入图片描述

  • 学习率改为0.0025【网上说的使用的gpu越少,学习率就要越低】
    在这里插入图片描述

  • 修改打印损失迭代次数intervaltrain数据集有63个,一次给gpu图片个数batch_size2,所以一个epoch总为31次,我们设置迭代4次打印一次损失 【没有什么对模型实际的影响,该不该都行,只是在终端会打印loss信息,但是也看不出来什么,看图比较明显】
    在这里插入图片描述

  • 测试数据

    • 设置保存图片路径【圈出框的图片】
      在这里插入图片描述

    • test.py中加入参数

    ../configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    ../tools/work_dirs/mask_rcnn_r50_fpn_1x_coco/epoch_150.pth
    --show
    --eval
    bbox
    segm
    

在这里插入图片描述

  • 使用val数据集测试,发现一个物体对应多个框
    在这里插入图片描述

  • 调整相关非极大值抑制参数【还没有调好,调好再更新】
    在这里插入图片描述

  • 查看loss,使用tensorboard

    • 在终端项目根目录输入命令logdir为输出的日志路径
    tensorboard --logdir=tools/work_dirs/mask_rcnn_r50_fpn_1x_coco/
    

    在这里插入图片描述

    • 查看损失图,效果好象不好,下周继续调参数
      在这里插入图片描述
    • 要下班了,再见

上一篇:Ajax简介

下一篇:Node.js核心模块 http模块

相关内容

热门资讯

Altium Designer... 目录Altium Designer(AD)软件使用记录15-PCB布线部分之优化和DRC处理一、线路...
通俗易懂了解Hadoop(更新... 从本书第5、6、7、8章,学习云计算开发相关知识 这是第五章 文章目录Hadoo...
LeetCode-198. 打... 目录暴力递归动态规划 题目来源 198. 打家劫舍 暴力递归 class Solution {pub...
js学习11(客户端存储) 目录 web storage IndexDB   web storage ### 前言࿱...
target.closest妙... 首先看下MDN:Element.closest() - Web APIs | MDN ...
并发编程(一)-Thread ... 一、什么是线程线程(英语:thread)是操作系统能够进行...
小白学Pytorch系列--T... 小白学Pytorch系列–Torch API (9) Spectral Ops stft 短时傅立...
Java二叉树的前中后序遍历 Java二叉树的前中后序遍历1.前序遍历1.1前序遍历概念1.2前序遍历习题2.中序遍历2.1中序遍...
遗传算法原理及案例解析 一、遗传算法原理 遗传算法—进化算法(Genetic Algorithm GA...
朴素贝叶斯学习报告 报告 朴素贝叶斯算法描述公式:  案例计算步骤: 一个数据集中有两个样本...
算法小课堂(一)暴力枚举 、 目录 一、概念 1.1相关概念 1.2应用场景 1.3局限性 二、相关问题 2.1例题1:统计 ...
OpenHarmony之doc... Docker使用示例 docker移植至OpenHarmony的过程可参考:https...
懒人专用高并发:Actor模型 传统多线程实现方式 public class MultiThreadExample implemen...
WEB安全 HTML基础 1.简单的HTML页面架构 charset  编码 gbk gbk2...
算法基础---基础算法(二) 文章目录 高精度         高精度加法高精度减法高精度乘法高精度除法前缀和 一维前缀和二维前缀...
【Docker】镜像的原理定制... 文章目录镜像是什么UnionFS(联合文件系统)Docker镜像加载原理...
vue3常用 Composit... 二、常用 Composition API 官方文档 1.拉开序幕的setup语法糖 理解࿱...
【MySQL】实验二 简单查询 目录 1. 查询课程代号为1301的成绩不及格的成绩信息 2. SQL查询:查询employee的j...
spring启动时加载外部配置... 平常同学们使用spring搭建工程时一些应用配置信息(例如数据库的连接配置、中间件的连...
《他是谁》爆火,优酷的成功并非... 今年国产电视剧市场又进入了新一轮的爆款时代,观众在前面刚送走《三体》《狂飙》ÿ...