pytorch环境之mask-rcnn源码实现
创始人
2025-05-29 18:59:01
0

pytorch环境之mask-rcnn源码实现

  • 1.下载源码及配置环境
    • 1.1 mask-rcnn源码下载
    • 1.2 安装项目依赖包
    • 1.3 coco2017数据集下载
    • 1.4 气球数据集下载
  • 2. 使用coco2017数据集训练模型
    • 2.1 修改数据集类别名称和类别数量
    • 2.2 修改配置文件
    • 2.3. 代码运行报错问题解决
  • 4.气球数据集训练模型
    • 4.1 修改数据集类别名称和类别数量
    • 4.2 修改配置文件
    • 4.3 代码运行
    • 4.5 优化模型
      • 4.5.1 打印损失
      • 4.5.2 调整超参数

本文参加新星计划人工智能(Pytorch)赛道: https://bbs.csdn.net/topics/613989052

  • 文章参考链接
    • Mask rcnn代码实现_pytorch版_适用30系列显卡

1.下载源码及配置环境

1.1 mask-rcnn源码下载

  • mask-rcnn,pytorch版本链接:https://github.com/open-mmlab/mmdetection
  • pytorch相关环境文章配置链接:https://blog.csdn.net/m0_46926492/article/details/129544634
  • 使用pycharm打开源码,并选择pytorch虚拟环境的python解释器

1.2 安装项目依赖包

  • 在虚拟环境中安装相关项目库
    pip install openmim
    mim install mmcv-full
    pip install mmdet
    

1.3 coco2017数据集下载

  • 官网链接:https://cocodataset.org/
    在这里插入图片描述
  • 创建data/coco2017文件夹,将文件解压到coco2017
  • annotations_trainval2017/annotations文件夹剪切到与train2017,val2017同目录
    在这里插入图片描述
  • train2017.zip,val2017.zip,annotations_trainval2017.zip,annotations_trainval2017,四个文件都可以删除了
  • data整个文件放入项目的根目录
    在这里插入图片描述

1.4 气球数据集下载

  • 官网链接:https://github.com/matterport/Mask_RCNN/releases
    在这里插入图片描述
  • 将气球VIA格式的数据集改为coco数据集
    • 相关文章链接:VIA数据集格式转COCO格式(以气球数据集为例)

2. 使用coco2017数据集训练模型

2.1 修改数据集类别名称和类别数量

  • 需要修改为自己数据的类别名称,才能预测
  • 修改文件位置
    • mmdetection-master/mmdet/datasets/coco.py
    • mmdetection-master/mmdet/core/evaluation/class_name.py
  • 我使用的是coco2017数据集,所以现在不用修改
    在这里插入图片描述

2.2 修改配置文件

  • 找到配置文件目录mmdetection-master/configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    在这里插入图片描述

  • 修改mask_rcnn_r50_fpn.py 文件类别数,将80改为自己的分类个数

    • coco2017数据集不用修改
      在这里插入图片描述
  • 修改coco_instance.py 文件,data_root数据集路径

    • 数据集文件路径放的位置是固定的,但是coco2017这个名称可以根据自己的名称修改即可,其他的不需要动
      在这里插入图片描述
    • 为什么需要加../,因为train.py数据集在tools文件夹中,不在根目录,需要找到根目录位置

    在这里插入图片描述

  • 修改coco_instance.py 文件数据集路径,查看自己的文件名称,进行相应修改
    在这里插入图片描述

  • 修改schedule_1x.py 文件中的学习率修改自己的数值
    在这里插入图片描述

  • 修改default_runtime.py 文件,不知道为什么修改
    在这里插入图片描述

  • 添加train.py 文件参数
    在这里插入图片描述

2.3. 代码运行报错问题解决

  • 运行train.py代码
    • 报错了ImportError: Please run pip install future tensorboard to install the dependencies to use torch.utils.tensorboard (applicable to PyTorch 1.1 or higher)
      • 根据提示命令安装
        pip install future tensorboard
        
    • 再次运行,又报错了AttributeError: module distutils has no attribute version
      • 查阅资料表示setuptools版本太高,采用低版本的setuptools
        pip install setuptools==59.5.0
        
      在这里插入图片描述
  • 重新运行,成功训练
    • 数据集太大,没有跑完,所以下面使用balloon数据集测试是否正常跑通
      在这里插入图片描述

4.气球数据集训练模型

4.1 修改数据集类别名称和类别数量

  • 需要修改为自己数据的类别名称,才能预测
  • 修改文件位置
    • mmdetection-master/mmdet/datasets/coco.py
    • mmdetection-master/mmdet/core/evaluation/class_name.py
      在这里插入图片描述

4.2 修改配置文件

  • 找到配置文件目录mmdetection-master/configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    在这里插入图片描述

  • 修改mask_rcnn_r50_fpn.py 文件类别数,将80改为自己的分类个数,我改为1
    在这里插入图片描述

  • 修改coco_instance.py 文件,data_root数据集路径

    • 路径根据自己的数据集修改
      在这里插入图片描述
  • 修改coco_instance.py 文件数据集路径,查看自己的文件名称,进行相应修改

    • 注意自己的json文件名称,我修改为了train.json,val.json
      在这里插入图片描述
  • 在训练过coco2017数据集之后修改了其他的配置,其他都不需修改

4.3 代码运行

  • 运行train.py代码,成功训练
    在这里插入图片描述

4.5 优化模型

4.5.1 打印损失

  • 代码运行成功,但是效果非常差
  • 原超参数
    batch_size=2,epoch=12
  • 使用balloon数据集train数据集个数为63val数据集个数为13,批次2太小,轮次12也小
    • 打印出来显示的是这样的,惊呆了,,,
      在这里插入图片描述

4.5.2 调整超参数

  • batch_size改为8【后期又改回来了】

  • 电脑只有一个gpu,源码有8gpu,所以他的samples_per_gpu=2,实际batch_size16
    在这里插入图片描述

    • 我将samples_per_gpu改为16报错显示内存溢出

    • 改为8使用训练集测试,一个图片都没有检测出来【不知道什么问题】

      • 网上说batch_size太大,会影响模型的泛化能力,我的数据集比较少,可能会是这个原因
      • 文章链接: BatchSize的数值并不是设置的越大越好
    • 改为了4,有检测出来的,但是还有没有检测出来的
      在这里插入图片描述

    • 所以我又改为了2,就是没修改batch_size,好浪费时间啊
      在这里插入图片描述

  • epoch改为150,改为100下面这个图片没有检测出来,又改为150了,150也不行,还是100吧,这个图片算了,我放弃了
    在这里插入图片描述

  • 学习率改为0.0025【网上说的使用的gpu越少,学习率就要越低】
    在这里插入图片描述

  • 修改打印损失迭代次数intervaltrain数据集有63个,一次给gpu图片个数batch_size2,所以一个epoch总为31次,我们设置迭代4次打印一次损失 【没有什么对模型实际的影响,该不该都行,只是在终端会打印loss信息,但是也看不出来什么,看图比较明显】
    在这里插入图片描述

  • 测试数据

    • 设置保存图片路径【圈出框的图片】
      在这里插入图片描述

    • test.py中加入参数

    ../configs/mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py
    ../tools/work_dirs/mask_rcnn_r50_fpn_1x_coco/epoch_150.pth
    --show
    --eval
    bbox
    segm
    

在这里插入图片描述

  • 使用val数据集测试,发现一个物体对应多个框
    在这里插入图片描述

  • 调整相关非极大值抑制参数【还没有调好,调好再更新】
    在这里插入图片描述

  • 查看loss,使用tensorboard

    • 在终端项目根目录输入命令logdir为输出的日志路径
    tensorboard --logdir=tools/work_dirs/mask_rcnn_r50_fpn_1x_coco/
    

    在这里插入图片描述

    • 查看损失图,效果好象不好,下周继续调参数
      在这里插入图片描述
    • 要下班了,再见

上一篇:Ajax简介

下一篇:Node.js核心模块 http模块

相关内容

热门资讯

电视安卓系统哪个品牌好,哪家品... 你有没有想过,家里的电视是不是该升级换代了呢?现在市面上电视品牌琳琅满目,各种操作系统也是让人眼花缭...
安卓会员管理系统怎么用,提升服... 你有没有想过,手机里那些你爱不释手的APP,背后其实有个强大的会员管理系统在默默支持呢?没错,就是那...
安卓系统软件使用技巧,解锁软件... 你有没有发现,用安卓手机的时候,总有一些小技巧能让你玩得更溜?别小看了这些小细节,它们可是能让你的手...
安卓系统提示音替换 你知道吗?手机里那个时不时响起的提示音,有时候真的能让人心情大好,有时候又让人抓狂不已。今天,就让我...
安卓开机不了系统更新 手机突然开不了机,系统更新还卡在那里,这可真是让人头疼的问题啊!你是不是也遇到了这种情况?别急,今天...
安卓系统中微信视频,安卓系统下... 你有没有发现,现在用手机聊天,视频通话简直成了标配!尤其是咱们安卓系统的小伙伴们,微信视频功能更是用...
安卓系统是服务器,服务器端的智... 你知道吗?在科技的世界里,安卓系统可是个超级明星呢!它不仅仅是个手机操作系统,竟然还能成为服务器的得...
pc电脑安卓系统下载软件,轻松... 你有没有想过,你的PC电脑上安装了安卓系统,是不是瞬间觉得世界都大不一样了呢?没错,就是那种“一机在...
电影院购票系统安卓,便捷观影新... 你有没有想过,在繁忙的生活中,一部好电影就像是一剂强心针,能瞬间让你放松心情?而我今天要和你分享的,...
安卓系统可以写程序? 你有没有想过,安卓系统竟然也能写程序呢?没错,你没听错!这个我们日常使用的智能手机操作系统,竟然有着...
安卓系统架构书籍推荐,权威书籍... 你有没有想过,想要深入了解安卓系统架构,却不知道从何下手?别急,今天我就要给你推荐几本超级实用的书籍...
安卓系统看到的炸弹,技术解析与... 安卓系统看到的炸弹——揭秘手机中的隐形威胁在数字化时代,智能手机已经成为我们生活中不可或缺的一部分。...
鸿蒙系统有安卓文件,畅享多平台... 你知道吗?最近在科技圈里,有个大新闻可是闹得沸沸扬扬的,那就是鸿蒙系统竟然有了安卓文件!是不是觉得有...
宝马安卓车机系统切换,驾驭未来... 你有没有发现,现在的汽车越来越智能了?尤其是那些豪华品牌,比如宝马,它们的内饰里那个大屏幕,简直就像...
p30退回安卓系统 你有没有听说最近P30的用户们都在忙活一件大事?没错,就是他们的手机要退回安卓系统啦!这可不是一个简...
oppoa57安卓原生系统,原... 你有没有发现,最近OPPO A57这款手机在安卓原生系统上的表现真是让人眼前一亮呢?今天,就让我带你...
安卓系统输入法联想,安卓系统输... 你有没有发现,手机上的输入法真的是个神奇的小助手呢?尤其是安卓系统的输入法,简直就是智能生活的点睛之...
怎么进入安卓刷机系统,安卓刷机... 亲爱的手机控们,你是否曾对安卓手机的刷机系统充满好奇?想要解锁手机潜能,体验全新的系统魅力?别急,今...
安卓系统程序有病毒 你知道吗?在这个数字化时代,手机已经成了我们生活中不可或缺的好伙伴。但是,你知道吗?即使是安卓系统,...
奥迪中控安卓系统下载,畅享智能... 你有没有发现,现在汽车的中控系统越来越智能了?尤其是奥迪这种豪华品牌,他们的中控系统简直就是科技与艺...