opencv-图像操作
创始人
2024-06-01 08:02:52
0

访问和修改像素值

我们先加载一个彩色图像:

import cv2img = cv2.imread('b.png')
print(img)########### 打印结果 ########### 
[[[243 243 243][243 243 243][243 243 243]...[243 243 243][243 243 243][243 243 243]][[243 243 243][243 243 243][243 243 243]...[243 243 243][243 243 243][243 243 243]]]

如果imread()方法中,flags传递值为-1,那么将加载alpha通道,那么最里层的数组长度将会是3,打印结果如下:

[[[243 243 243 255][243 243 243 255][243 243 243 255]...[243 243 243 255][243 243 243 255][243 243 243 255]][[243 243 243 255][243 243 243 255][243 243 243 255]...[243 243 243 255][243 243 243 255][243 243 243 255]]]

如果传递值为0,那么将加载灰色图像,打印结果将会是这样:

[[243 243 243 ... 243 243 243][243 243 243 ... 243 243 243][243 243 243 ... 243 243 243]...[243 243 243 ... 243 243 243][243 243 243 ... 243 243 243][243 243 243 ... 243 243 243]]

我们以彩色图像为例,我们可以通过像素值的行和列坐标来访问它:

px = img[100, 100]
print(type(px), px)         #  [255 255 255]# 只访问蓝色像素
px = img[100, 100, 0]
print(type(px), px)         #  255

我们还可以使用更加优雅的方式来修改它,如下:

# 访问红色像素
px = img.item(100, 100, 2)
print(type(px), px)         #  255# 
img.itemset((100, 100, 2), 100)
px = img.item(100, 100, 2)
print(type(px), px)         #  100

访问图像属性

图像属性包括行数、列数和通道数、图像数据类型、像素数等

shape = img.shape               # 加载彩色图片,返回一个包含行数、列数和通道数的元组
print(type(shape), shape)       #  (584, 870, 3)shape = img.shape               # 加载灰色图片,返回一个包含行数、列数的元组
print(type(shape), shape)       #  (584, 870)shape = img.shape               # 加载alpha通道,返回一个包含行数、列数和通道数的元组
print(type(shape), shape)       #  (584, 870, 4)

总像素数由img.size属性获取:

size = img.size
print(type(size), size)         #  1524240

图像数据类型由img.dtype熟悉获取:

dtype = img.dtype
print(type(dtype), dtype)       #  uint8

ROI

这里我们将Baidu的Logo进行修改一下,将"百度"二字,用"Bai"替换,如下:

import cv2
from copy import copy
from matplotlib import pyplot as pltimg1 = cv2.imread('tt.png', 1)
img2 = copy(img1)
img2[90:165, 313: 458] = img2[90:165, 35:180]
# 121, 1行2列第1个通道
plt.subplot(121),plt.imshow(img1, 'gray'),plt.title('img1')
# 122, 1行2列第2个通道
plt.subplot(122),plt.imshow(img2, 'gray'),plt.title('img2')
plt.show()

效果如下:

2YSVB9.png

为图像创建边框

如果需要在图像周围创建边框,例如相框,可以使用cv2.copyMakeBorder()函数。copyMakeBorder(src, top, bottom, left, right, borderType, dst=None, value=None)常用参数解释如下:

  • src: 输入图像
  • top, bottom, left, right: 上下左右4个边框宽度,单位:px
  • borderType: 边框类型
    • cv2.BORDER_CONSTANT: 彩色边框
    • cv2.BORDER_REFLECT: 边框元素的镜像
    • cv2.BORDER_REFLECT_101或cv2.BORDER_DEFAULT
    • cv2.BORDER_REPLICATE: 最后一个元素被复制
    • cv2.BORDER_WRAP
  • value: 如果边框类型为cv2.BORDER_CONSTANT的边框颜色
import cv2img = cv2.imread('tt.png', 1)
# 设置边框颜色为蓝色
img = cv2.copyMakeBorder(img, 5, 5, 5, 5, cv2.BORDER_CONSTANT, value=[255, 0, 0])
cv2.imshow('image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像融合

这也是一种图像加法,但是给图像不同的权重,从而给人一种混合而透明的感觉,我们可以使用cv2.addWeighted()函数来实现。addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None)常用参数解释如下:

  • src1: 输入图像1
  • alpha: 输入图像1的权重
  • src2: 输入图像2
  • beta: 输入图像2的权重
  • gamma: 标量,用于加到每个和上
  • dst: 输出图像
  • dtype
import cv2 
from matplotlib import pyplot as pltimg1 = cv2.imread('img1')
img2 = cv2.imread('img2')
dst = cv2.addWeighted(img1, 0.7, img2, 0.3, 0)
# 131, 1行3列第1个通道
plt.subplot(131),plt.imshow(img1, 'gray'),plt.title('img1')
# 132, 1行3列第2个通道
plt.subplot(132),plt.imshow(img2, 'gray'),plt.title('img2')
# 133, 1行3列第3个通道
plt.subplot(133),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下:

2JxDG8.png

值得注意的是,img1与img2必须行数、列数和通道数一致!!!

为图片添加水印

我们想将opencv的logo放置在给定的背景图的右下方,如果我添加两个图像,它会改变颜色。如果我混合它,我会得到一个透明的效果。但我希望它是不透明的。如果它是一个矩形区域,我可以像上一章那样使用 ROI。但是 OpenCV 徽标不是矩形。所以你可以用按位运算来做到这一点,如下所示:

import cv2 
from matplotlib import pyplot as pltliushishi = cv2.imread('liushishi.png')
logo = cv2.imread('logo.png')
liushishi_height, liushishi_width = liushishi.shape[:2]
plt.subplot(331),plt.imshow(liushishi, 'gray'),plt.title('liushishi')
logo_height, logo_width = logo.shape[:2]
logo = cv2.resize(logo, (int(0.3 * logo_width), int(0.3 * logo_height)), interpolation=cv2.INTER_CUBIC)
logo_height, logo_width = logo.shape[:2]
roi = liushishi[liushishi_height - logo_height - 15:liushishi_height - 15, liushishi_width - logo_width - 15:liushishi_width - 15]
logo_gray = cv2.cvtColor(logo, cv2.COLOR_BGR2GRAY)
_, mask = cv2.threshold(logo_gray, 230, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)
liushishi_bg_1 = cv2.bitwise_and(roi, roi, mask=mask)
liushishi_bg_2 = cv2.bitwise_and(logo, logo, mask=mask_inv)
dst = cv2.add(liushishi_bg_1, liushishi_bg_2)
liushishi[liushishi_height - logo_height - 15:liushishi_height - 15, liushishi_width - logo_width - 15:liushishi_width - 15] = dstplt.subplot(332),plt.imshow(logo, 'gray'),plt.title('logo')
plt.subplot(333),plt.imshow(logo_gray, 'gray'),plt.title('logo_gray')
plt.subplot(334),plt.imshow(mask, 'gray'),plt.title('mask')
plt.subplot(335),plt.imshow(mask_inv, 'gray'),plt.title('mask_inv')
plt.subplot(336),plt.imshow(liushishi_bg_1, 'gray'),plt.title('liushishi_bg_1')
plt.subplot(337),plt.imshow(liushishi_bg_2, 'gray'),plt.title('liushishi_bg_2')
plt.subplot(338),plt.imshow(dst, 'gray'),plt.title('dst')
plt.subplot(339),plt.imshow(liushishi, 'gray'),plt.title('liushishi')
plt.show()

效果如下:

2038NF.png

请看最后一张图,可以看到,我们的opencv的logo已经放置在图片的右下角了!这里为了方便演示各种操作之后的图片变化,所以将所有的图片都放置在一起展示,有一些色差,我们可以通过cv2.imshow()展示最后操作的背景图,就可以很直观的看到效果了!

这里,我们用到了好几个函数,现在我们来讲一下他们的用法:

resize

修改图片的尺寸。resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None)参数详解如下:

  • src: 输入图像
  • dsize: 修改后的图片宽高
  • dst: 输出图像
  • fx: 比例因子(宽度),0.5表示宽度缩放成原来的一半
  • fy: 比例因子(高度),0.5表示高度缩放成原来的一半
  • interpolation: 插值法

cvtColor

该函数将输入图像从一个颜色空间转换为另一个颜色空间。cvtColor(src, code, dst=None, dstCn=None)参数详解如下:

  • src: 输入图像
  • code: 颜色空间转换码
  • dst: 输出图像
  • dstCn: 目标图像中的通道数

threshold

隔离图像上像素的边缘,上面代码中将大于230像素的值置为0,小于的置为255。threshold(src, thresh, maxval, type, dst=None)参数详解如下:

  • src: 输入图像
  • thresh: 阈值
  • maxval: 使用#THRESH_BINARY和#THRESH_BINARY_INV阈值的最大值
  • type: 阈值类型
  • dst: 输出图像

bitwise_not

反转上面的图像创建掩码。bitwise_not(src, dst=None, mask=None)参数详解如下:

  • src: 输入图像
  • dst: 输出图像
  • mask: 掩码

bitwise_and

使用位“与”运算来叠加。bitwise_and(src1, src2, dst=None, mask=None)参数详解如下:

  • src1: 输入图像1
  • src2: 输入图像2
  • dst: 输出图像
  • mask: 掩码

add

图像叠加。add(src1, src2, dst=None, mask=None, dtype=None)参数详解如下:

  • src1: 输入图像1
  • src2: 输入图像2
  • dst: 输出图像
  • mask: 掩码

相关内容

热门资讯

122.(leaflet篇)l... 听老人家说:多看美女会长寿 地图之家总目录(订阅之前建议先查看该博客) 文章末尾处提供保证可运行...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
Vue使用pdf-lib为文件... 之前也写过两篇预览pdf的,但是没有加水印,这是链接:Vu...
PyQt5数据库开发1 4.1... 文章目录 前言 步骤/方法 1 使用windows身份登录 2 启用混合登录模式 3 允许远程连接服...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
Linux基础命令大全(上) ♥️作者:小刘在C站 ♥️个人主页:小刘主页 ♥️每天分享云计算网络运维...
再谈解决“因为文件包含病毒或潜... 前面出了一篇博文专门来解决“因为文件包含病毒或潜在的垃圾软件”的问题,其中第二种方法有...
南京邮电大学通达学院2023c... 题目展示 一.问题描述 实验题目1 定义一个学生类,其中包括如下内容: (1)私有数据成员 ①年龄 ...
PageObject 六大原则 PageObject六大原则: 1.封装服务的方法 2.不要暴露页面的细节 3.通过r...
【Linux网络编程】01:S... Socket多进程 OVERVIEWSocket多进程1.Server2.Client3.bug&...
数据结构刷题(二十五):122... 1.122. 买卖股票的最佳时机 II思路:贪心。把利润分解为每天为单位的维度,然后收...
浏览器事件循环 事件循环 浏览器的进程模型 何为进程? 程序运行需要有它自己专属的内存空间࿰...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
计算机二级Python备考(2... 目录  一、选择题 1.在Python语言中: 2.知识点 二、基本操作题 1. j...
端电压 相电压 线电压 记得刚接触矢量控制的时候,拿到板子,就赶紧去测各种波形,结...
如何使用Python检测和识别... 车牌检测与识别技术用途广泛,可以用于道路系统、无票停车场、车辆门禁等。这项技术结合了计...
带环链表详解 目录 一、什么是环形链表 二、判断是否为环形链表 2.1 具体题目 2.2 具体思路 2.3 思路的...
【C语言进阶:刨根究底字符串函... 本节重点内容: 深入理解strcpy函数的使用学会strcpy函数的模拟实现⚡strc...
Django web开发(一)... 文章目录前端开发1.快速开发网站2.标签2.1 编码2.2 title2.3 标题2.4 div和s...