概述
计算机视觉功能可分为几个主要类型:
类型 | 说明 |
---|---|
图像分析 | 能够检测、分类、字幕和生成见解。 |
空间分析 | 能够实时了解人们在物理区域内的存在和运动。 |
面部识别 | 识别和验证人类身份的能力。 |
光学字符识别(OCR) | 能够从具有不同语言和写作样式的图像中提取印刷文本和手写文本。 |
若要了解这些计算机视觉功能,请考虑计算机程序的数据上下文中实际 图像 是什么很有用。
图像作为像素数组
对于计算机,图像是数值 像素 值的数组。 例如,请考虑以下数组:
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 255 255 255 0 0
0 0 255 255 255 0 0
0 0 255 255 255 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
该数组由七行和七列组成,表示 7x7 像素图像的像素值(这称为图像的 分辨率)。 每个像素的值为 0(黑色)和 255(白色):这些边界之间的值表示灰色阴影。 此数组表示的图像类似于以下(放大)图像:
此图像的像素值的数组是二维(表示行和列,或 x 和 y 坐标),并定义像素值的单个矩形。 这样的单个像素值层表示灰度图像。 实际上,大多数数字图像都是多维图像,由三个层(称为 通道)组成,这些通道代表红色、绿色和蓝色(RGB)颜色色调。 例如,我们可以通过定义三个像素值的通道来表示颜色图像,这些像素值创建与上一个灰度示例相同的正方形形状:
Red:
150 150 150 150 150 150 150
150 150 150 150 150 150 150
150 150 255 255 255 150 150
150 150 255 255 255 150 150
150 150 255 255 255 150 150
150 150 150 150 150 150 150
150 150 150 150 150 150 150
Green:
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 255 255 255 0 0
0 0 255 255 255 0 0
0 0 255 255 255 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
Blue:
255 255 255 255 255 255 255
255 255 255 255 255 255 255
255 255 0 0 0 255 255
255 255 0 0 0 255 255
255 255 0 0 0 255 255
255 255 255 255 255 255 255
255 255 255 255 255 255 255
下面是生成的图像:
紫色方块由组合表示:
Red: 150
Green: 0
Blue: 255
中心的黄色方块由组合表示:
Red: 255
Green: 255
Blue: 0
接下来,让我们探讨图像的处理方式。