像素
AI之外描述图像,大多从像素的角度的描述 比如, 图像的尺寸就是100*200大小,这指100*200个像素 显示器的尺寸 17寸显示屏分辨率通常为1280x1024或1440x900,这里也是指像素 像素在计算机中就是RGB,在AI中用一个向量表示,(R,G,B),比如,(0,0,0)就是个黑点
AI中图像表示
AI中描述一个图片的大小使用矩阵[H,W] H 高 W 宽 (R,G,B)向量通常使用C表示 C 通道数,其实就是特征数,一个向量的特征数n,n维向量,这里就是3维向量,[H,W]个3维向量(R,G,B) 在本网站,通常将通道C叫做特征层,比如这RGB,每一层一个颜色,它们的shape皆为[H,W] 一张图像,可以是[H,W,C] 或 [C,H,W] ,具体是哪个要看构架场景
RGB每个值取值范围都是0-255,但在AI中会做归一化,整体/255,归于[0,1],数值大小变了,但这就是AI中的图像
pytorch使用 [C,H,W]表示一张图像 64张图像:[64,C,H,W] ,即[B, C, H, W]