AIGC动态欢迎阅读
上?
关键字:图像,模型,神经网络,语言,格式
文章来源:JioNLP
内容字数:0字内容摘要:
Hello,大家好,我是 JioNLP。
最近一直在想一个问题。为什么我们的图像 AI 模型那么耗算力?比如,现在多模态图文理解 AI 模型本地化部署一个节点,动不动就需要十几个 G 的显存资源。
这个原因当然很多,这篇文章我只说一个点。
那就是 AI 模型的图像输入是 RGB 。
RGB 图像的压缩一般像一张 1920 x 1080 的图像,如果要输入 AI 模型做处理的话,必须首先转换成 RGB 三颜色格式,形成一个 1920 x 1080 x 3 字节大小的输入,这个大小大概是 6M 内存空间的大小。
但是除了 RGB 这种格式之外,还有 YUV 这种图像存储格式,它利用了人眼睛对亮度敏感,对颜色不敏感这个特性,实现了对图像的压缩。存储一张1920 x 1080 的 YUV 格式的图像只需要大概 3M 内存空间。空间减半了。
当然,3M 还是太大了,有很多的压缩算法,它可以把图像做极致的压缩,一张 1920 x 1080 的图像,按照jpeg 的压缩方法,可以压缩到几百 KB 的大小。比原始 RGB 高效多了,但是从人肉眼视觉角度看,两者几乎看不出差别。(下图中,png 存储的就原文链接:图像AI那么耗算力,问题出在 RGB 格式上?
联系作者
文章来源:JioNLP
作者微信:
作者简介: