psb编辑图像像素为什么要在实际像素下编辑

实际像素shi干什么的... 实际像素shi干什麼的

2001年上海市"天映杯"中学多媒体课件大奖赛3名一等奖中本人获得两个


ps格式文件:*.psd:30000像素以内;*.psb:30000像素以上基本没有其他区别

你对这个回答的评价是?

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

计算机视觉行业应该继续使用边堺框注释吗

在这篇文章中,我将分享一些与我在博士研究期间积累的图像像素注释相关的想法 具体来说,我将讨论当前最先进的注释方法它们的趋势和未来方向。 最后我将简要介绍我们正在构建的注释软件,并对我们的公司进行一些简单叙述

图像像素标注是选择圖像像素中的对象并按照名称标记它们的过程。 这是人工智能计算机视觉的支柱例如为了让您的自动驾驶汽车软件准确识别图像像素中嘚任何物体,比如行人需要数十万到数百万注释行人。 其他用例包括无人机/卫星镜头分析安全和监视,医学成像电子商务,在线图潒像素/视频分析AR / VR等。

图像像素数据和计算机视觉应用的增加需要大量的训练数据 数据准备和工程任务占AI和机器学习项目消耗时间的80%鉯上。 因此在过去几年中,已经创建了许多数据注释服务和工具来满足该市场的需求 因此,数据标签在2018年变为15亿美元市场预计到2023年將增长到50亿。

2.主流注释方法:边界框

最常见的注释技术是边界框它是在目标对象周围拟合紧密矩形的过程。 这是最常用的注释方法因為边界框相对简单,许多对象检测算法都是在考虑这种方法的情况下开发的(YOLOFaster R-CNN等)。 因此所有注释公司都提供边界框注释(服务或软件)的解决方案。 但是盒子注释存在主要缺点:

1.一个需要相对较大(通常在100.000s左右)数量的边界框以达到超过95%的检测精度。 例如对于洎动驾驶行业,人们通常会收集数百万个汽车行人,路灯车道,视锥等的边界框

2.无论您使用多少数据,跳动框注释通常不会达到超囚检测精度 这主要是因为盒子区域中包含的物体周围的附加噪声。

3.对于被遮挡的物体检测变得极其复杂。在许多情况下目标物体覆蓋的边界框区域不到20%,其余的作为噪声使检测算法混淆,找到正确的物体(参见示例中的示例下面的绿框)。

边界框如何失败的示唎:绿色框 - 高度遮挡的行人的情况 红色框 - 高噪声注释

3.图像像素注释中的像素精度

带有边界框的上述问题可以通过像素精确注释来解决。 嘫而这种注释最常用的工具很大程度上依赖于慢速逐点对象选择工具,其中注释器必须穿过对象的边缘 这不仅非常耗时且昂贵,而且對人为错误非常敏感 为了进行比较,这样的注释任务通常比边界框注释花费大约10倍 此外,准确地注释相同数量的数据像素可能需要多10倍的时间 因此,边界框仍然是各种应用程序最常用的注释类型

然而,深度学习算法在过去七年中取得了长足的进步 虽然在2012年,最先進的算法(Alexnet)只能对图像像素进行分类但是当前算法已经可以在像素级别准确识别对象(参见下图)。 对于这种精确的物体检测像素唍美注释是关键。

过去去年深度学习的演变

已经存在使用基于分段的解决方案(即SLIC超像素,基于GrabCut的分割)用于像素化注释的方法 然而,这些方法基于像素颜色执行分割并且在诸如自动驾驶的现实场景中经常表现出差的性能和不令人满意的结果。 因此它们通常不用于這种注释任务。

在过去的3年中NVIDIA已经与多伦多大学进行了广泛的研究,以实现像素精确的注释解决方案 他们的研究主要集中在从给定的邊界框生成像素精确多边形,并包括以下论文 - Polygon RNNPolygon RNN ++,Curve-GCN - 分别于2017年2018年,2019年在CVPR上发表 在最好的情况下,使用这些工具生成多边形需要至少两次精确的点击(即生成边界框)并希望它能准确地捕获目标对象。 但是建议的多边形通常不准确,并且可能比预期花费更多的时间(参見下面的示例)

封闭对象上的多边形 RNN ++工具示例(视频速度提高2倍)

这种基于多边形的方法的另一个问题是难以选择类似物体的“环状线圈”(拓扑学上),其中需要至少两个多边形来描述这样的对象

3.2. 一种新的像素化注释方法

像素化注释最简单,最快捷的方法是只需单击┅下即可选择对象 我在瑞典KTH的博士研究期间专门研究了这个问题。 到2018年11月我的博士学位结束时我们制作了一个简单的工具原型,只需點击一下即可选择对象 我们的初步实验表明,像素化注释可以加速10-20倍而不会影响选择质量 以下是它如何在上面显示的相同图像像素上笁作的示例。

与其他AI或基于分段的方法相比我们还仔细分析了解决方案的优势:

  1. 我们的算法速度允许实时分割和注释高达1000万像素的图像潒素
  2. 与SLIC超像素不同,我们的分割解决方案可准确生成非均匀区域用户只需单击一下即可选择大小对象
  3. 我们的软件允许我们立即更改段数,从而可以选择最小的对象
  4. 我们的算法的自主学习功能甚至进一步提高了分割的准确性。 即使有几百个注释也可以观察到分割精度的顯着变化。 这进一步加速了注释过程
  5. 与上面讨论的基于Box-to-Polygon的技术相比,我们的软件只需点击一下即可选择环状线圈风格的对象
  6. 最重要的昰,随着注释数据量的增加我们的软件允许自动像素精确注释。

即使与基本边界框注释相比它需要至少2次精确点击来注释一个对象,峩们在该段中只需要1次近似点击这使得它比生成边界框更快。

通过这种方式我们将像素注释的成本同时降低到边界框的成本水平,从洏允许达到超人精确的检测水平否则无法通过边界框到达。

此外由于像素精度不包括噪声,因此与边界框注释相比需要至少少10倍的數据才能达到一定的准确度。

随着我们的软件成为主流(2019年6月推出)我们预计对边界盒的需求最终会消失。 像素精确注释将成为新的标准

我们是一支由风险投资支持的团队,投资者包括Berkeley Skydeck即Plug and Play 和 SmartGateVC--由Tim Draper支持。 我们的团队由来自美国欧洲和亚洲顶尖大学的博士研究人员组成,怹们聚集在一起提供图像像素和视频注释领域的新方法,并使“Human in the loop”任务的效率在更准确水平上提高到了100倍

想要继续查看该篇文章相关鏈接和参考文献?

社长今日推荐:春季CS231n斯坦福深度视觉

李飞飞主讲王牌课程计算机视觉的深化课程,神经网络在计算机视觉领域的应用涵盖图像像素分类、定位、检测等视觉识别任务,以及其在搜索、图像像素理解、应用、地图绘制、医学、无人驾驶飞机和自动驾驶汽車领域的前沿应用

图像像素基础知识,图像像素,数字圖像像素处理基础,图像像素知识,数字图像像素处理基础知识,知识图像像素编码,数字图像像素处理基础 pdf,函数及其图像像素知识点,图像像素处悝基础,图像像素处理基本知识

我要回帖

更多关于 图像像素 的文章

 

随机推荐