您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
体彩四川金7乐走势图 人工智能 正文
发私信给雷锋字幕组
发送

0

体彩7位数奖金: ENet?—一种针对实时语义分割的深度神经架构

本文作者:雷锋字幕组 2019-02-26 10:11
导语:ENet(高效神经网络)提供了实时按像素进行语义分割的能力。

体彩四川金7乐走势图 www.kv7ue.cn ENet?—一种针对实时语义分割的深度神经架构

本文为 AI 研习社编译的技术博客,原标题 :

ENet?—?A Deep Neural Architecture for Real-Time Semantic Segmentation

作者 | Arunava

翻译 | callofduty890              

校对 | 酱番梨        审核 | Pita       整理 | 立鱼王

原文链接:

https://towardsdatascience.com/enet-a-deep-neural-architecture-for-real-time-semantic-segmentation-2baa59cf97e9


ENet?—一种针对实时语义分割的深度神经架构

Fig 1. A conversation between a semantic segmented guy and a toon

这是该论文的论文摘要:

ENet:用于实时语义分割的深度神经网络体系结构

作者:Adam Paszke

论文:https://arxiv.org/abs/1606.02147


  概论

ENet(高效神经网络)提供了实时按像素进行语义分割的能力。 ENet的速度提高了18倍,FLOP要求减少了75倍,参数减少了79倍,并且为现有模型提供了类似或更好的精度。 在CamVid,CityScapes和SUN数据集上测试。

ENet?—一种针对实时语义分割的深度神经架构

ENet?—一种针对实时语义分割的深度神经架构


  方法:

ENet?—一种针对实时语义分割的深度神经架构

图3. ENet架构

以上是完整的网络架构。

它分为几个阶段,由表格中的水平线和每个块名称后的第一个数字突出显示。
报告输出尺寸为输入图像分辨率512 * 512

ENet?—一种针对实时语义分割的深度神经架构

图4. ENet的每个??槎加邢晗杆得?br/>

视觉表现:

- 初始??槭牵╝)中所示的???br/>- 并且瓶颈??橄允驹冢╞)

每个瓶颈??榘ǎ?/p>

- 1x1投影,降低了维度
- 主卷积层(conv)( - 常规,扩张或完整)(3x3)
- 1x1扩展
- 并且它们在所有卷积层之间放置批量标准化和PReLU

如果瓶颈??槭窍虏裳?,则将最大池化层添加到主分支。 此外,第一个1x1投影被替换为2x2卷积,stride = 2。

它们将激活无填充以匹配要素图的数量。
conv有时是不对称卷积,即5 * 1和1 * 5卷积的序列。

对于正则化器,他们使用Spatial Dropout:
- 在瓶颈2.0之前p = 0.01
- 完成之后p = 0.1

所以,

  1. 阶段1,2,3-编码器 - 由5个瓶颈??樽槌桑ǔ私锥?没有下采样)。

  2. 阶段4,5-解码器 - 阶段4包含3个瓶颈,阶段5包含2个瓶颈???/p>

  3. 接下来是一个fullconv,它以尺寸输出最终输出 - C * 512 * 512,其中C是滤波器的数量。

还有一些事实:

- 他们没有在任何预测中使用偏见项
- 在每个卷积层和激活之间,它们使用批量标准化
- 在解码器中,MaxPooling被MaxUnpooling取代
- 在解码器中,Padding被替换为Spatial Convolution而没有偏差
- 在最后一个(5.0)上采样??橹胁皇褂贸鼗饕?br/>- 网络的最后一个??槭且桓雎阃耆砘?,它占据了处理时间的大部分解码器。
- 每个侧支有一个空间丢失,第1阶段p = 0.01,之后阶段p = 0.1。


  结果

对ENet的表现进行了基准测试

- CamVid(道路场景)
- CityScapes(道路场景)
- SUN RGB-D(室内场景)

使用SegNet [2]作为基线,因为它是最快的分割模型之一。 使用cuDNN后端使用Torch7库。

使用NVIDIA Titan X GPU以及NVIDIA TX1嵌入式系统??榧锹纪评硭俣?。 输入图像大小为640x360,速度超过10fps。

ENet?—一种针对实时语义分割的深度神经架构      图5.使用SegNet作为基线的两个不同GPU的推理时间比较

ENet?—一种针对实时语义分割的深度神经架构图6. SegNet和ENet的硬件要求


  基准

使用  Adam.ENet非??焖俚厝诤?,在每个数据集上,使用4个Titan X GPU,训练只需要3-6个小时。

分两个阶段进行:

- 首先,他们训练编码器对输入图像的下采样区域进行分类。

- 然后附加解码器并训练网络以执行上采样和像素分类。

学习率 - 5e-4

L2重量衰减为2e-4

批量大小为10

自定义类权重方案定义为

ENet?—一种针对实时语义分割的深度神经架构图7所示。自定义类权重方案的公式

其中c = 1.02
并且类权重被限制在[1,50]的区间内

ENet?—一种针对实时语义分割的深度神经架构 图8. CityScapes数据集的性能

ENet?—一种针对实时语义分割的深度神经架构图9. CamVid数据集的性能

  参考:

A. Paszke, A. Chaurasia, S. Kim, and E. Culurciello. Enet: A deep neural network architecture for real-time semantic segmentation. arXiv preprint arXiv:1606.02147, 2016.

V. Badrinarayanan, A. Kendall, and R. Cipolla, “Segnet: A deep convolutional encoder-decoder architecture for image segmentation,” arXiv preprint arXiv:1511.00561, 2015.

我最近还转载了这篇论文,可以在这里找到:

https://github.com/iArunava/ENet-Real-Time-Semantic-Segmentation


想要继续查看该篇文章相关链接和参考文献?

点击【ENet——一种针对实时语义分割的深度神经架构】或长按下方地址访问:

https://ai.yanxishe.com/page/TextTranslation/1468

AI研习社今日推荐:雷锋网雷锋网雷锋网(公众号:雷锋网)

耐基梅隆大学 2019 春季《神经网络自然语言处理》是CMU语言技术学院和计算机学院联合开课,主要内容是教学生如何用神经网络做自然语言处理。神经网络对于语言建模任务而言,可以称得上是提供了一种强大的新工具,与此同时,神经网络能够改进诸多任务中的最新技术,将过去不容易解决的问题变得轻松简单。

加入小组免费观看视频:https://ai.yanxishe.com/page/groupDetail/33

ENet?—一种针对实时语义分割的深度神经架构

雷锋网原创文章,未经授权禁止转载。详情见转载须知。

分享:
相关文章

文章点评:

表情
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
体彩四川金7乐走势图 以后再说
  • 6月12日凤凰直通车:郎酒发文:小郎酒新、老两款产品长期并行出口 产品 2019-03-23
  • 相比停球失误 王燊超的工作态度比工作能力更低端 2019-03-23
  • 外国领导人祝贺我新一届领导人 2019-03-16
  • 李思思元元月亮姐姐 盘点央视主持人与子女温馨合影 2019-03-16
  • 怎么也没有觉察到是什么向美国靠拢呀,只不过就是租借土地搞经济开发区吗,而且 听说 在骚乱中反华势力也不小呢, 2019-03-14
  • 梁家河,一个中国村庄的幸福与奋斗 2019-03-04
  • 李冰冰:深海潜水挑战极限 2019-03-04
  • 蔡名照会见越通社社长阮德利 2019-01-23
  • 创造历史!权健恐成亚冠唯一中超队 索萨帅位转危为安 2019-01-23
  • 【理上网来·辉煌十九大】澳大利亚专家:一个强大自信的中国会给世界带来更多机遇 2018-10-27
  • 端午假期 广州旅游业吸金37亿 2018-10-27
  • 越南的现状应该给中国敲响警钟,强坛更是如此。上城客们现在是在动嘴,造舆论煽风点火,不防到点,越南现在发生的事情也可能在中国出现。 2018-10-20
  • 传媒每周热闻第359期:第41次《中国互联网络发展状况统计报告》发布 新浪微博热搜下线整改 2018-08-09
  • 63| 930| 912| 87| 216| 78| 908| 804| 228| 315|