比CPU提升数十倍,GPU助中科院打造更快人形分割算法
[ 发布日期:2016-3-28 来源:猫头鹰互动科技 浏览次数:1822 ]
当今,场景分割已经成为计算机视觉领域中的重要部分,它可以让机器识别出图像中的特定内容或物体,从而应用于交通、安防等领域。其中,人形分割又是场景分割的重要部分,这是因为大多数场景理解的任务都与人相关。
在过去的几十年中关于人形分割的研究一直基于CPU解决方案进行,但如今这种方案已经无法满足速度和精度的需求,致使研究进展缓慢。中科院自动化所利用革新的基于CUDA的GPU并行计算平台,通过深度学习技术,采用深度卷积神经网络,在人形分割精度上达到了88%的准确率,并达成几十倍于CPU平台的速度,目前已经获得三星等公司的支持进行产品化研发。
GPU让人形分割难题迎刃而解
当前,关于人形分割的研究正朝向更大规模、更深层次的分割网络发展,更快速度的分割模型也是人形分割的主要研究方向。其中,速度和精度是人形分割算法的两个主要性能指标,也是这种算法能否实现大规模应用的决定性因素。
更大规模的分割网络需要大量的并行计算单元和计算核心的支持,传统的CPU解决方案虽然可通过数十台甚至上百台服务器集群达到高性能计算的需要,但管理难度大,成本高昂,维护程序复杂,而基于CUDA的GPU并行计算平台的出现让这些问题迎刃而解。
随着2012年CUDA-Convnet框架发布,使得依托采用了CUDA技术的高性能GPU平台来研究大型深度神经网络获得广泛认同。
利用GPU实现88%的超高精度
针对人形图像分割问题,中科院自动化所智能感知与计算研究中心利用该框架设计了一种多通道深层次的分割网络,在人形分割精度上达到了88%的准确率。
该分割网络基于NVIDIA的TITAN平台实现,它采用2块TITAN GPU,相对于传统CPU解决方案,利用GPU的人形分割网络解决方案优势明显。
GPU方案可以利用单台服务器实现数十台GPU服务器集群的并行计算性能,而训练单个人形分割网络消耗时间从数周降至6天,大大加快了科研进度。同时,利用TITAN GPU组建一个运算平台仅需单台CPU服务器成本的1/5,有效节省了经费开支。
此外,该分割网络还支持两块及以上GPU组建双通道卷积网络,为大规模网络的设计提供了良好的扩展性。
通过使用TITAN平台,它所带来的显著效果让中科院自动化所智能感知与计算研究中心对GPU加速寄予了更高期望,为此进一步利用了NVIDIA Tesla K40 GPU加速器,它拥有更高的浮点计算性能和更大的内存,结合完整的Tesla加速计算平台,让分割网络速度进一步提升,还带来更好的易用性,最终成为其高精度人形分割网络不可或缺的重要计算资源。
NVIDIA Tesla K40 GPU加速器
目前,该研究中心还与三星等公司开展进一步合作,开发更精确更快速的人形分割算法。
GPU加速更大更深神经网络的探索
在机器学习和计算机视觉领域,越来越多的研究团队正在探索更大更深的神经网络,拥有更高性能和更大显存的GPU平台,结合CUDA-convnet及Caffe框架,可以大大加速构建神经网络,并达到更深的精度要求。
当前,中科院自动化所智能感知与计算研究中心正利用GPU平台研发基于CUDA的全图卷积人形分割算法,有望实现毫秒级的高精度人形图像分割。
www.nvidia.cn www.leadtek.com www.autodesk.com.cn www.adobe.com.cn