浏览量统计:78392728

教学科研

信息学院吴晓教授团队人工智能方面的两篇论文被国际顶级会议ACM MM 2018录用

来源:信息科学与技术学院  作者:胡晓阳   编辑:陈丝丝   日期:2018/7/12   点击数:987  

信息学院吴晓教授团队有2篇论文被国际顶级会议——第26届国际多媒体学术会议(ACM International Conference on Multimedia, 简称ACM MM)录用,其中1篇为口头报告,1篇为墙报。这两篇论文均是以西南交通大学为第一署名单位。在全球757个投稿中,仅有64篇论文被录用为口头报告,144篇论文被录用为墙报,录取率分别为8.5%和19%。国际多媒体学术会议(ACM MM)是计算机学科公认的多媒体领域和计算机视觉领域的顶级国际会议,被中国计算机学会(CCF)列为A类会议,在我校期刊分级目录中列为A++级别。在教育部第四轮学科评估中,CCF A类会议论文被列为重要的论文发表指标项。信息学院这两个研究将最前沿的深度学习算法应用于图像自动生成以及属性学习领域,极具较高的学术价值。这是吴晓教授团队在人工智能方面的研究连续三年在国际顶级会议上发表口头报告,是信息学院科研和学科建设的重要成果之一,同时标志着我校在人工智能和计算机视觉领域的研究成果得到了国际同行的认可。

图像生成技术是当前人工智能学界最为重要的研究热点之一。以博士生赵波为第一作者,吴晓教授以及新加坡国立大学冯佳时教授共同完成的论文《Multi-View Image Generation from a Single-View》被ACM MM 2018录用为口头报告。根据人们在网络购物时对多角度的细粒度服饰图像的浏览需求,针对现有的基于深度学习的生成式对抗网络(Generative Adversarial Networks, GAN)在生成高分辨率图像上存在的结构不完整,真实性不高的情况,论文提出了一种从单角度图像生成其他角度图像的新颖解决方案,称为VariGANs。论文将变分推理引入生成式对抗网络,利用变分自动编码机(Variational Autoencoder,VAE)优秀的结构建模能力,根据单一视角图像生成具有目标视角的低分辨率图像,该图像具有较为完整的结构。在此基础上,利用生成式对抗网络(GAN)的优点,对低分辨率图像进行细节填充以及结构完善,最终得到目标视角的高分辨率图像,取得了良好的效果。该项工作具有开创性,目前在arXiv上已有24次引用。

图1 VariGANs系统框架


建立通用的属性学习框架一直以来是人工智能领域的一个研究难点。以博士生程治淇为第一作者,吴晓教授以及卡内基梅隆大学Alexander G. Hauptmann教授共同完成的研究论文《Learning to Transfer: Generalizable Attribute Learning with Multitask Neural Model Search》被ACM MM 2018录用为墙报。该论文提出了一个基于AutoML(自动机器学习)的通用属性学习框架。该框架能够自动设计属性识别深度神经网络和优化对应的网络训练策略。与之前的自动机器学习方法相比,该方法能够自动挖掘属性之间的关系,并利用多任务学习和强化学习方法加速模型训练。相比于前沿的自动机器算法动辄需要上百块GPU,该方法可以只需利用少量GPU在较短以内,设计出适用于多个公开属性数据集,数百个属性的通用深度属性识别网络,具得了显著的效果,超越了最先进的人工设计的属性识别方法。

 

图2 通用属性学习系统框架


信息学院围绕学校“双一流”建设,以数字化战略为牵引,结合我校学科特色与优势,加快学科建设布局,瞄准人工智能等重要研究领域开展前沿研究。信息学院虚拟现实与多媒体团队一直致力于人工智能、智能交通、计算机视觉和虚拟现实等相关领域的前沿研究,近三年在人工智能前沿领域国际顶级期刊(如:IEEE Trans. on Image Processing, IEEE Trans. on Multimedia, IEEE Trans. on Medical Imaging)和一流国际会议(ACM Multimedia和CVPR)发表了近20篇高水平论文,并于2016年和2017年分别获得了教育部自然科学二等奖和河南省科技进步二等奖,取得了不错的成绩。

东陵区 北市区 敖汉旗 抚宁县 曲水县
汝州市 同心县 京山县 献县 海淀区
清河门区 永兴县 郊区 方山县 隆回县
榆树市 蒲城县 海陵区 临澧县 石阡县
sitemap sitemap sitemap sitemap sitemap