非常幸运的参加了今年的 IEEE ICIP,在此我分享一下在这个国际会议上的所见所闻 🔥🔥🔥
前言
2018 IEEE International Conference on Image Processing(简称 ICIP 2018),是图像处理国际会议,10 月 7 号 ——10 号在希腊雅典举办。
在会议水平和规模上,自然不如 CVPR 和 ICCV。更不巧的是今年的 ECCV 正好在 ICIP 的前一个月,因此能来的大佬就少了。当然,这并不妨碍我这种弱鸡去学习一下,看看图像处理领域不同的论文和发展近况。
举办地
今年举办地在希腊的 雅典。因为在欧洲,所以会议上有很多的都是来自欧洲学校的研究者。当然,这也并不妨碍中国学者们不远万里前来参会,因为雅典和圣托里尼岛也是不错的旅游目的地。
希腊在 2010 年爆发了经济危机,8 年过去了,希腊渐渐走出了经济衰败的阴影。走在雅典街头,或多或少还能看到一些混乱颓败的踪迹。在会议上,有国内来的老师和我们说有好几个人在 雅典被偷了钱,让我们与会的一些同学非常不安。雅典也算是一个旅游城市,在地铁上广场上餐厅中,都能见到各国的游客,当看见这些游客,会有些许的安心。
来到希腊,雅典卫城是一个必去的地方。公元前文明的残骸,在这里得以体现。特别是经过了欧洲动荡的中世纪,只有些许断垣得以残存,令人唏嘘。会让人不由的联想到英法联军火烧圆明园,文明的瑰宝被毁于一旦。
虽说举办地与学术本身并无关联,但 能够在科研之余领略不同国家的风土人情,也是国际会议的重要一部分。
会议议程
会议虽说是 4 天,但第一天基本可以忽略不记。7 号这天是 Tutorial 的环节,就是会议请了一些教授来进行长时间的授课,有不同的主题,应该是关于某一具体领域。当然,这些都是 额外付费的,贫穷 的我并没有注册这些。在 Tutorial 完了之后下午 5 点是报道注册领取会议材料,以及一个欢迎晚宴。因为担心自己的人身安全,很多人 7 点中吃的差不多就离开了会场。
之后的三天就比较类似了。上午 9 点开始有一个一小时的专题 talk,之后外面进行 Poster 环节,上下午分别两场,不同的会议厅里举行不同专题 Oral 的报告。中间有茶歇,提供饼干等糕点,以及饮料。
其实整个会议的信息量还是挺大的,41 个 Lecture Session,86 个 Poster Session。外面有大概三四十张不同的 Poster,按类别分好区域,因此你可以挑选自己喜欢的主题去看。
会议厅里我就去的相对少一些,虽然 Oral 的论文质量可能会相对更高一点,但是因为讲整个 PPT 的时间也会很长,所以我还是选择在外面围观海报,会更有意思一些。
会议的论文已经在 IEEE Xplore 上有了,可以去检索相应的论文了。下面就挑选一些,我在整个会议里面看到的一些还算有意思的展示吧。
ICIP 内容节选
首先是 ICIP 2018 的统计数据,1753 的提交,839 的通过,最后的接收率将近 50%。
我们来看一下不同领域接收率的情况,可以看到 IVIU 的通过率最高 28%
这是第一天上午的 Talk,来自南加州大学的一个韩国人讲 CNN。其实讲的是自己的研究内容。不用反向传播,只用正向(类似滤波器设计)去设计卷积网络,当然只能设计一些很简单的了,他说好处是可以抵御对抗样本的攻击。反正我觉得有点扯。
之后就碰到了一个学校的了。遥感院的学长,做的还是图像拼接。这一块我不是很熟,但和学长聊了一下这一届的会议。后来中午一起去吃了东西。
非常热闹的第一天的 Poster Session
下午有 VQA 的 Session,我就围观了一下。这个是电子科大的一个老师提出的一种带权重且考虑到排序的相关系数。和常见的 SRCC 在一些特定情况下对衡量准确度进行了比较,而且因为有权重,因此可以自己设计符合特定任务的标准(比如正序最不好),如下面图中画出的曲线。具体想要拿来用还是得看论文。
下面是一个屏幕内容的评价。考虑到了 Edge,也就是边缘信息。并且魔改了一下 SSIM,把 Edge 信息加入,提升了一下屏幕内容质量评价的效果。
一个日本团队做的,很有意思的一个项目。简而言之,优化图片来提升商品的用户点击率。挺有商业前景的。像在淘宝上,一般我就是看图片好不好看决定点进去看商品详情与否。
下面这个是提取视频中文档边界。用的是数学形态学的方法。可能效率上会更好一些。当然,现在文档边界检测的应用很常见了,如微软的 Office Lens,扫描全能王等。
在 7 号上午认识的一个剑桥的博士,恰巧也是做质量评价方向的。
做图像增强的。让我想起了数字图像处理课让我们探究的均衡化的方法。
一个印度小哥的作品,讲真挺水的。我觉得和我数字图像处理课程设计有的一拼。其实就是根据文本去做图像选择与风格转换,可能之前没什么人做这个问题吧。
做一个课题的韩国小哥,英语表达能力太差,基本听不懂他讲的。好在前一天晚上看了一下论文。答题就是用 Pairwise 的方法去做这个任务,把分类问题变成比较问题。用了一个类似 Focal Loss 的损失函数。可以同时做 Ranking 以及 Classification 的任务。最后的指标也还可以。其实类似的点子之前我也有想到过,但是因为我太菜了,没实现出来 Orz
因特尔做的一个工作,用进化算法来自动调节 ISP 的参数。这个挺有意思的,让我想到了,很多时候不同品牌手机用的感光元件可能是同一个型号,但是拍出来照片的质量会有差别,原因就在于 ISP 的调教。
又看到了校徽。右边是做 SR 的。看标题是考虑到了区域的影响。
这个任务做的是水底视频中海洋生物的探测。这个 Paper 关注了数据增强的方法,用 GAN 来生成类似的图片。其实应该有类似的工作把 GAN 用到 Data Augmentation。其实我一直对把 GAN 生成的图片作为 Ground Truth 训练图片这个表示一些疑虑。
下面这个纯粹只是在中间的图中看到了熟悉的 U-Net、SPP、DeepLab,后两者在物体识别领域用到,前者是在 Conditional Generative Adversarial Network 里面用到了。U-Net 的 Shortpath 可能让其在图像生成上会有更好的表现。
隔壁华科的。做目标追踪的。
在景区门口认识的一个清华电子系小哥帮站的。就是考虑到旋转等变形,先把它变回去。
一个好看的法国小姐姐。Poster 也挺好看。用了 U-Net 和 Patch-GAN,提出了一个深度估计的 Loss,和一堆其它 Loss 比较。
上海交通大学,图像鉴黄。数据集是 Self-collected 的,哈哈。随后被媒体报道:《ICIP2018 | 图像鉴黄做得好,健康上网少烦恼》,很有意思了。
这个做的是车辆类型识别,而且据说已经在法国很多地方部署了。方法不难,就是用了 CNN,比较有借鉴意义的就是裁剪网络来解决过拟合的问题。
下面这个是用小波变换做识别的。他被问的最多的就是:“为什么不用 CNN?”,传统方法在 2018 年的会议上可以说是一股清流了。
这个课题很有意思,用照片做 PM2.5 的估计。虽然听起来有点扯淡,不过给不用专业仪器来快速估计 PM2.5 提供了一个新思路。
雨滴检测问题。用了滑动窗口去代替传统的 Region Proposal(因为雨滴形状色泽等多变),裁剪了 CNN。英国小哥的英式发音很有辨识度。
这个做的是对抗样本攻击。原理很简单,简而言之就是给图片打补丁来让 CNN 产生错误的分类结果。而这些干扰信息量很小。
一个年长的日本教授,激动的给我展示了视频去噪的效果。虽然 Poster 上全是公式,但他讲解的还是挺通俗的。用了 3D-DFT,因此算法会非常慢,主要是求解逆傅里叶很慢,不过效果还是很 OK 的。
来自挪威大学小哥,是个中国人。之前在 VQA 的相关 Session 经常看到他,一开始以为是日本人来着。最后我们的 Poster 在同一场。也算是缘分了。
这个意大利小哥,做的是有人脸图片的美学评估。方法和我的基本类似。更巧的是我们最后一天同一班飞机去了罗马。
我的展示
其实轮到我的时候已经是最后一天下午了,人并没有第一天的那么多。
Poster 做的略微小了一些,比例其实也不应该按 CVPR 的 2:1 来做的。被问到最多的一个问题就是我的 Local View 是怎么来的。反正在现场被各种人问了之后对自己的工作会有更深刻的理解。也会有很多人来提出潜在的改进的方法。
碰到几个教授问我是博士后还是博士,包括国内来的,他们都挺惊讶我是本科的。还有一个 Session Chair 说他的学生在做这个课题,但一直没有取得什么进展。忘记在 Poster 上留邮箱了。
印象最深的是一个 ARM 来的小姐姐,和我说应该趁机会看看他们胸牌上面的名字,然后去 LinkedIn 或者直接去 Social 一下,说不定对以后读 Grad 有帮助。其实会议本身就是一个 Social 的平台,我也有机会认识了很多人。
感想
通过参加这个会议,可以看到各种不同图像处理领域最新的进展和成果。你也可以比较容易的去理解一些新点子和方法,它们其实都是一些非常简单的一些小创意。我们可以尝试去借鉴这些点子,然后把它运用到自己今后的研究工作中去。
在这个 “人工智能” 一词盛行的今天,在 CNN 占领了半壁江山的图像处理会议,还是要向那些坚持使用传统图像处理 / 数学方法、忠于理论研究的研究工作者表示致敬。
会议很大部分人都是来社交的,同一个研究领域,不同国家的教授互相认识,汲取新的一些点子。作为学生也能够认识其它学校做同一个领域的同学并互相交流。这些就是会议最大的意义。
非常怀念会议茶歇的 希腊酸奶 + 果酱 + 蜂蜜。实在是好吃 😋