首页 > 新闻 > 转载:稀疏表达

转载:稀疏表达

全文转载自这个博客,很不错的博客,作者来自中科院,大伙收藏吧。

看了Ma Yi的工作后,才开始对Sparse represenation开始感兴趣。从最开始的惊奇,到中间的觉得无用,再到现在觉得还是有点用,其对这整套想法的把握真可谓一曲三折。不过总得来说,都是在项目和实验的驱动下进行的。

和ML的人不同,我们关注的点在CV中的application。解决图像分类中重要的一个方法是bag of features,也就是形成很多words图像patch后,去fit新的图,然后送去投票编码,最后分类。

其中一个很关键的步骤是怎么得到这些words的图像patch?一种方法是K-means做聚类。当然这个方法有很多naive的假设,不过总得来说效果凑合。所以最近几年大家都在死命搞features extraction,直到发现最后无论如何都打不败的是SIFT,HOG之流。

当然,科学总在进步中。大家发现feature这块都做不动了,自然开始动其他的念头,要不转行去做其他应用,要么得用ML的新工具了。最近在ICCV上发现在K-means上的重大改进,其核心就是放松了原来kmeans聚类后分配新样本去哪个类的分配方式,加上考虑到什么locally constraints,最后取得了相当好的效果。仅仅和最基本的dense sift+linear svm就打败了multiple features+nonlinear svm。哈,仔细研究了论文,发现解那个式子,可以用lasso搞搞。没准回头可以实现一下。

sparse很好,但是并不是什么新问题和新方法。总结一下这个熟悉又陌生的新思潮吧。这个总结有很多版本,看过Prfans上的,不过现在prfans好像down掉了。

最最开始要算Terrance Tao在IT上那篇best papers,因为他是华人,长得特别像电影明星,然后20+就当UCLA的教授。。。所以很吸引人。不过关于这个方面在CV还有ML开始火还在于以下几篇文章作者的工作吧。

首先是这篇文章,
John Wright, Allen Yang, Arvind Ganesh, Shankar Shastry, and Yi Ma,  Robust face recognition via sparse representation. (To appear in IEEE Trans. on Pattern Analysis and Machine Intelligence)

大致做法就是用training data表出新的data,即新的x是training data的线性组合,如果training data数大大小于feature数,那么这就相当于CS里的x_0=Ax,A的每列是个sample,x是每个sample的权重。于是给出新的 x_0,可以通过优化x的l_1找到最sparse的解,即用最少数量的sample表出新的点。然后还可以在Ax前乘个measurement matrix,用来做特征选择,其实就是进一步降维。我在yaleB上的实验也证明了这个方法还是比较好的。但是中间的小trick是:
如果我用来做遮挡问题,那么训练库中的样本出现问题后,测试集上的结果就将变得相当差。比如用张猴子脸训练,检测人脸的时候用许多脸来拼凑,最后得到的是猴子脸而不是人脸。。。
比较囧的是,好多CVPR和ICCV上2009的文章都来follow这种motivation的工作。

然后这篇文章也挺有意思的
Robert Calderbank, Sina Jafarpour, and Robert Schapire,  Compressed learning: Universal sparse dimensionality reduction and learning in the measurement domain (Preprint, 2009)

其中, 证明了measurement space里train个svm和原空间里train的svm是同一个问题。关键或许是 投影到多个space里去,然后在每个space里 train,然后做boosting,类似于multi-view learning。感觉最近muliti-kernel learning是个大趋势呀。
当然一些研究还得结合自己问题的数据上的特殊性解决才行。

给一些关于Compression Sensing(Sparse Representation方面的链接:
Compressive Sensing资源主页
Compressive Sensing Resources (最权威最全面的Compressive Sensing资源主页,几乎什么都能找的到);
Compressive Sensing (和上面的差不多);
Compressive Sensing Listing; 马毅的课程主页
Compressive Sensing VideosCompressed Sensing Codes (还有Compressive Sensing Resources 的Software一栏中);
Nuit BlancheCompressive Sensing: The Big PictureTerence Tao‘s What’s new;

理论方面的代表人物
David DonohoEmmanuel Candes;

  1. kongxd
    2010年4月6日09:03 | #1

    很好,收藏,回头仔细看看!

  2. cyberfx
    2010年4月6日09:54 | #2

    无论如何都打不败的是SIFT,HOG之流,呵呵,简单的才好,HOG好是因为简单,Haar-like好也是因为简单,简单就好

  3. hardegg
    2010年4月6日09:59 | #3

    跟帖说说Ma Yi学生的那篇“Robust face recognition via sparse representation”
    第一次看的很囫囵吞枣,感觉是:怎么用了个中学生都能想到的公式来做人脸识别?这玩意能行么,怎么写的很多东西都是废话。

    第二次再看是很久之后,因为tutorial了一下compressed sensing (CS),突然回忆起似乎有个sparse的人脸识别方法。这次再看,就能注意到文章引用的很重要的一个结论:l1范数约束下的极值问题,其解是稀疏的。它是整篇文章的灵魂,也是唯一的理论基础,正式CS的一个重要结论之一,其它的内容都是实验性的。题外话,当前CV界很喜欢把现成的、新的结论拿过来用,这当然也是创新,正所谓,“方法本天成,妙手组合之”。

    于是如法炮制,sparse被用到很多CV的问题,比如识别、跟踪、超分辨率等等。这两年做sparse的人越来越多,CVPR‘2010就有很多篇我期待的文章。但总觉得大家都是在硬套sparse,为什么不直接从CS出发,CS的每个细节到了CV里都要customized的,这也是很亟待解决的问题。

    我目前的理解是sparse的优点和缺点都很明显:有了它问题的表述和解决都超级简单,但优化过程要用线性规划,速度有点慢。

    很看好的它(是CS不是sparse)的前景,发展好了就是划时代的。

  4. cyberfx
    2010年4月6日11:35 | #4

    @hardegg
    优化过程有近似解法(贪心的),orthogonal matching pursuit (OMP), David Donoho 写过这方面的论文,叫做 Stagewise Orthogonal Matching Pursuit (论文是 Sparse Solution of Underdetermined Linear Equations by Stagewise Orthogonal Matching Pursuit)

  5. hardegg
    2010年4月6日13:17 | #5

    @cyberfx
    有空学习学习。快速算法还有种叫凸松弛算法的。

    我跑过基于sparse的一个跟踪算法,感觉也有点慢。

    如果这东西真的能满足实时要求那就太爽了。

  6. cyberfx
    2010年4月6日14:57 | #6

    compressed sensing 其实十几年前就开始研究了,只是那时候没有这个叫法。那时候叫做basis pursuit(Donoho和他的一个华人学生Shaobing Chen提出的),还有它的近似算法matching pursuit和orthogonal matching pursuit。最近几年又火了起来是因为David Donoho, Emmanuel Candes和陶哲轩等人在数学理论证明推导上面有了深入进展,从而使很多人认识到这个不仅仅是个算法,而且是个理论,所以大家兴趣倍增同时感觉前途一片光明。

  7. cyberfx
    2010年4月6日16:54 | #7

    compressed sensing可能是一个理论上的重大突破,因为它打破了信息论里面的采样定理。

  8. filestorm
    2010年6月8日08:42 | #8

    @cyberfx
    哈哈,在这里看到了faobo!不知近来如何啊?
    compressive sensing没有打破采样定理的限制,因为我们总可以构造出一个信号,使得重构失败。他只是说,对于本征稀疏的信号,例如自然图像,“重构误差呈指数衰减”(形象地说,即是完美重构)的几率,很大。

    另外悄悄八卦一下,John Wright et al的文章其实07年就发到ICCV了,结果被惨剧,再投NIPS,又悲剧,接连折腾好几次,直到PAMI都发出来,才被会议接纳。这个故事很适合拿来共勉。希望那些正在做重要工作,但是在conference屡败屡战的朋友们能够坚持住。

  9. cyberfx
    2010年6月8日08:56 | #9

    @filestorm
    小侯,很久没看到你了,呵呵。马毅的这个事情听说过,我觉得一点都不奇怪啊,conference就是要屡败屡战,现在的审稿人都是看论文不太仔细,打动审稿人真是不容易啊。

  10. metalbubble
    2010年7月1日17:33 | #10

    @filestorm
    恩恩恩

  1. 本文目前尚无任何 trackbacks 和 pingbacks.