如google research blog上所说:
Computer Vision is at the core of many Google products, such as Image Search, YouTube, Street View, Picasa, and Goggles, and as always, Google is involved in several ways with CVPR.
不过这里面没有汽车自动驾驶的相关内容啊,要知道,内华达州已经通过了一项法案允许无人驾驶汽车合法上路了,看这里,当然,google是幕后的推手,看这里。
下面是google在cvpr2011上的论文列表:
Where’s Waldo: Matching People in Images of Crowds by Rahul Garg, Deva Ramanan, Steve Seitz, Noah Snavely
Visual and Semantic Similarity in ImageNet by Thomas Deselaers, Vittorio Ferrari
Multicore Bundle Adjustment by Changchang Wu, Sameer Agarwal, Brian Curless, Steve Seitz
A Hierarchical Conditional Random Field Model for Labeling and Segmenting Images of Street Scenes by Qixing Huang, Mei Han, Bo Wu, Sergey Ioffe
Kernelized Structural SVM Learning for Supervised Object Segmentation by Luca Bertelli, Tianli Yu, Diem Vu, Salih Gokturk
Discriminative Tag Learning on YouTube Videos with Latent Sub-tags by Weilong Yang, George Toderici
Auto-Directed Video Stabilization with Robust L1 Optimal Camera Paths by Matthias Grundmann, Vivek Kwatra, Irfan Essa
Image Saliency: From Local to Global Context by Meng Wang, Janusz Konrad, Prakash Ishwar, Yushi Jing, Henry Rowley
鉴于blogspot被墙,我还是把全文转过来吧:
阅读全文…

CVPR 2011委员会宣布了以下奖项:
Longuet-Higgins Prize(介绍)
Rapid Object Detection using a Boosted Cascade of Simple Features,(连接)
Paul A. Viola, Michael J. Jones.
Sponsored by Microsoft
经典的viola-jones算法,用过opencv的都知道
Best Paper
Real-time Human Pose Recognition in Parts from Single Depth Images,
Jamie Shotton, Andrew FItzgibbon, Mat Cook, Toby Sharp, Mark Finocchio, Richard Moore, Alex Kipman, Andrew Blake.
Sponsored by Google
不出火炉童鞋所料呀。。。。附上当初预计的连接,论文的连接
Best Paper Honorable Mention
Discrete-Continuous Optimization for Large-scale Structure from Motion,(链接)
David Crandall, Andrew Owens, Noah Snavely, Daniel Huttenlocher
Sponsored by Google
Best Student Paper
Recognition Using Visual Phrases,(链接)
Ali Farhadi, Mohammad Amin Sadeghi
Sponsored by United Technologies Research Center
阅读全文…
转自庞宇童鞋的校内
CVPR2011正在如火如荼的进行中,在网上能看到的部分文章中,我终于找到一篇让我眼前冒光的文章。虽然,其实,也许,主要的理由是我好不容易能看懂一篇。不过,这并不妨碍该文章定会成为今年CVPR的一朵奇葩这件事。不过它肯定拿不了best paper啦,因为它只是篇poster,但我猜也许是组委会认为如果让他们当oral,大牛现场卖萌会雷死观众,并可能引起大面积恐慌。
鉴于我没有找到更好的平台共享这一发现,就只好先放到校内了。不过这个主题不光是对计算机视觉的人有意义,只要是搞数据的人都会有些用处吧。
文章题目是:Unbiased Look at Dataset Bias,无偏见的研究数据集偏见。首先看看作者,一个是MIT的Antonio Torralba,另一个是CMU的Alexei A. Efros。 MIT和CMU在计算机视觉领域是两个绝对的巨人,无人能望其项背。这两个人这几年刚拿到副教授职位,而且又是那种论文又高产又高质的家伙。要注意哦,这篇文章没有研究僧,也就是说,这是一篇大牛和大牛的强强联合之作。也正是如此,该文章发挥出了大牛卖萌的极致。满篇充斥着“矮油”(alas),“让我们玩儿个游戏/玩具实验(toy experiment)”等等,各种你很难在一般论文里看到的搞笑语言。特别是文章的致谢和声明:
阅读全文…
ifanr上有一个更好的lytro的介绍。与君共享。

又一个 Color ?
Color 创始人满嘴炮火车的忽悠了一通关于地点判断的影像技术,融资四千五百万美金之后, Lytro 凭借焦点控制技术,融到五千万美金。
他和 Color 一样,是个更大的忽悠?或者,是一场真正的革命?
阅读全文…

看起来这会是继panorama,HDR之后,computational photography的又一个热门应用:Light Field Photography。
lytro是硅谷的一家初创公司,就是要发行这么一款相机(未上市),通过记录light field,从而使得在成像之后,仍有机会调整焦点。
这里看原理介绍:http://www.lytro.com/science_inside
根据这里说说法,lytro将在今年发行一款“价格很有竞争力”的光场相机(是不是翻译成全光相机更给力一些)。
官网 阅读全文…

大家都知道苹果系统是一个很奇怪的系统。有最精美的UI,确实基于最古老的系统。有最好的编程软件,确有自己的编程语言。这里提供一个专门为iOS准备的opencv的sh。链接
不过大家也都知道跨平台是一件巨痛苦的事情,所以貌似要读以下的一个国外网站的教程(其实那个sh也是那个网站提供的)
今天刚发布的Release candidate,估计下周正式版本就要出来了。
大家到这里看看what’s new:新增加了一个stitching拼接模块,Android支持更加方便了,使用Google test框架,其他变化主要是内部性能改进。
Update 关于手持设备方面的:
首先,OpenCV 2.3的Android build终于变成了官方支持的NDK-Build的方式了。以前的方法相当让人头疼,使用的非Android官方的方法去写JNI接口,tutorial跟着走一遍也不知道所以然。
其次,What’s new里面说道,新的Android支持是NVidia在开发,让然浮想连篇啊!本来OpenCV就是支持CUDA显卡加速的,那请细读下面的报道:http://computervisioncentral.com/content/nvidia-releases-opencv-android-tegra-301677 Tegra 3 support,会不会有硬件加速?OpenCV在Apple A4 这个级别的ARM处理器的性能要比桌面x86处理器慢~20倍,GPU加速让人期待。
最后小八卦,文中提到的Kari Pulli原来在Nokia,他和Stanford合作的FCam API是基于跑在Nokia N900/800 Maemo Linux上的Computational Photograph的API。现在转投NVidia门下把FCam带入到Tegra?有意思,看来NVidia很看中未来手持设备的Visual computing的能力,到处发力找突破。
–幻肢老杨

cvpr周啊。求新闻,求照片。
话说nvidia有一个computer vision development on tegra的tutorial。AR在装备tegera2的平板上是不是大有可为?
今天发现有免费的图书下载的地方http://www.intechopen.com/
CV/PR/IP方面的书有不少,看了一些,发现主要是论文集性质的。
最新评论