存档

文章标签 ‘sift’

休伯尔的猫(Hubel’s Cat)

2012年11月12日 5 条评论

当我们总是提起要给David Lowe诺贝尔奖的时候,我们要回顾下已经得过奖的David H. Hubel和 Torsten Wiesel。计算机视觉的一切都来自于这样的一只无私奉献的猫,作为人类的朋友,他们牺牲小我,成就大我,使得我们有了SIFT,使得我们有了Sparse coding,使得我们有了增强现实,使得我们有了google glass,使得我们有了对现代意义上的视觉的一切认识和应用。
这只猫就在这里:

阅读全文…

分类: 新闻 标签: , ,

比较描述子

2011年8月30日 3 条评论

局部特征描述子可以分为两类,(个人看法,欢迎批评):一是基于“绝对”值的,二是基于比较的。

基于绝对值的是指诸如SiftSurfGLOH之类的描述子。一般的思路是将灰度,梯度等量化,构造直方图。这类描述子的判别性高,直观,但是有个通病就是计算复杂度高。

基于比较的是指诸如FernsBRIEFOrbOSIDBRISK之类的描述子。一般的思路是通过比较预先训练的,或者随机点对的特征值大小,来构造描述子。这类描述子一般都是为了提高计算速度而设计的。这类描述子不关心原始特征的绝对大小,只关心原始特征的ranking。(值得一提的是为什么将Ferns也归在此类,Ferns并没有一个显式的特征描述,甚至没有一个距离度量,但是我相信Ferns之所以有用还是基于pairwise pixel comparisons 的判别能力。注1

我之所以将描述子如此分类,是受到ICCV11的这篇文章的启发:

The Power of Comparative Reasoning

文中提出了一个非常简单的feature compression的方法WTA(不是WTF^_^):

image

阅读全文…

代码

2011年6月9日 37 条评论

这个页面力图搜集各种跟CV,AR相关的代码,如无特别声明,均是c/c++。还是一贯的标准,不求全面,只求质量。

如有特别推荐的代码,请在本页留言,或者email我:cvchina AT gmail.com

通用库/General Library

无需多言。

Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。

很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。

图像,视频IO/Image, Video IO

AR相关/

基于Marker的AR库

ARToolKit的增强版。实现了更好的姿态估计算法。

实时的跟踪、SLAM、AR库。无需Marker,模板,内置传感器等。

基于特征点检测和识别的AR库。

局部不变特征/Local Invariant

目前最好的Sift开源实现。同时包含了KD-tree,KD-Forest,BoW实现。

基于Naive Bayesian Bundle的特征点识别。高速,但占用内存高。

基于OpenCV的Sift实现。

目标检测/Object Detection

又一个AdaBoost实现。训练速度快。

基于Centrist和Linear SVM的快速行人检测。

(近似)最近邻/ANN

目前最完整的(近似)最近邻开源库。不但实现了一系列查找算法,还包含了一种自动选取最快算法的机制。

另外一个近似最近邻库。

SLAM & SFM

monoSLAM库。由Androw Davison开发。

图像分割/Segmentation

使用Simple Linear Iterative Clustering产生指定数目,近似均匀分布的Super Pixel。

目标跟踪/Tracking

基于Online Random Forest的目标跟踪算法。

Kanade-Lucas-Tracker

Online Boosting Trackers

直线检测/Line Detection

基于联通域连接的直线检测算法。

基于梯度的,局部直线段检测算子。

指纹/Finger Print

基于感知的多媒体文件Hash算法。(提取,对比图像、视频、音频的指纹)

图像检索/Image Retrieval

Pyramid Matching Algorithm实现。

一个简单的的Vocabulary Tree实现。

视觉显著性/Visual Salience

Ming-Ming Cheng的视觉显著性算法。

FFT/DWT

最快,最好的开源FFT。

轻量级的FFT实现。许可证是亮点。

音频处理/Audio processing

音频处理,音频合成。

音频文件IO。

音频重采样。

logo retrieval

2011年3月25日 14 条评论

先检测,再检索,呵呵。基于SIFT的图标检索。
样本太少,仅供参考!

阅读全文…

分类: 新闻 标签: , , , ,

ASift Windows Mobile移植

2010年12月21日 2 条评论

hellogv将最近开源的ASIFT移植到了Windows Mobile平台。文章看这里,源码看这里。据称Affine Sift在对付视角变化上远胜于Sift。

可不可以更给力一些,移植到Android上去?

分类: 新闻 标签: , , ,

很好用的库:VLFEAT

2010年6月17日 4 条评论

怎么让作研究简化呢?

偷懒!

怎么偷懒呢?

用库!

所以推荐个库

http://www.vlfeat.org/

阅读全文…

推荐课程:Digital Visual Effects

2010年5月25日 2 条评论

来自NTU( National Taiwan University)的一个课程主页。内容很杂,有feature,matting,structure from motion, face morphing,不一一列举了。

链接在此: http://www.csie.ntu.edu.tw/~cyy/courses/vfx/05spring/lectures/

PPT做的很有料。特别是SIFT讲的很仔细,感觉不错。推荐优先看这个:

http://www.csie.ntu.edu.tw/~cyy/courses/vfx/05spring/lectures/handouts/lec04_feature.ppt

除了讲义,还有很多其他的资源,大伙自己挖掘,各取所需吧。

Opencv 2010计划

2010年3月9日 6 条评论

OpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCVOpenCV

突然想起八卦一下opencv 2010的计划,找到这个http://opencv.willowgarage.com/wiki/GSOC_OpenCV2010页面。

看来下一个版本(可能)会有更多的非sift的feature,(可能)会有Place recognition ,,Texture recognition等等用来支持增强现实,(可能)会有更好的gui(缩放,当前点位置,灰度值等等),(可能)会有opengl支持,(可能)truetype字体渲染等等,(可能)会有图像拼接,(可能)会支持android等等。。

下面照抄:

Mentors

  • Background subtraction, based tracking
     Nicolas Saunier, Ph.D.
     Professeur Adjoint / Assistant Professor
     Département des génies civil, géologique et des mines (CGM)
     École Polytechnique de Montréal
    
    http://nicolas.saunier.confins.net
  • Write that uses QTKit.framework to read videos on Mac OS X.
  • Write code that uses 64bit Carbon.
  • Implement some well known CV algorithms.
     Mark Asbach
     Fraunhofer IAIS
     Schloss Birlinghoven
     Sankt Augustin, Germany
    
    http://mmprec.iais.fraunhofer.de/asbach.html
  • Image stitching and/or image collage
     Gary Bradski
     Senior Scientist, Willow Garage
     Consulting Prof. Stanford U.
     OpenCV Founder, Technical Content Owner
  • ?
     Vadim Pisarevsky
     OpenCV founding team/Czar
  • HighGUI enhancements:
    • saving/restoring window positions on every platform,
    • advanced image views: zoom, scrolling, displaying position + pixel values
    • OpenGL support
    • text rendering, transparency, gradients etc. (via libcairo? or Qt?)
    • possible cross-platform Qt backend
  • Parallelization of various algorithms using Intel TBB (below are possible candidates):
    • Calonder & One-way descriptors and the related algorithms
    • Dense optical flow
    • HOG-, Haar-, LBP-based object detectors (already threaded using OpenMP)
    • Background/foreground segmentation
     Victor Eruhimov
     OpenCV founding team/Senior Researcher
     Argus/Itseez founder

Ideas from the Core OpenCV Team

  • Make it easy to use computer vision on the phone.
    • This may involve some feature processing on the Phone, but also a link with a server (Amazon cloud?) and/or perhaps with Google’s own Streetview and map data.
    • We want to enable:
      • Image stitching and placement –
        • can we add an off road trail, biking path, indoor scene or city park to Google Streetview?
      • Place recognition and Ground plane detection for
        • can we allow game makers to easily overlay a real scene?
      • Texture recognition with geometry — can we allow game makers to augment a simple scene such as a board game with augmented reality overlay?
    • Using:
      • Visual odemetry (using techniques developed at Willow that should be ready by summer)
        • Place recognition
        • Texture + geometry based object recognition, again using techniques
        • Image stitching
  • Image collage
    • Putting image collections into useful summary image collage.
    • Can also work with Android above.
    • Easy to post to web, pdf or other formats.
    • Segmentation.
  • Other functionality:
    • Denoising, motion stabilization, lighting balance, image enhancement
    • Segmentation in video/video effects
    • Substitutes for
    • 3D model capture, silhouetts + strip

请关注这个页面: http://opencv.willowgarage.com/wiki/GSOC_OpenCV2010

Stay tuned.