局部特征描述子可以分为两类,(个人看法,欢迎批评):一是基于“绝对”值的,二是基于比较的。
基于绝对值的是指诸如Sift,Surf,GLOH之类的描述子。一般的思路是将灰度,梯度等量化,构造直方图。这类描述子的判别性高,直观,但是有个通病就是计算复杂度高。
基于比较的是指诸如Ferns,BRIEF,Orb,OSID,BRISK之类的描述子。一般的思路是通过比较预先训练的,或者随机点对的特征值大小,来构造描述子。这类描述子一般都是为了提高计算速度而设计的。这类描述子不关心原始特征的绝对大小,只关心原始特征的ranking。(值得一提的是为什么将Ferns也归在此类,Ferns并没有一个显式的特征描述,甚至没有一个距离度量,但是我相信Ferns之所以有用还是基于pairwise pixel comparisons 的判别能力。注1)
我之所以将描述子如此分类,是受到ICCV11的这篇文章的启发:
文中提出了一个非常简单的feature compression的方法WTA(不是WTF^_^):

阅读全文…
分类: 新闻 标签: BRIEF, brisk, decriptor, Ferns, gloh, orb, osid, sift, surf, wta, 描述子
这个页面力图搜集各种跟CV,AR相关的代码,如无特别声明,均是c/c++代码。还是一贯的标准,不求全面,只求质量。
如有特别推荐的代码,请在本页留言,或者email我:cvchina AT gmail.com
通用库/General Library
无需多言。
Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。
很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。
图像,视频IO/Image, Video IO
AR相关/Augmented Reality
基于Marker的AR库
ARToolKit的增强版。实现了更好的姿态估计算法。
实时的跟踪、SLAM、AR库。无需Marker,模板,内置传感器等。
基于特征点检测和识别的AR库。
局部不变特征/Local Invariant Feature
目前最好的Sift开源实现。同时包含了KD-tree,KD-Forest,BoW实现。
基于Naive Bayesian Bundle的特征点识别。高速,但占用内存高。
基于OpenCV的Sift实现。
目标检测/Object Detection
又一个AdaBoost实现。训练速度快。
基于Centrist和Linear SVM的快速行人检测。
(近似)最近邻/ANN
目前最完整的(近似)最近邻开源库。不但实现了一系列查找算法,还包含了一种自动选取最快算法的机制。
另外一个近似最近邻库。
SLAM & SFM
monoSLAM库。由Androw Davison开发。
图像分割/Segmentation
使用Simple Linear Iterative Clustering产生指定数目,近似均匀分布的Super Pixel。
目标跟踪/Tracking
基于Online Random Forest的目标跟踪算法。
Kanade-Lucas-Tracker
Online Boosting Trackers
直线检测/Line Detection
基于联通域连接的直线检测算法。
基于梯度的,局部直线段检测算子。
指纹/Finger Print
基于感知的多媒体文件Hash算法。(提取,对比图像、视频、音频的指纹)
图像检索/Image Retrieval
Pyramid Matching Algorithm实现。
一个简单的的Vocabulary Tree实现。
视觉显著性/Visual Salience
Ming-Ming Cheng的视觉显著性算法。
FFT/DWT
最快,最好的开源FFT。
轻量级的FFT实现。许可证是亮点。
音频处理/Audio processing
音频处理,音频合成。
音频文件IO。
音频重采样。
分类: 标签: adaboost, ann, ARToolKit, artoolkitplus, bazar, cimg, code, devil, Ferns, ffmpeg, fft, fftreal, fftw, flann, KLT, open source, opencv, pHash, portvideo, ptam, ravl, scenelib, sift, slartoolkit, sport universal, TLD, vlfeat, 代码, 行人检测
先检测,再检索,呵呵。基于SIFT的图标检索。
样本太少,仅供参考!
阅读全文…
hellogv将最近开源的ASIFT移植到了Windows Mobile平台。文章看这里,源码看这里。据称Affine Sift在对付视角变化上远胜于Sift。
可不可以更给力一些,移植到Android上去?

来自NTU( National Taiwan University)的一个课程主页。内容很杂,有feature,matting,structure from motion, face morphing,不一一列举了。
链接在此: http://www.csie.ntu.edu.tw/~cyy/courses/vfx/05spring/lectures/
PPT做的很有料。特别是SIFT讲的很仔细,感觉不错。推荐优先看这个:
http://www.csie.ntu.edu.tw/~cyy/courses/vfx/05spring/lectures/handouts/lec04_feature.ppt
除了讲义,还有很多其他的资源,大伙自己挖掘,各取所需吧。














突然想起八卦一下opencv 2010的计划,找到这个http://opencv.willowgarage.com/wiki/GSOC_OpenCV2010页面。
看来下一个版本(可能)会有更多的非sift的feature,(可能)会有Place recognition ,Ground plane detection,Texture recognition等等用来支持增强现实,(可能)会有更好的gui(缩放,当前点位置,灰度值等等),(可能)会有opengl支持,(可能)truetype字体渲染等等,(可能)会有图像拼接,(可能)会支持android等等。。
下面照抄:
Mentors
- Background subtraction, feature based tracking
Nicolas Saunier, Ph.D.
Professeur Adjoint / Assistant Professor
Département des génies civil, géologique et des mines (CGM)
École Polytechnique de Montréal
http://nicolas.saunier.confins.net
- Write code that uses QTKit.framework to read videos on Mac OS X.
- Write GUI code that uses 64bit Carbon.
- Implement some well known CV algorithms.
Mark Asbach
Fraunhofer IAIS
Schloss Birlinghoven
Sankt Augustin, Germany
http://mmprec.iais.fraunhofer.de/asbach.html
- Image stitching and/or image collage
Gary Bradski
Senior Scientist, Willow Garage
Consulting Prof. Stanford U.
OpenCV Founder, Technical Content Owner
- ?
Vadim Pisarevsky
OpenCV founding team/Czar
- HighGUI enhancements:
- saving/restoring window positions on every platform,
- advanced image views: zoom, scrolling, displaying position + pixel values
- OpenGL support
- truetype text rendering, transparency, gradients etc. (via libcairo? or Qt?)
- possible cross-platform Qt backend
- Parallelization of various algorithms using Intel TBB (below are possible candidates):
- Calonder & One-way descriptors and the related algorithms
- Dense optical flow
- HOG-, Haar-, LBP-based object detectors (already threaded using OpenMP)
- Background/foreground segmentation
Victor Eruhimov
OpenCV founding team/Senior Researcher
Argus/Itseez founder
Ideas from the Core OpenCV Team
- Make it easy to use computer vision on the Android phone.
- This may involve some feature processing on the Phone, but also a link with a server (Amazon cloud?) and/or perhaps with Google’s own Streetview and map data.
- We want to enable:
- Image stitching and placement –
- can we add an off road trail, biking path, indoor scene or city park to Google Streetview?
- Place recognition and Ground plane detection for augmented reality –
- can we allow game makers to easily overlay a real scene?
- Texture recognition with geometry — can we allow game makers to augment a simple scene such as a board game with augmented reality overlay?
- Using:
- Visual odemetry (using techniques developed at Willow that should be ready by summer)
- Place recognition
- Texture + geometry based object recognition, again using techniques
- Image stitching
- Image collage
- Putting image collections into useful summary image collage.
- Can also work with Android above.
- Easy to post to web, pdf or other formats.
- Segmentation.
- Other functionality:
- Denoising, motion stabilization, lighting balance, image enhancement
- Segmentation in video/video effects
- Substitutes for SIFT
- 3D model capture, silhouetts + strip
请关注这个页面: http://opencv.willowgarage.com/wiki/GSOC_OpenCV2010 。
Stay tuned.
分类: 新闻 标签: android, augmented reality, feature, ground plane detection, gsoc, gui, opencv, opencv 2010, opengl, place recognition, sift, texture recognition, truetype, 增强现实
最新评论