局部特征描述子可以分为两类,(个人看法,欢迎批评):一是基于“绝对”值的,二是基于比较的。
基于绝对值的是指诸如Sift,Surf,GLOH之类的描述子。一般的思路是将灰度,梯度等量化,构造直方图。这类描述子的判别性高,直观,但是有个通病就是计算复杂度高。
基于比较的是指诸如Ferns,BRIEF,Orb,OSID,BRISK之类的描述子。一般的思路是通过比较预先训练的,或者随机点对的特征值大小,来构造描述子。这类描述子一般都是为了提高计算速度而设计的。这类描述子不关心原始特征的绝对大小,只关心原始特征的ranking。(值得一提的是为什么将Ferns也归在此类,Ferns并没有一个显式的特征描述,甚至没有一个距离度量,但是我相信Ferns之所以有用还是基于pairwise pixel comparisons 的判别能力。注1)
我之所以将描述子如此分类,是受到ICCV11的这篇文章的启发:
文中提出了一个非常简单的feature compression的方法WTA(不是WTF^_^):

阅读全文…
分类: 新闻 标签: BRIEF, brisk, decriptor, Ferns, gloh, orb, osid, sift, surf, wta, 描述子
这个页面力图搜集各种跟CV,AR相关的代码,如无特别声明,均是c/c++代码。还是一贯的标准,不求全面,只求质量。
如有特别推荐的代码,请在本页留言,或者email我:cvchina AT gmail.com
通用库/General Library
无需多言。
Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。
很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。
图像,视频IO/Image, Video IO
基于Marker的AR库
ARToolKit的增强版。实现了更好的姿态估计算法。
实时的跟踪、SLAM、AR库。无需Marker,模板,内置传感器等。
基于特征点检测和识别的AR库。
局部不变特征/Local Invariant Feature
目前最好的Sift开源实现。同时包含了KD-tree,KD-Forest,BoW实现。
基于Naive Bayesian Bundle的特征点识别。高速,但占用内存高。
基于OpenCV的Sift实现。
目标检测/Object Detection
又一个AdaBoost实现。训练速度快。
基于Centrist和Linear SVM的快速行人检测。
(近似)最近邻/ANN
目前最完整的(近似)最近邻开源库。不但实现了一系列查找算法,还包含了一种自动选取最快算法的机制。
另外一个近似最近邻库。
SLAM & SFM
monoSLAM库。由Androw Davison开发。
图像分割/Segmentation
使用Simple Linear Iterative Clustering产生指定数目,近似均匀分布的Super Pixel。
目标跟踪/Tracking
基于Online Random Forest的目标跟踪算法。
Kanade-Lucas-Tracker
Online Boosting Trackers
直线检测/Line Detection
基于联通域连接的直线检测算法。
基于梯度的,局部直线段检测算子。
指纹/Finger Print
基于感知的多媒体文件Hash算法。(提取,对比图像、视频、音频的指纹)
图像检索/Image Retrieval
Pyramid Matching Algorithm实现。
一个简单的的Vocabulary Tree实现。
视觉显著性/Visual Salience
Ming-Ming Cheng的视觉显著性算法。
FFT/DWT
最快,最好的开源FFT。
轻量级的FFT实现。许可证是亮点。
音频处理/Audio processing
音频处理,音频合成。
音频文件IO。
音频重采样。
分类: 标签: adaboost, ann, ARToolKit, artoolkitplus, bazar, cimg, code, devil, Ferns, ffmpeg, fft, fftreal, fftw, flann, KLT, open source, opencv, pHash, portvideo, ptam, ravl, scenelib, sift, slartoolkit, sport universal, TLD, vlfeat, 代码, 行人检测
Sony最近公开的一种称为SmartAR的技术,看起来像是融合Ferns或者PopCode和PTAM。声称的特点是高速和能够感知环境的3D结构。
上两个视频
阅读全文…
这是cvpr2009最佳demo。来自剑桥大学。匹配一个特征点只用2.3微秒。是微秒,不是毫秒!一副平面图像按200个特征点(论文中提及200点就足够估算姿态了)算,那么一秒钟可以处理2000帧!!额里格神啊。从上面的视频上看,该算法可以流畅的运行在手机上面。很牛啊,你能想象在手机上算sift或者surf么。。。
算法思路沿袭Ferns,不过特征点检测用的Fast9,特征也变成了二进制特征,可以用SSE2什么的加速,还采用了动态匹配的策略,因此速度变得飞快,很有吸引力不是,来看论文吧。希望opencv下一个版本可以加入这个算法。
项目主页在这里。可以看大画幅视频和PPT。
最新评论