Tracking-Learning-Detection
配合一下LiMu。
- [5] Z. Kalal, K. Mikolajczyk, and J. Matas, “Face-TLD: Tracking-Learning-Detection Applied to Faces,” International Conference on Image Processing, 2010.
[pdf][poster][ ] - [4] Z. Kalal, K. Mikolajczyk, and J. Matas, “Forward-Backward Error: Automatic Detection of Tracking Failures,” International Conference on Pattern Recognition, 2010, pp. 23-26.
[pdf][ ] - [3] Z. Kalal, J. Matas, and K. Mikolajczyk, “P-N Learning: Bootstrapping Binary Classifiers by Structural Constraints,” Conference on Computer Vision and Pattern Recognition, 2010.
[pdf][poster 1][poster 2][ ] - [2] Z. Kalal, J. Matas, and K. Mikolajczyk, “Online learning of robust object detectors during unstable tracking,” On-line Learning for Computer Vision Workshop, 2009.
[pdf] [ ]
fantastic wor
@chenparadise
amazing
amazing
这个确实NB
很少看到敢于说自己是long term tracking的
这个好强,学习之
迫不急待去读paper了,对我这个做visual tracking的人是不小的激励和刺激啊。
确实fancy,不过demo的数据集比较简单(其实人脸非常容易track),给位谁有空可以试试它在这些数据上是不是work
http://vision.ucsd.edu/~bbabenko/project_miltrack.shtml
@Mu 这个link的跟踪方法long term的表现并不太好。TLD作者主页上有些视频还是很难的,不过,没code没真相。
有代码有真相了,大赞!!
https://github.com/zk00006/OpenTLD
这个,的确是太牛了。
代码调了我看了下,确实写的不错。这个tracker的observation model是基于随机森林和2bit binary patterns特征的,所以相关的性能都得益于或者说受限于这个特征。感觉比MILTrack(cvpr09′)还要强一点,MILTrack在允许scaling下unstable。然而这个tracker还是不能解决比较drastic的non-rigid deformation,还有完全没有抵抗occlusion的能力(不过基于全屏detection,没有也没事,再出现会找到的)。
总而言之在性能和速度之间是个非常棒的平衡!
好犀利~~
drastic non-rigid deformation不是这种tracking算法需要解决的问题,或者说即使解决了又如何,给出的结果只是个bouding box而已
occlusion就让detector来吧,绝对比一个全能的tracker管用;目前解决occlusion的方法有多少是reasonable的,尤其是遮挡严重的情况?也许可以通过online learning来搞,但不怕分类器drift掉么
我觉得TLD最值得推崇的地方就是把detector和tracker结合得更好,能够随时对跟踪结果进行评估和学习,从而实现更好的long-term跟踪;而不像主流算法非要用tracker来解决所有问题,在检测和识别技术发展有限的情况下,这好像不太不现实
TLD很实用
同意,学习了
这个算法初步看了下,比很多算法都好,简单实用。看来唯一的缺点还是底层的初始检测问题。如果这个问题能够完美解决,似乎商业级的应用不比基于距离的3D方式差,似乎kinect在引入这个技术。
三国杀版理解:
Tracker是[主公]目的是找出[忠臣](true positive sample),干掉[反贼](negative sample)和[内奸](false positive sample)。Tracking也是这整个算法的目的和整体的视觉结果。
Detector就是主公(first labelled object)每一回合进行的判断,主公会认出明反(negative sample),但是偶尔也会错杀好人(drift away)。Detector每次猜出N个忠臣(positive)来,但是跟tracker的结果一对比就会accept一部分(同伙),prune一部分(异类),这就是在Learning了。
这样,随着游戏的进行,主公根据跟踪(tracking)每个家伙各自的行为(feature),根据已经知道的身份(model)判断(detecting)未知玩家的属类(using randomized forest),要保证保留忠臣,渺去反贼,干掉内奸,最终结果就是只保留Object(忠臣)。
—————————————————————
今天读了一下paper,半认真地胡诌八侃一通,各位看官笑过。
理解不确处请务必指正~
我用它的算法实验了一下,自己的视频图像,发现效果较差。不知是不是我的视频帧比较大质量一般的原因
@Mu
我测了一下这个data,还可以
受初始条件及目标形状信息量的影响,适合形状特征明显过程变化不大的目标,但T-L-D的跟踪框架很鲁棒,具备学习恢复过程,所以可以长时。