存档

‘新闻’ 分类的存档

opencv2.2 in Python

2010年12月9日 5 条评论

下面是怎么在windows下编译使用opencv2.2的python绑定的步骤: 阅读全文…

分类: 新闻 标签: ,

kinect原理

2010年12月7日 3 条评论

用计算机视觉的方法获得场景/物体的深度就是各种三角化(激光+摄像头,双目,投影仪+摄像头等等),当然还有depth from focus,coded aperture之类的技术。近来越来越热门的深度摄像头(depth camera)多采用的是另外一种办法,(time of fight),利用主动射出的红外光往返的相位差来测量深度。primesense为微软kinect中定做的深度摄像头又用了另外一种思路,一种被primesense成为light coding的专利技术。按照这个博客上的内容,kinect通过IR头投射一些“随机”点阵,然后只用了一个普通的CMOS传感器来扑捉这个点阵。按照文章里说法,随机其实并不随机,一些模式在整个投影图案中反复出现。简单来说,当场景的深度发生变化时,摄像头看到的点阵也会发生变化,通过这个变化就可以推断出深度信息。当然事实上可能也没有这么简单,有兴趣的可以去读一下primesense的专利。

1: http://www.wipo.int/pctdb/en/wo.jsp?WO=2007043036

2: http://www.freepatentsonline.com/7433024.pdf

持续关注的kinect的继续两条信息

2010年12月6日 2 条评论
分类: 新闻 标签: , ,

opencv2.2给力更新

2010年12月5日 8 条评论

加入了若干局部特征(SIFT,SURF,FAST),加入了LatentSVM object detector,GUI变成了QT等等。何其给力。

阅读全文…

insight3d

2010年12月3日 1 条评论

一个很好玩的开源软件,类似于photosynth或者image modeler,用来做重建场景/物体的3D模型。

郁闷的是跑到最后一步generate texture时候就崩溃鸟。可能中间需要手动编辑ploygon才行么?

主页

source

Kinect人体姿态跟踪

2010年11月30日 4 条评论

( Center for Advances in Digital Entertainment Technologies)正在做一个open source sdk,用来做基于kinect的人体姿态估计。这才是深度破解。下面截图一张。继续阅读里面还有视频,需翻墙。

via

阅读全文…

分类: 新闻 标签: , , ,

转:Android模拟信号示波器

2010年11月24日 没有评论

转自牛逼的胸中无码的hellogv。同时献给xiaochao,赶紧学习一下。

上次简单地介绍了AudioRecord和AudioTrack的使用,这次就结合SurfaceView实现一个Android版的手机模拟信号示波器(PS:以前也讲过J2ME版的手机示波器)。最近物联网炒得很火,作为手机软件开发者,如何在不修改手机硬件电路的前提下实现与第三方传感器结合呢?麦克风就是一个很好的ADC接口,通过麦克风与第三方传感器结合,再在软件里对模拟信号做相应的处理,就可以提供更丰富的传感化应用。

先来看看本文程序运行的效果图(屏幕录像速度较慢,真机实际运行起来会更加流畅):

来源

分类: 新闻 标签: , ,

必须激动一把:学术论文里看到魅族M8

2010年11月24日 2 条评论

外国煤油很给力啊!这篇文章:

Wide Area Localization on Mobile Phones

Authors Arth Clemens, Wagner Daniel, Klopschitz Manfred, Irschara Arnold , Schmalstieg Dieter
Appeared in Proceedings of Int. Symposium on Mixed and Augmented Reality 2009 (ISMAR´09)

文章这里下载。摘要:

We present a fast and memory efficient method for localizing a mobile user’s 6DOF pose from a single camera image. Our approach registers a view with respect to a sparse 3D point reconstruction. The 3D point dataset is partitioned into pieces based on visibility constraints and occlusion culling, making it scalable and efficient to handle. Starting with a coarse guess, our system only considers features that can be seen from the user’s position. Our method is resource efficient, usually requiring only a few megabytes of memory, thereby making it feasible to run on low-end devices such as mobile phones. At the same time it is fast enough to give instant results on this device class. m8 in

同样是煤油,人家可以拿M8来做实验写paper,还HLL地在paper里给M8两个特写,差距啊!

就是不知道这帮哥们怎么买到M8的,而且还是白色后盖的。

不知道囧王看到这个啥表情。

更坚定了我买M9的信念,嘿嘿!

分类: 新闻 标签:

文档图像对齐以及AR

2010年11月24日 6 条评论

去年曾经很需要的一个算法,今天无意中遇到了。

图像配准早就是一个很easy的技术了,但想想近似于二值图像的文档图像如何配准?

直接上SIFT,SURF这些经典算法?No!曾经有人试验过,结果是有效的feature point非常非常之少,近似于黑白的图像和相似的结构,那些直方图特征搞不定啊。

feature points

(a)和(b)分别是SURF和文章的算法

registration

出自同一个很NB的作者的这两篇文章提供了比较好的解决办法。具体解决办法看论文(1 2)和video(1 2)吧。很nice作者还提供了源码

  1. Hideaki Uchiyama, Julien Pilet and Hideo Saito, “On-line document registering and retrieving system for AR annotation overlay,” 1st ACM Augmented Human International Conference (AH), No.23, Apr. 2010. (oral)
  2. Hideaki Uchiyama and Hideo Saito, “Augmenting text document by on-line learning of local arrangement of keypoints,” 8th IEEE and ACM International Symposium on Mixed and Augmented Reality (ISMAR), pp.95-98, Oct. 2009. (oral)

pseudocolor generation

2010年11月22日 1 条评论

做图像处理经常需要可视化中间过程,伪彩色是常用的工具。以前都是手动指定几个颜色,今天看到computer vision:algorithm and application里面提到一种伪彩色生成办法,Szeliski描述如下:

For each (non-negative) label value, consider the bits as being split among the three color
channels, e.g., for a nine-bit value, the bits could be labeled RGBRGBRGB. After collecting
each of the three color values, reverse the bits so that the low-order bits vary the most quickly.

For each (non-negative) label value, consider the bits as being split among the three colorchannels, e.g., for a nine-bit value, the bits could be labeled RGBRGBRGB. After collectingeach of the three color values, reverse the bits so that the low-order bits vary the most quickly.

尝试实现了一下,code:

阅读全文…