存档
siggraph09 course: 3D scanner
不会太old吧。今天搜索结构光时候,检索到的。非常详尽的一份3D scanner的教学课程,更是详细描述了如何利用triangulation,使用可以轻易买到的硬件来DIY一个3D扫描仪。对三维重建感兴趣的朋友不要错过,新手可以用来入门,老手可以温故而知新。导论里面提到一个milkscanner的玩意,用乐高,牛奶,网络摄像头搭建一个3D扫描仪,真是太有才了。
链接大放送
首先是simba推荐的unlogo,目标是,正如其名,把图像,视频里的logo全部屏蔽掉,无独有偶,最近又看到一个叫做diminished reality的玩意,目的是从视频中把指定的物体删除掉,同时填充上合理的内容,貌似出现在ismar2010上面。感觉前者还嫌粗糙,无论是技术还是创新性。
公司介绍15:BriefCam
ipod touch 4G初体验

ipod touch 4G到手。本来很期待新的ios自带的HDR功能,不想在touch上被阉割了。倍感失望,搜了一下HDR相关的app,没有一个免费的。只能等越狱了。
另一个不满是,google goggles不支持touch,很是不解。个人估计goggles或许用了GPS来缩小检索的范围,特别是做地标检索的时候,而touch是没有GPS的。(也许这个论点不成立,因为用wifi也是可以粗定位的。)还好,以前cvchina也系统介绍过好几个移动视觉搜索的服务,因此找了几个替代品:oMoby,snaptell。oMoby要明显强于snaptell。(暂时不知道怎么从touch截图,不上截图了。)遗憾的kooaba的应用程序,同样不支持touch。我只能长叹一声,WTF。
light space

微软研究院在UIST上展示一个异想天开的UI技术:light space。思路是利用多个深度摄像头回复场景内的3D结构,然后利用人体完成一些奇怪搞笑的UI操作。比如,先左手接触一下A屏幕,再右手接触一下B屏幕,就可以A屏幕上的内容转移到B屏幕上。再比如用一个扫除的动作,可以把桌面上显示的内容”扫”到手上,并以图标的形式显示。。。
从另一个方面证明光的波粒二象性
关于attention的有趣实验
做CV的人以为人眼是万能的,能看到所有的信息,所以CV的目的就是为了呈现一个真实的世界,但人眼的确不是万能的,下面的视频显示的一种叫inattentional blindness的疾病人眼机制,很有意思,对于做Computer Vision的可能会有启发。
高通公布AR SDK
高通放出了android平台上的augmented reality develop kit。终于,做AR的门槛又降低了一些,你不必懂得cv,不必为图像识别,姿态估计而伤神,读读API就搞定,省下来精力全给想象力吧。







最新评论