存档

文章标签 ‘图像检索’

Google推出通过图片搜索

2011年6月15日 14 条评论


Google开始提供本地上传图片搜索了,和Tineye的用法完全。但是我估计定位会不一样,Tineye是利用图片hash值去搜索完全相同的图片,寻找引用同一张图片的不同来源,所谓的exact 。这样找出来的一般只是缩放和裁剪过,内容完全一样。Google肯定对这个不感兴趣,他们以前的的图片搜索还有Android上的Goggles都是相似图片搜索(similar )。不过我看Google应该把Tineye收购了,这样两种功能都有了。Tineye还是有点用处的,平时看到有人在BBS上贴表妹什么的,用Tineye搜一下看看是不是网图…

刚试了一下,这个功能目前还没开放

老杨

omniar

2011年2月11日 1 条评论

omniar是个很有特色的视觉搜索服务。有两个特点:

1:基于3D的。不同于常见的2D图像检索服务,如goggles, kooaba等。omniar是3D的,提供基于照片的3D重建和检索服务。

不过我有个疑问,对于房子这样的对象,使用3D信息还说得过去,对于酒瓶这样都大同小异的,3D信息能起多大作用呢。

2:开放数据库,允许用户自行上传数据。

我上传了一个宣传视频到优酷,挺酷的。

阅读全文…

移动视觉搜索

2010年7月8日 8 条评论

个人定义的移动视觉搜索是指:以移动终端捕获的图像作为检索项,通过互联网检索感兴趣信息的一种信息检索方式

目前,我看到了5个提供移动视觉搜索服务的公司:分别是google goggles, amazon snaptell, nokia point&find, kooabaoMoby。如下图。(图片来自cvpr2010,点击查看论文)

阅读全文…

Sketch2Photo发布了一个初始版本

2010年6月21日 10 条评论

地址为:
http://cg.cs.tsinghua.edu.cn/montage/home.htm

还有一些功能正在添加。

Locations of visitors to this page

公司介绍9:plink

2010年4月30日 3 条评论

 

PlinkArt Blog Rotating Header Image

PLink是英国的一个图像检索公司,专注于艺术品的检索,非常有特点的一个小公司。

PLink开发了一个名为PlinkArt的android应用程序,见下图,是Android Development Challenge(ADC)的冠军,由此赢得了google的关注。不久前,PLink的founder宣布他们被google收购了。PLinkArt也不再更新了,PLink的两个founder:Mark Cummins和James Philbin可能要专注于为google goggles增加新的特性了。

demonstartion 1

两位创始人的主页:

Mark Cummins的主页:  http://www.robots.ox.ac.uk/~mjc/

James Philbin的主页: http://www.robots.ox.ac.uk/~james/

两人都是牛津刚毕业的博士,我只能说太牛逼了。

官方网站官方博客媒体报道

追忆似水年华:SenseCamera助人找回失落的回忆

2010年3月22日 1 条评论

佩戴一个便携式的摄像头,录音仪,gps来记录身边发生的一切已经不是个新鲜玩意了。但是如何有效的挖掘,浏览,总结这海量的数据,却是个新鲜可挖掘的课题。

SenseCamera是微软研发的这种设备,有摄像头,光学传感器,红外传感器,加速仪等等。目前研究者致力于如何有效的组织采集到的影像等数据,来帮助记忆有困难的人来了解过去究竟发生了什么,从而不用像memento(记忆碎片)里那个可怜的家伙一样把自己全身刺满纹身了。

下面是相关研究的介绍引文,没时间翻了。

To find the best memory cues for Mr. Reznick’s experiences, the researchers — Anind K. Dey, a computer science professor at Carnegie Mellon University, and Matthew Lee, a graduate student — considered the types of images that had proved the most effective in previous SenseCam studies.

They soon realized that the capriciousness of memory made answers elusive. For one subject, a donkey in the background of a barnyard photo brought back a flood of recollections. For another, an otherwise unremarkable landscape reminded the subject of a snowfall that had not been expected.

Still, the researchers came up with some broad rules for identifying and retrieving images likely to serve as memory triggers. For a people-based experience like a family reunion, the system selects photographs in which faces are clearly discernible; for a location-based experience like a visit to a museum, it uses geographical positions provided by GPS and accelerometer data to judge what images might be most salient — for example, when a subject might be hovering at one spot, like in front of a painting.

Research groups elsewhere are experimenting with other techniques to summarize and make use of SenseCam data. Alan Smeaton and colleagues at Dublin City University in Ireland are comparing images to categorize them by activity — shopping, for example — so the system can put together a visual summary of the day. At the University of Toronto, a group led by Ronald M. Baecker is investigating the usefulness of complementing SenseCam images with an audio narrative created by a loved one.

Once the system selects some photos from the hundreds taken, the caregiver winnows down the candidates, adding cues like audio from the voice recorder, verbal narration and brief text captions. The final product is a multimedia slide show on a tablet computer that allows the patient to dig deeper into highlighted parts of some images by tapping on the screen. The first tap plays audio, the second shows captions.

“The design is intended to give the patient the ability to engage actively with the experience instead of simply flipping through some pictures,” said Mr. Lee, the graduate student. Testing the system with the Reznicks and two other couples, he and Dr. Dey found that it helped patients recall events more vividly and with greater confidence than when they simply went through all of the images.

Other SenseCam studies — also financed by — have produced encouraging results, but plans to market the device as a memory aid have not been announced.

媒体来源

公司介绍 3 :Snaptell

2010年1月21日 没有评论

snaptell logo

snaptell icon

snaptell是一票印度人创建的美国公司。主要业务是手机图像检索。意思就是通过手机摄像头抓拍到的图像搜索相关信息(看名字知道啦,snap->tell)。

官方介绍他们的算法非常之精准,可以对付遮挡,光照不均,扭曲,透视,缩放等等,总之很牛。他们的算法名字叫”Accumulated Signed Gradient” (ASG),但是我在google scholar和google patent上面都没有搜到,保密工作做得好啊。

官网介绍他们的算法在一次比赛中获得了百分百的识别率。下面有些样例。

阅读全文…