存档

文章标签 ‘goggles’

ipod touch 4G初体验

2010年10月10日 6 条评论

R0015048_1.jpg

ipod 4G到手。本来很期待新的ios自带的HDR功能,不想在touch上被阉割了。倍感失望,搜了一下HDR相关的app,没有一个免费的。只能等越狱了。

另一个不满是, goggles不支持touch,很是不解。个人估计goggles或许用了GPS来缩小检索的范围,特别是做地标检索的时候,而touch是没有GPS的。(也许这个论点不成立,因为用wifi也是可以粗定位的。)还好,以前cvchina也系统介绍过好几个移动视觉搜索的服务,因此找了几个替代品:。oMoby要明显强于snaptell。(暂时不知道怎么从touch截图,不上截图了。)遗憾的kooaba的应用程序,同样不支持touch。我只能长叹一声,WTF。

阅读全文…

链接大放送

2010年8月29日 没有评论

james hance

首先还是一些新闻, 据说要在年底登录iphone(什么时候才能开放API呢?),kooaba 获得了300万美元的风险投资,如果你没有听说过这个公司的话,说明你还没有仔细浏览过cvchina!最后一则新闻是metiao准备举办一个AR的会议Inside AR。可惜无缘参与。叹。

When you think that augmented reality will change the way we look at the world, insideAR 2010 will change the way you look at the technology.

然后,推荐一篇文章,关于google的predict API和google 为什么是skynet。。。

看到一个相当令人无语的python小工具——Fabulous,用控制台打印图像。额。。。

最后是上面西北偏北+星球大战杂交海报的来源,为什么要贴这个图?总比贴个大铁链子好吧。。。

LookTel

2010年7月25日 没有评论

Image of LookTel recognizing money

介绍一个移动视觉搜索的应用,LookTel。该应用利用移动设备拍摄目标物体(比如说钱币,商品等),上传至云端识别,然后返回识别结果,并以语音的方式读出,目标受众是视觉有障碍的人士。市场定位很清楚的一个应用,虽然受众很小,对于视觉有障碍的人来说非常有用。如今的新鲜科技令人眼花缭乱,像这样,能真正改善人们生活的,少之又少。

LookTel不同与之前介绍的SnapTell,goggles等的一个地方是允许用户自己添加场景,制作一个个性化的数据库。这对视觉障碍人士来说很有吧。

除了自动识别以外,LookTel还允许一个辅助者远程描述当下的视频或图片里的场景。当然这跟计算机视觉就没关系啦。

得知这个应用是通过一个新闻,LookTel刚获得了今年的2010 CTIA E-Tech AWARDS。

官网

移动视觉搜索

2010年7月8日 8 条评论

个人定义的移动视觉搜索是指:以移动终端捕获的图像作为检索项,通过互联网检索感兴趣信息的一种信息检索方式

目前,我看到了5个提供移动视觉搜索服务的公司:分别是google goggles, amazon snaptell, nokia point&find, kooabaoMoby。如下图。(图片来自cvpr2010,点击查看论文)

阅读全文…

公司介绍9:plink

2010年4月30日 3 条评论

 

PlinkArt Blog Rotating Header Image

PLink是英国的一个图像检索公司,专注于艺术品的检索,非常有特点的一个小公司。

PLink开发了一个名为PlinkArt的android应用程序,见下图,是Android Development Challenge(ADC)的冠军,由此赢得了google的关注。不久前,PLink的founder宣布他们被google收购了。PLinkArt也不再更新了,PLink的两个founder:Mark Cummins和James Philbin可能要专注于为google goggles增加新的特性了。

demonstartion 1

两位创始人的主页:

Mark Cummins的主页:  http://www.robots.ox.ac.uk/~mjc/

James Philbin的主页: http://www.robots.ox.ac.uk/~james/

两人都是牛津刚毕业的博士,我只能说太牛逼了。

官方网站官方博客媒体报道

公司介绍8:kooaba

2010年4月22日 4 条评论
home_iphone_2screen_400pxkooaba

又一个图像检索的公司,founder里有Herbert Bay,就是大名鼎鼎的Surf的发明人。kooabaSwiss Federal Institute of Technology (ETH)有着千丝万缕的联系,三个founder都是来自ETHComputer Vision Lab

kooaba比较有特点的是提供图像识别引擎Smart Visual,整个引擎架构在Amazon的云计算框架上面,支持用户自建图像库,感觉很不错,就是贵的离谱,起点是1900瑞士克朗每个月,换算美元大概1700美元!这还没有算上查询/识别的费用。。。

目前kooaba有iphone和android上面的应用程序,有兴趣有设备的同学可以试用一下,跟google goggles对比一下。

这里还有另外一个基于Smart Visual的iphone应用,paperboy,大概就是检索图书,报纸,杂志之类的吧。

最后,感叹一下,目前知道的图像检索的公司都是国外的,像是snaptell,goggles之类的,希望能看到国内的图像检索公司,不说别的,可以就从图书检索做起嘛。

公司主页官方介绍官方博客

公司介绍7: IQ Engines

2010年4月18日 没有评论

来自UC Berkeley和UC Davis的科学家创办的图像识别,标注的公司。提供一个称为IQ Engines的图像标注引擎,可以对图像进行自动标注,Demo很不错啊。看这里

最近IQ Engines放出了一个iphone应用oMoby,可以向google goggles叫板。先不谈里面算法的区别(好像我也谈不出来啊。哈哈),有一个显著的区别是如果图像识别失败的话,可以转向使用crowdsourcing来进行识别。所谓的crowdsourcing,中文翻译是“”,个人理解就是人肉搜索吧。这里有个crowdsourcing的wiki。

关于IQ Engines:

was founded as a collaboration of computer neuroscientists at UC Berkeley and UC Davis. We are inspired by the brain’s vision system – how the brain represents images and how the brain recognizes objects. Our team has mathematical expertise in visual coding and object recognition. It is our goal to bring advances in biological vision models to practical image and video search, using algorithms that are hierarchical and massively parallel (fast and accurate). We deliver these advances in image and video search on a web server platform that can be used by our customers to solve image and video search applications.

公司主页

where 2.0

2010年4月4日 2 条评论

刚搞明白web2.0,where2.0就来了。

个人一点粗浅的理解就是,where2.0指的的是将互联网,社会化网络,和地理信息(Location awareness怎么翻译?)有机结合起来的应用。

比如说FourSquare,比如说bing的下一代地图,比如说geo-based

The 2010 O’Reilly Where 2.0 Conference是刚刚结束的一个会议,有很多最新鲜的动态。

据以前的消息,google会在这个会议上披露一些goggles的技术细节,不过我没有找到啊。哪位大侠帮忙找找?

而且据说goggles下一步会加入更多的物体类别,甚至会公开API!!!!

这里看演讲PPT和视频。

绝对期待,google goggles揭秘

2010年3月1日 5 条评论

Goggles results for a landmark scan.

google要在3月31号的O’Reilly Where 2.0 Conference上做一个goggles内部实现的的演讲,绝对期待啊。

Lior Ron, Senior Product Manager, will be presenting a talk entitled “Looking into Google Goggles” at the O’Reilly Where 2.0 Conference on March 31, 2010 in San Jose, CA. Google is a visual search application for mobile phones. According to the conference program, “this talk will dive into how they [Google] made it happen and what the computer is actually seeing“.

来源

分类: 新闻 标签: ,

来自日本的场景识别引擎一个-SREngine

2010年2月4日 没有评论

SREngine

这是日本的一个场景识别引擎。我感觉这名字起得大了点,其实就是图像检索吧。项目主页上的一个应用场景是在影院售票处用手机拍摄电影海报,然后直接观看预告片,从而决定看那一部片子。这让我想起了nokia的point&find , Google的goggles,还有snaptell。

主页。不懂日文的请google翻译吧。

牢骚一句,搞计算机视觉的中国人这么多,为什么没有有人做出点像样的应用呢?是我孤陋寡闻还是大伙都在灌水。。。