存档

2010年7月 的存档

追思校长

2010年7月31日 5 条评论

上午在外面,同学突然打电话,就低沉的说“老钱死了,快回来吧”,我说“你不要开玩笑了”,同学声音很低沉说“没开玩笑”,我发现到有些不对,脑子突然懵了一下,立刻向其他同学求证,证实了这个很悲伤的消息。
急匆匆的赶回学校,急匆匆的在网上搜寻更多的信息,急匆匆的到乐乎楼,急匆匆的从延长到宝山参加悼念活动。钱老的过世是意料之中的,但真的当这一刻到来的时候却觉得如此的突然。
由于钱校长的病情,未曾有幸见过钱校长,钱伟长对于我更多的是一种象征,了解钱校长是从考研开始,和上海大学的信息分不开的就是校长钱伟长,从三钱之一开始认识钱老,从他的学习历程开始佩服钱老,当我从经济的本科考研转到我现在的领域,努力学习中也许的也有老钱榜样的作用,而我选择上海大学的一个重要原因就是因为钱老。
钱校长在我心目中是一个人物,他是一个有血有肉的人,他有爱,有坚持和执着,有那一份二十多年苦难都压不垮的精神。我们叫他老钱,也无非是想缩短自己和这样伟大的人的距离,他,是我们的校长。
钱老是个追逐梦想的人,为了实现“他的大学”,他从北京来到上海,一点一滴的培养了上海大学,也从一个角度改变了中国的高等教育,他的选课制,他的学分制和他的三学期制,他让那个急功近利的中国大学开始重视基础研究,他告诉人们有些人是压不垮打不倒的。

老大哥的凝视

他之于上海大学,是创造者,上海大学之于他,是理想。几年前,一个领导来看望钱校长,他说在上海的这二十年是我有生以来度过的最愉快的时光。问钱校长在上海最满意的是什么?他毫不犹豫地回答说“用我的思想办了一所大学。” 阅读全文…

分类: 新闻 标签: ,

来自Hitachi的手势UI

2010年7月30日 9 条评论

以前cvchina介绍过pointgrab,一个做手势UI的公司,前几天也介绍一个来自Fraunhofer的手势UI,今天又看到一个手势UI的演示,来自Hitachi,这绝对是我看过的(起码是看起来)最流畅,最舒服的手势UI了。非常有速度感。

速度到这里观看视频演示。

分类: 新闻 标签: , ,

转:基于Aforge的手势字符识别

2010年7月29日 4 条评论

还是来自hellogv,呵呵。

Afroge我是第一次看到,孤陋寡闻了。下面是一点介绍。

.NET is an open source C# framework designed for developers and researchers in the fields of Computer Vision and Artificial Intelligence – image processing, neural networks, genetic algorithms, fuzzy logic, machine learning, robotics, etc.

The framework is comprised by the set of libraries and sample applications, which demonstrate their features:

  • AForge.Imaging – library with image processing routines and filters;
  • AForge.Vision – computer vision library;
  • AForge.Video – set of libraries for video processing;
  • AForge.Neuro – neural networks computation library;
  • AForge.Genetic – evolution programming library;
  • AForge.Fuzzy – fuzzy computations library;
  • AForge.Robotics – library providing support of some robotics kits;
  • AForge.MachineLearning – machine learning library;
  • etc.
  • 我实现手势识别的原理很简单:捕捉运动物体+手写识别,把运动的物体的轨迹记录下来,然后通过手写识别引擎去搜索数据中最匹配的数据,从而知道“写”的是什么。目前常见的开源手写识别引擎有zinnia,wagomu 这些,不过小弟我比较业余,只把网上的比较常见的手写识别代码改进一下,只能识别字母和数字,真想通过摄像头隔空“手写”的朋友就要多花时间玩玩上面提到的几个开源手写类库了。

    本文介绍的手写识别:先在一个固定大小的画板上,用鼠标画下某图形,输入该图形对应的字母,程序把画板上的字母特征点都保存下来特征数据库(相当于学习记忆),然后再在画板上画出类似该字母的图形,程序就通过新画的特征点搜索特征数据库从而找出最类似的字母。

    阅读全文…

    分类: 新闻 标签: , , , ,

    OpenCV WinCE/WM移植

    2010年7月29日 2 条评论

    首先声明,本文来自hellogv,很好很强大,可以围观,可以搭讪。

    上次写了在C#玩OpenSURF的演示,这次就写写如何把opencv1.10移植到wince/。因为如果懂得裁剪opencv,那么就可以在更多设备(PC,手机,开发板)上玩更多更好玩的算法,因此,移植和裁剪opencv还是很有必要的。我已经移植到wince/WM上的opencv1.10工程可以到这里:http://www.pudn.com/downloads270/sourcecode/embed/detail1235697.html,工程只含cv和cvcore这两个核心项目,highgui与系统粘合度太大,不好移植,迟点会贴出实现部分highgui功能的例子。

    本文参考:http://www.computer-vision-software.com/blog/2009/03/running-opencv-facedetect-sample-on-pocket-pc/

    接下来,废话不说,直接把移植cv和cvcore的步骤贴上:

    阅读全文…

    分类: 新闻 标签: , , ,

    FrankenCamera(怪物相机?)

    2010年7月27日 3 条评论

    FrankenCamera是standford鼓捣出来的出来的怪物级的相机,尺寸惊人,比加了手柄的无敌兔还要大,没点肱二,三头肌估计玩不动。目标是提供一个computational photography的开放式平台(提供曝光,聚焦,快门等等控制,而不用受限于消费相机的预装软件)。(也算是open source hardware么?)

    siggraph2010上有一个介绍这个巨无霸的论文

    最近该实验室放出了一个开源软件Fcam,适用与两个平台,一就是上面的FrankenCamera,另一个就是nokia第一款基于maemo的的手机N900。(为何不跟个风,搞个NexusOne版本的?)

    如果我没眼花的话,下面这句话的意思是一年内可以买到FrankenCamera?

    Levoy said he expects those cameras will be available within a year.

    来源

    cvpr2010论文(全)

    2010年7月26日 2 条评论

    cvpr 2010

    低调的更新。cvpr2010全部论文和部分demo。猛击这里查看。同时静候ECCV2010。

    分类: 新闻 标签:

    LookTel

    2010年7月25日 没有评论

    Image of LookTel recognizing money

    介绍一个移动视觉搜索的应用,LookTel。该应用利用移动设备拍摄目标物体(比如说钱币,商品等),上传至云端识别,然后返回识别结果,并以语音的方式读出,目标受众是视觉有障碍的人士。市场定位很清楚的一个应用,虽然受众很小,对于视觉有障碍的人来说非常有用。如今的新鲜科技令人眼花缭乱,像这样,能真正改善人们生活的,少之又少。

    LookTel不同与之前介绍的SnapTell,goggles等的一个地方是允许用户自己添加场景,制作一个个性化的数据库。这对视觉障碍人士来说很有吧。

    除了自动识别以外,LookTel还允许一个辅助者远程描述当下的视频或图片里的场景。当然这跟计算机视觉就没关系啦。

    得知这个应用是通过一个新闻,LookTel刚获得了今年的2010 CTIA E-Tech AWARDS。

    官网

    链接大放送

    2010年7月24日 3 条评论

    这次有两个脑机接口的新闻,一个是TED上的演讲,(貌似评论中评价不高,说白了就是对比标定和实验两个阶段的脑电波?)另一个只能算是旧闻了,来自dartmouth的意念拨号器?哈哈。

    本周是视频是来自cvpr2010,一个是获得最佳论文提名的feifei li的演讲,另一个是最佳学生论文的演讲

    接着推荐一下python shell,Bpython,特色是在控制台下面完成自动补全。很不错。

    另外,我以前说过vlfeat有一个python的移植版本么?链接在这里。

    最后还是全景图,依然来自360cities,每张都是高质量。最爱下面这一个。这样长曝光的全景图,倒是第一次看到。

    幸福终点站

    2010年7月22日 3 条评论

    如果你是从3月份就关注cvchina的话,应该会看过这条新闻:vislab无人车的丝绸之路。现在,这个小面包车,长途奔袭8000英里,终于到达上海了。出发了。预计10月份到达上海。PS:一个问题是,汽车叫做auto,那么无人汽车是叫autoauto么?额。。。

    来源

    分类: 新闻 标签: ,

    Yet Another Geture UI.

    2010年7月22日 6 条评论

    如此多的手势UI,德国Fraunhofer的手势UI也来插一脚(插一手?),特色是可以在3D空间操作的哈。

    个人觉得一个好的手势UI最重要的地方就是能不能提供一个简洁的抓取动作(相当于鼠标的左键点击)。在下面的视频里,Fraunhofer的抓取动作就是直接取自自然而然的手掌抓取,前提当然是建立在五个手指准确的的姿态估计之上。

    另:在来源处提到,手势的3D信息来源于3D摄像头。

    Im FIT-Prototyp werden in Echtzeit Hände und Finger der Benutzter in den Bilddaten einer 3D-Kamera erkannt und die Bewegungen mitverfolgt.