<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>增强视觉 &#124; 计算机视觉 增强现实</title>
	<atom:link href="http://www.cvchina.info/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.cvchina.info</link>
	<description>计算机视觉，增强现实最新资讯</description>
	<lastBuildDate>Tue, 31 Jan 2012 14:55:50 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>YiMa 在SPARS11上的演讲</title>
		<link>http://www.cvchina.info/2012/01/31/yima-%e5%9c%a8spars11%e4%b8%8a%e7%9a%84%e6%bc%94%e8%ae%b2/</link>
		<comments>http://www.cvchina.info/2012/01/31/yima-%e5%9c%a8spars11%e4%b8%8a%e7%9a%84%e6%bc%94%e8%ae%b2/#comments</comments>
		<pubDate>Tue, 31 Jan 2012 14:55:50 +0000</pubDate>
		<dc:creator>忙菇</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[Sparse representation]]></category>
		<category><![CDATA[yima]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/?p=3246</guid>
		<description><![CDATA[在互联网上游荡的时候发现了马老师的SPARS11的演讲内容。 分享给大家 Tags: Sparse representation, yima, 新闻]]></description>
			<content:encoded><![CDATA[<p>在互联网上游荡的时候发现了马老师的SPARS11的演讲内容。</p>
<p><embed src='http://player.youku.com/player.php/sid/XMzQ3NTk5MDY0/v.swf' quality='high' width='480' height='400' align='middle' allowScriptAccess='sameDomain' type='application/x-shockwave-flash'></embed></p>
<p>分享给大家</p>

	Tags: <a href="http://www.cvchina.info/tag/sparse-representation/" title="Sparse representation" rel="tag">Sparse representation</a>, <a href="http://www.cvchina.info/tag/yima/" title="yima" rel="tag">yima</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/31/yima-%e5%9c%a8spars11%e4%b8%8a%e7%9a%84%e6%bc%94%e8%ae%b2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>陶哲轩获得克拉福德奖</title>
		<link>http://www.cvchina.info/2012/01/21/terencetaoprize/</link>
		<comments>http://www.cvchina.info/2012/01/21/terencetaoprize/#comments</comments>
		<pubDate>Sat, 21 Jan 2012 13:27:21 +0000</pubDate>
		<dc:creator>忙菇</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[compressed sensing]]></category>
		<category><![CDATA[terence tao]]></category>
		<category><![CDATA[陶哲轩]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/?p=3237</guid>
		<description><![CDATA[压缩感知届怪兽级人物陶哲轩（因为就看过压缩感知的工作 ）获得了克拉福德奖。此同为瑞典皇家科学院颁奖的，为诺贝尔不喜欢的数学、地球科学、生物科学和天文学颁发的，因为比较穷的关系，每年只发一个领域的（今年发了俩个领域）。陶哲轩和同获得过菲尔茨奖的普林斯顿高等研究院的比利时数学家Jean Bourgain分享了这个奖。奖金，在2011年是600,000美刀，陶哲轩获得的是2012年的奖，Marr Prize貌似没奖金。 &#160; The Royal Swedish Academy of Sciences has decided to award the Crafoord Prize in Mathematics 2012 to Jean Bourgain, Institute for Advanced Study, Princeton, USA and Terence Tao, University of California, Los Angeles, USA, “for their brilliant and groundbreaking work in harmonic analysis, partial differential equations, ergodic theory, number theory, combinatorics, functional analysis and [...]]]></description>
			<content:encoded><![CDATA[<p><img class="aligncenter size-full wp-image-3238" title="" src="http://www.cvchina.info/wp-content/uploads/2012/01/image001.jpg" alt="" width="192" height="192" /></p>
<p>压缩感知届怪兽级人物陶哲轩（因为就看过压缩感知的工作 <img src='http://www.cvchina.info/wp-includes/images/smilies/icon_eek.gif' alt='8-O' class='wp-smiley' /> ）获得了克拉福德奖。此同为瑞典皇家科学院颁奖的，为诺贝尔不喜欢的数学、地球科学、生物科学和天文学颁发的，因为比较穷的关系，每年只发一个领域的（今年发了俩个领域）。陶哲轩和同获得过菲尔茨奖的普林斯顿高等研究院的比利时数学家Jean Bourgain分享了这个奖。奖金，在2011年是600,000美刀，陶哲轩获得的是2012年的奖，Marr Prize貌似没奖金。</p>
<p>&nbsp;</p>
<p>The Royal Swedish Academy of Sciences has decided to award the Crafoord Prize in Mathematics 2012 to <strong>Jean Bourgain,</strong> Institute for Advanced Study, Princeton, USA and <strong><a href="http://www.cvchina.info/tag/terence-tao/" class="st_tag internal_tag" rel="tag" title="标签 terence tao 下的日志">Terence Tao</a>,</strong> University of California, Los Angeles, USA,</p>
<p><em>“for their brilliant and groundbreaking work in harmonic analysis, partial differential equations, ergodic theory, number theory, combinatorics, functional analysis and theoretical computer science&#8221;.</em></p>

	Tags: <a href="http://www.cvchina.info/tag/compressed-sensing/" title="compressed sensing" rel="tag">compressed sensing</a>, <a href="http://www.cvchina.info/tag/terence-tao/" title="terence tao" rel="tag">terence tao</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a>, <a href="http://www.cvchina.info/tag/%e9%99%b6%e5%93%b2%e8%bd%a9/" title="陶哲轩" rel="tag">陶哲轩</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/21/terencetaoprize/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>GroupShot</title>
		<link>http://www.cvchina.info/2012/01/17/groupshot/</link>
		<comments>http://www.cvchina.info/2012/01/17/groupshot/#comments</comments>
		<pubDate>Tue, 17 Jan 2012 14:24:35 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[groupshot]]></category>
		<category><![CDATA[ios]]></category>
		<category><![CDATA[photo fuse]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2012/01/17/groupshot/</guid>
		<description><![CDATA[今天看到一个很好玩的iOS应用GroupShot。点子是很早微软推出的Photo Fuse，将连拍的数张照片合成一张完美合照。 有设备的可以把玩一下。 Via Tags: groupshot, ios, photo fuse, 新闻]]></description>
			<content:encoded><![CDATA[<p><embed src="http://player.youku.com/player.php/sid/XMzQzNzAxMDMy/v.swf" allowFullScreen="true" quality="high" width="480" height="400" align="middle" allowScriptAccess="always" type="application/x-shockwave-flash"></embed>
<p>今天看到一个很好玩的iOS应用<a href="http://www.groupshot.com/" target="_blank">GroupShot</a>。点子是很早微软推出的<a href="http://techcrunch.com/2010/06/02/microsoft-rolls-out-impressive-enhancements-to-windows-live-essentials-suite/" target="_blank">Photo Fuse</a>，将连拍的数张照片合成一张完美合照。</p>
<p>有设备的可以把玩一下。</p>
<p><a href="http://techcrunch.com/2012/01/16/groupshot-launches-impressive-face-swapping-photo-editing-app-for-iphone/" target="_blank">Via</a></p>

	Tags: <a href="http://www.cvchina.info/tag/groupshot/" title="groupshot" rel="tag">groupshot</a>, <a href="http://www.cvchina.info/tag/ios/" title="ios" rel="tag">ios</a>, <a href="http://www.cvchina.info/tag/photo-fuse/" title="photo fuse" rel="tag">photo fuse</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/17/groupshot/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Kmeans based indexing and Asymmetric Distance Computation  for ANN search (Binary Local Feature): part1</title>
		<link>http://www.cvchina.info/2012/01/13/kmeans-based-indexing-and-asymmetric-distance-computation-for-ann-search-binary-local-feature-part1/</link>
		<comments>http://www.cvchina.info/2012/01/13/kmeans-based-indexing-and-asymmetric-distance-computation-for-ann-search-binary-local-feature-part1/#comments</comments>
		<pubDate>Fri, 13 Jan 2012 09:51:08 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[ann]]></category>
		<category><![CDATA[kmeans]]></category>
		<category><![CDATA[orb]]></category>
		<category><![CDATA[二进制特征]]></category>
		<category><![CDATA[最近邻检索]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2012/01/13/kmeans-based-indexing-and-asymmetric-distance-computation-for-ann-search-binary-local-feature-part1/</guid>
		<description><![CDATA[受Herve Jegou的Hamming Embedding and Weak Geometric consistency for large-scale image search以及Product quantization for nearest neighbor search的启发，将Kmeans clustering、inverted files、Asymmetric Distance Computation应用到二进制形式的局部特征的最近邻检索。 主要思路： 用Kmeans做特征的粗索引。 根据统计数据对feature进行压缩。 检索时使用非对称的方式计算索引特征与查询特征之间的距离。 算法： 训练： 使用Kmeans对欲索引的特征进行聚类，得到K个中心。对二进制形式的feature做聚类时，类别中心更新方式为：对于每一个bit，统计所有落在该类别的特征的对应bit上的1,0频率，并取高者。 对于每个cluster，统计所有落在该类别的特征的每个bit位的1,0频率，取1或者0频率靠近50%的前M个bits。（越靠近50%，熵越大） 经过训练，我们得到两组数据： K个特征类别中心。 对于每个类别中心，都有一组“M个bit位置标示符”。这些标示符构成一个对原始feature进行压缩的依据。（本文以后将其称为投影向量） 索引： 建立倒排表 对于每一个欲索引的特征，计算其类别中心，并用该类别的投影向量对特征进行投影，得到一个M位的signature。记为sig_templ, 将该signature插入到倒排表中。 ANN检索： 计算query特征的类别中心query_cluster，并用该类别的投影向量对特征进行投影，得到一个M位的sig_query。 计算query特征与类别中心的，除去该类别投影向量对应的bit位的距离，记为dist_base. 遍历query_cluster对应的倒排表项，计算sig_query于表项中的sig_templ的距离，记为dist_sig。那么query特征与索引特征的距离dist = dist_base + dist_sig. 如此得到的最小距离，如小于某阈值，即可认为找到一个ANN。 关于时间复杂度的一点分析： 假设K = 40， M = 64，特征为32Byte ORB（假设有1k的供索引的特征）： 那么每次ANN检索只用做 40次32Byte的Hamming Distance计算 [...]]]></description>
			<content:encoded><![CDATA[<p>受Herve Jegou的<strong><a href="http://lear.inrialpes.fr/pubs/2008/JDS08/jegou_hewgc08.pdf" target="_blank">Hamming Embedding and Weak Geometric consistency for large-scale image search</a></strong>以及<a href="http://lear.inrialpes.fr/pubs/2011/JDS11/jegou_searching_with_quantization.pdf" target="_blank"><strong>Product quantization for nearest neighbor search</strong></a><strong>的</strong>启发，将Kmeans clustering、inverted files、Asymmetric Distance Computation应用到二进制形式的局部特征的最近邻检索。</p>
<p>主要思路：</p>
<p>用Kmeans做特征的粗索引。</p>
<p>根据统计数据对feature进行压缩。</p>
<p>检索时使用非对称的方式计算索引特征与查询特征之间的距离。</p>
<h2>算法：</h2>
<p><strong>训练：</strong></p>
<ol>
<li>使用Kmeans对欲索引的特征进行聚类，得到K个中心。对二进制形式的feature做聚类时，类别中心更新方式为：对于每一个bit，统计所有落在该类别的特征的对应bit上的1,0频率，并取高者。</li>
<li>对于每个cluster，统计所有落在该类别的特征的每个bit位的1,0频率，取1或者0频率靠近50%的前M个bits。（越靠近50%，熵越大）</li>
</ol>
<p>经过训练，我们得到两组数据：</p>
<ul>
<li>K个特征类别中心。</li>
<li>对于每个类别中心，都有一组“M个bit位置标示符”。这些标示符构成一个对原始feature进行压缩的依据。（本文以后将其称为投影向量）</li>
</ul>
<p><span id="more-3232"></span></p>
<p><strong>索引：</strong></p>
<ol>
<li>建立倒排表</li>
<li>对于每一个欲索引的特征，计算其类别中心，并用该类别的投影向量对特征进行投影，得到一个M位的signature。记为sig_templ, 将该signature插入到倒排表中。</li>
</ol>
<p><strong>ANN检索：</strong></p>
<ol>
<li>计算query特征的类别中心query_cluster，并用该类别的投影向量对特征进行投影，得到一个M位的sig_query。</li>
<li>计算query特征与类别中心的，除去该类别投影向量对应的bit位的距离，记为dist_base.</li>
<li>遍历query_cluster对应的倒排表项，计算sig_query于表项中的sig_templ的距离，记为dist_sig。那么query特征与索引特征的距离dist = dist_base + dist_sig. 如此得到的最小距离，如小于某阈值，即可认为找到一个ANN。</li>
</ol>
<p>关于时间复杂度的一点分析：</p>
<p>假设K = 40， M = 64，特征为32Byte <a href="http://www.cvchina.info/tag/orb/" class="st_tag internal_tag" rel="tag" title="标签 orb 下的日志">ORB</a>（假设有1k的供索引的特征）：</p>
<p>那么每次ANN检索只用做</p>
<p>40次32Byte的Hamming Distance计算 +  约25次8Byte的Hamming Distance计算。</p>
<p>对比穷举检索：</p>
<p>1000次32Byte的Hamming Distance计算</p>
<p>速度提升：20x</p>
<p>&nbsp;</p>
<ol>示例：</ol>
<ol>实验配置：</ol>
<ul>
<li>特征：Orb</li>
<li>nn/ann匹配阈值：50</li>
<li>K = 40</li>
</ul>
<ol>下图为穷举检索，图像匹配的结果：（无ransac）</ol>
<p><a href="http://www.cvchina.info/wp-content/uploads/2012/01/image.png"><img style="display: block; float: none; margin-left: auto; margin-right: auto; border: 0px;" title="image" src="http://www.cvchina.info/wp-content/uploads/2012/01/image_thumb.png" alt="image" width="440" height="202" border="0" /></a></p>
<p>After Ransac：</p>
<p><a href="http://www.cvchina.info/wp-content/uploads/2012/01/image1.png"><img style="display: block; float: none; margin-left: auto; margin-right: auto; border: 0px;" title="image" src="http://www.cvchina.info/wp-content/uploads/2012/01/image_thumb1.png" alt="image" width="445" height="204" border="0" /></a></p>
<p>下图为使用上述ANN检索方式，图像匹配的结果：（无ransac）</p>
<p><a href="http://www.cvchina.info/wp-content/uploads/2012/01/image2.png"><img style="display: block; float: none; margin-left: auto; margin-right: auto; border: 0px;" title="image" src="http://www.cvchina.info/wp-content/uploads/2012/01/image_thumb2.png" alt="image" width="447" height="205" border="0" /></a></p>
<p>After Ransac：</p>
<p><a href="http://www.cvchina.info/wp-content/uploads/2012/01/image3.png"><img style="display: block; float: none; margin-left: auto; margin-right: auto; border: 0px;" title="image" src="http://www.cvchina.info/wp-content/uploads/2012/01/image_thumb3.png" alt="image" width="447" height="205" border="0" /></a></p>
<p>可以看出，匹配点数会有明显下降。原因是两级索引方式固有的缺陷。（两个本身很近的feature，会被分类到不同的cluster）。也许使用Multi Assignment会有所改善。</p>
<p>等代码整理好再发part2.</p>

	Tags: <a href="http://www.cvchina.info/tag/ann/" title="ann" rel="tag">ann</a>, <a href="http://www.cvchina.info/tag/kmeans/" title="kmeans" rel="tag">kmeans</a>, <a href="http://www.cvchina.info/tag/orb/" title="orb" rel="tag">orb</a>, <a href="http://www.cvchina.info/tag/%e4%ba%8c%e8%bf%9b%e5%88%b6%e7%89%b9%e5%be%81/" title="二进制特征" rel="tag">二进制特征</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a>, <a href="http://www.cvchina.info/tag/%e6%9c%80%e8%bf%91%e9%82%bb%e6%a3%80%e7%b4%a2/" title="最近邻检索" rel="tag">最近邻检索</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/13/kmeans-based-indexing-and-asymmetric-distance-computation-for-ann-search-binary-local-feature-part1/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>CV Dazzle</title>
		<link>http://www.cvchina.info/2012/01/08/cv-dazzle/</link>
		<comments>http://www.cvchina.info/2012/01/08/cv-dazzle/#comments</comments>
		<pubDate>Sun, 08 Jan 2012 13:53:50 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[adam harvey]]></category>
		<category><![CDATA[cv dazzle]]></category>
		<category><![CDATA[反人脸检测]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2012/01/08/cv-dazzle/</guid>
		<description><![CDATA[之前介绍过一个反人脸检测的东西，作者Adam Harvey又将其发扬光大了，整出一个CV Dazzle。最早的版本没有考虑到审美上的因素，纯粹只是为了干掉人脸检测器（OpenCV based），这次Adam Harvey试图弄得。。好看点？ 对比一下以前的图像： Adam Harvey还得意洋洋的调戏了一把face.com的phototagger： CV Dazzle vs PhotoTagger from Adam Harvey on Vimeo. 官方网站 媒体报道 Tags: adam harvey, cv dazzle, 反人脸检测, 新闻]]></description>
			<content:encoded><![CDATA[<p><img src="http://www.cvdazzle.com/assets/images/comparison_sm.jpg" alt="CV Dazzle" /></p>
<p>之前介绍过一个<a href="http://www.cvchina.info/2010/04/13/anti-face-detection/" target="_blank">反人脸检测</a>的东西，作者<a href="http://ahprojects.com/" target="_blank">Adam Harvey</a>又将其发扬光大了，整出一个CV Dazzle。最早的版本没有考虑到审美上的因素，纯粹只是为了干掉人脸检测器（OpenCV based），这次Adam Harvey试图弄得。。好看点？</p>
<p><span id="more-3222"></span></p>
<p>对比一下以前的图像：</p>
<p><img src="http://www.popsci.com/files/imagecache/article_image_large/articles/faces_0.jpg" alt="" /></p>
<p>Adam Harvey还得意洋洋的调戏了一把face.com的phototagger：</p>
<p><iframe src="http://player.vimeo.com/video/12308527?title=0&amp;byline=0&amp;portrait=0" frameborder="0" width="400" height="300"></iframe></p>
<p><a href="http://vimeo.com/12308527">CV Dazzle vs PhotoTagger</a> from <a href="http://vimeo.com/adamharv">Adam Harvey</a> on <a href="http://vimeo.com">Vimeo</a>.</p>
<p><a href="http://www.cvdazzle.com/" target="_blank">官方网站</a></p>
<p><a href="http://www.telepresenceoptions.com/2012/01/camouflage_from_computer_visio/" target="_blank">媒体报道</a></p>

	Tags: <a href="http://www.cvchina.info/tag/adam-harvey/" title="adam harvey" rel="tag">adam harvey</a>, <a href="http://www.cvchina.info/tag/cv-dazzle/" title="cv dazzle" rel="tag">cv dazzle</a>, <a href="http://www.cvchina.info/tag/%e5%8f%8d%e4%ba%ba%e8%84%b8%e6%a3%80%e6%b5%8b/" title="反人脸检测" rel="tag">反人脸检测</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/08/cv-dazzle/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>几个AR翻译APP</title>
		<link>http://www.cvchina.info/2012/01/08/%e5%87%a0%e4%b8%aaar%e7%bf%bb%e8%af%91app/</link>
		<comments>http://www.cvchina.info/2012/01/08/%e5%87%a0%e4%b8%aaar%e7%bf%bb%e8%af%91app/#comments</comments>
		<pubDate>Sun, 08 Jan 2012 13:33:08 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[AR]]></category>
		<category><![CDATA[babelcam]]></category>
		<category><![CDATA[babelshot]]></category>
		<category><![CDATA[camdictionary]]></category>
		<category><![CDATA[qq慧眼]]></category>
		<category><![CDATA[word lens]]></category>
		<category><![CDATA[翻译]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2012/01/08/%e5%87%a0%e4%b8%aaar%e7%bf%bb%e8%af%91app/</guid>
		<description><![CDATA[Google Goggles [iPhone, Android. Free.] Google的可视化搜索，一级棒。甚至可以解数独。 CamDictionary [Android, free or $4.99.] 号称支持50种语言。基于视频。 Word Lens [iPhone, price varies.] 大概是最有名的AR翻译APP了吧。 Babelshot[iPhone, $4.99.] 拍照识别，需要选定ROI，交互比较复杂。 BabelCam [Windows Phone, free.] 情况不详。WP是亮点。 QQ慧眼[iPhone, free]腾讯的AR翻译APP。 &#160; 链接 Tags: AR, babelcam, babelshot, camdictionary, qq慧眼, word lens, 新闻, 翻译]]></description>
			<content:encoded><![CDATA[<p><strong><a href="http://www.google.com/mobile/goggles">Google Goggles</a></strong> [iPhone, Android. Free.] Google的可视化搜索，一级棒。甚至可以解数独。</p>
<p><embed src="http://player.youku.com/player.php/sid/XMzMwNDgxNjY0/v.swf" allowFullScreen="true" quality="high" width="480" height="400" align="middle" allowScriptAccess="always" type="application/x-shockwave-flash"></embed></p>
<p><span id="more-3221"></span>
<p><strong><a href="https://market.android.com/details?id=com.intsig.camdict&amp;hl=en">CamDictionary</a></strong> [Android, free or $4.99.] 号称支持50种语言。基于视频。</p>
<p><iframe height="315" src="http://www.youtube.com/embed/qLxCo6bciQw" frameborder="0" width="420" allowfullscreen="allowfullscreen"></iframe></p>
<p><strong><a href="http://itunes.apple.com/us/app/word-lens/id383463868?mt=8">Word Lens</a></strong> [iPhone, price varies.] 大概是最有名的AR翻译APP了吧。</p>
<p><embed src="http://player.youku.com/player.php/sid/XMjMwMzAzMzYw/v.swf" allowFullScreen="true" quality="high" width="480" height="400" align="middle" allowScriptAccess="always" type="application/x-shockwave-flash"></embed></p>
<p><strong><a href="http://itunes.apple.com/us/app/babelshot-photo-translator/id334194705?mt=8">Babelshot</a></strong>[iPhone, $4.99.] 拍照识别，需要选定ROI，交互比较复杂。</p>
<p><iframe height="315" src="http://www.youtube.com/embed/Gb6xncXg1PY" frameborder="0" width="420" allowfullscreen="allowfullscreen"></iframe></p>
<p><strong><a href="http://www.windowsphone.com/en-US/apps/576327f5-785c-4997-bc01-dc9fe4423f88">BabelCam</a></strong> [Windows Phone, free.] 情况不详。WP是亮点。</p>
<p><a href="http://labs.qq.com/product.php?id=5" target="_blank"><strong>QQ慧眼</strong></a>[iPhone, free]腾讯的AR翻译APP。</p>
<p><embed src="http://player.youku.com/player.php/sid/XMjkxMTE0MDY0/v.swf" allowFullScreen="true" quality="high" width="480" height="400" align="middle" allowScriptAccess="always" type="application/x-shockwave-flash"></embed></p>
<p>&#160;</p>
<p><a href="http://mashable.com/2012/01/06/apps-for-reporters-abroad/" target="_blank">链接</a></p>

	Tags: <a href="http://www.cvchina.info/tag/ar/" title="AR" rel="tag">AR</a>, <a href="http://www.cvchina.info/tag/babelcam/" title="babelcam" rel="tag">babelcam</a>, <a href="http://www.cvchina.info/tag/babelshot/" title="babelshot" rel="tag">babelshot</a>, <a href="http://www.cvchina.info/tag/camdictionary/" title="camdictionary" rel="tag">camdictionary</a>, <a href="http://www.cvchina.info/tag/qq%e6%85%a7%e7%9c%bc/" title="qq慧眼" rel="tag">qq慧眼</a>, <a href="http://www.cvchina.info/tag/word-lens/" title="word lens" rel="tag">word lens</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a>, <a href="http://www.cvchina.info/tag/%e7%bf%bb%e8%af%91/" title="翻译" rel="tag">翻译</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/08/%e5%87%a0%e4%b8%aaar%e7%bf%bb%e8%af%91app/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Happy New Year !</title>
		<link>http://www.cvchina.info/2012/01/01/happy-new-year-2/</link>
		<comments>http://www.cvchina.info/2012/01/01/happy-new-year-2/#comments</comments>
		<pubDate>Sat, 31 Dec 2011 17:12:35 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[2012]]></category>
		<category><![CDATA[新年快乐]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2012/01/01/happy-new-year-2/</guid>
		<description><![CDATA[Tags: 2012, 新年快乐, 新闻]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.cvchina.info/wp-content/uploads/2012/01/3d-happy-new-year-20121.png"><img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="3d happy new year 2012" border="0" alt="3d happy new year 2012" src="http://www.cvchina.info/wp-content/uploads/2012/01/3d-happy-new-year-2012_thumb1.png" width="600" height="424" /></a></p>

	Tags: <a href="http://www.cvchina.info/tag/2012/" title="2012" rel="tag">2012</a>, <a href="http://www.cvchina.info/tag/%e6%96%b0%e5%b9%b4%e5%bf%ab%e4%b9%90/" title="新年快乐" rel="tag">新年快乐</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2012/01/01/happy-new-year-2/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>[招聘] 华为 多媒体技术实验室杭州分部</title>
		<link>http://www.cvchina.info/2011/12/31/%e6%8b%9b%e8%81%98-%e5%8d%8e%e4%b8%ba-%e5%a4%9a%e5%aa%92%e4%bd%93%e6%8a%80%e6%9c%af%e5%ae%9e%e9%aa%8c%e5%ae%a4%e6%9d%ad%e5%b7%9e%e5%88%86%e9%83%a8/</link>
		<comments>http://www.cvchina.info/2011/12/31/%e6%8b%9b%e8%81%98-%e5%8d%8e%e4%b8%ba-%e5%a4%9a%e5%aa%92%e4%bd%93%e6%8a%80%e6%9c%af%e5%ae%9e%e9%aa%8c%e5%ae%a4%e6%9d%ad%e5%b7%9e%e5%88%86%e9%83%a8/#comments</comments>
		<pubDate>Sat, 31 Dec 2011 06:38:39 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[huawei]]></category>
		<category><![CDATA[华为]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2011/12/31/%e6%8b%9b%e8%81%98-%e5%8d%8e%e4%b8%ba-%e5%a4%9a%e5%aa%92%e4%bd%93%e6%8a%80%e6%9c%af%e5%ae%9e%e9%aa%8c%e5%ae%a4%e6%9d%ad%e5%b7%9e%e5%88%86%e9%83%a8/</guid>
		<description><![CDATA[Job Function: Researcher responsible for developing algorithms and prototype of research projects related to video and audio. The candidate will work with the multimedia technology lab in Hangzhou or Shenzhen. Skills/Experience Must hold a Bachelors and/or a Masters/or a PhD in Electrical Engineering/or Computer Engineering with at least 2+ years experience in design, development, and [...]]]></description>
			<content:encoded><![CDATA[<p>Job Function:</p>
<p>Researcher responsible for developing algorithms and prototype of research projects related to video and audio. The candidate will work with the multimedia technology lab in Hangzhou or Shenzhen. </p>
<p>Skills/Experience</p>
<p>Must hold a Bachelors and/or a Masters/or a PhD in Electrical Engineering/or Computer Engineering with at least 2+ years experience in design, development, and integration of multimedia algorithms. </p>
<p>Strong Knowledge in <strong>computational camera, computational photography, 3D display and video/audio signal processing</strong>. </p>
<p>Knowledge in video standards on H.264, MPEG4, VP6/VP8, or graphics domain, Open GL standards is a definite plus. </p>
<p>Knowledge in audio standards on AMR, AMR-WB, G.711, G.719 and OpenAL. </p>
<p>Knowledge in optical lens design is a plus. </p>
<p>Strong C, C++, and MatLab development skills is required.<b></b></p>
<p>Experience in initiating a research proposal and conduct the research activities, developing deliverable software with a GUI interface is desired. </p>
<p>Should have good analytical ability, problem solving skills and be a self-starter.</p>
<p>Work well within a matrix organization and able to influence and collaborate with team members all over the world. </p>
<p><span id="more-3211"></span>
<p>Responsibilities</p>
<p>Responsible for system design, algorithm development and verification of new multimedia technologies on mobile devices. Will work with <a href="http://www.cvchina.info/tag/huawei/" class="st_tag internal_tag" rel="tag" title="标签 huawei 下的日志">Huawei</a> Hi-silicon, User Centric Design and other cross functional teams for various milestones and deliverables. </p>
<p>Education Requirements:</p>
<p>BE with at least 4+ years experience, ME with at least 2+ years experience, PhD from a college of repute.</p>
<p>Contact person:</p>
<p>Dr. Zhou Jiong </p>
<p>Email: <a href="mailto:John.zhoujiong@huawei.com">John.zhoujiong@huawei.com</a></p>
<p><strong>额外声明： 需已经取得学位。</strong></p>

	Tags: <a href="http://www.cvchina.info/tag/huawei/" title="huawei" rel="tag">huawei</a>, <a href="http://www.cvchina.info/tag/%e5%8d%8e%e4%b8%ba/" title="华为" rel="tag">华为</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2011/12/31/%e6%8b%9b%e8%81%98-%e5%8d%8e%e4%b8%ba-%e5%a4%9a%e5%aa%92%e4%bd%93%e6%8a%80%e6%9c%af%e5%ae%9e%e9%aa%8c%e5%ae%a4%e6%9d%ad%e5%b7%9e%e5%88%86%e9%83%a8/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>vibe</title>
		<link>http://www.cvchina.info/2011/12/25/vibe/</link>
		<comments>http://www.cvchina.info/2011/12/25/vibe/#comments</comments>
		<pubDate>Sun, 25 Dec 2011 14:28:19 +0000</pubDate>
		<dc:creator>cvchina</dc:creator>
				<category><![CDATA[新闻]]></category>
		<category><![CDATA[background subtraction]]></category>
		<category><![CDATA[vibe]]></category>
		<category><![CDATA[背景减除]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/2011/12/25/vibe/</guid>
		<description><![CDATA[ViBe &#8211; a powerful technique for background detection and subtraction in video sequences Executive summary Description ViBe is a powerful pixel-based technique that detects the background in video sequences. Many experiments have shown that it performs better than the state-of-the-art techniques known in the scientific literature. In addition the computational load is lower than simple [...]]]></description>
			<content:encoded><![CDATA[<p><img style="display: block; float: none; margin-left: auto; margin-right: auto" src="http://www2.ulg.ac.be/telecom/research/vibe/videos/input-background.jpg" /></p>
<h3><a href="http://www.cvchina.info/tag/vibe/" class="st_tag internal_tag" rel="tag" title="标签 vibe 下的日志">ViBe</a> &#8211; a powerful technique for background detection and subtraction in video sequences</h3>
<h4>Executive summary</h4>
<h5>Description</h5>
<p>ViBe is a powerful pixel-based technique that detects the background in video sequences. Many experiments have shown that it performs <em>better than the state-of-the-art techniques</em> known in the scientific literature. In addition the <em>computational load is lower</em> than simple background techniques implemented in commercial products. ViBe is the perfect solution for both software and hardware implementations.</p>
<h5>Code and program for Windows and Linux</h5>
<ul>
<li><b>A program for Windows and Linux. </b>Download an archive <a href="http://www2.ulg.ac.be/telecom/research/vibe/download/ViBe.zip">zip archive [10 MB - updated on May 19, 2011]</a> to use ViBe on Windows (or under <a href="http://www.winehq.org/">Wine</a> in Linux). Details on <a href="http://www2.ulg.ac.be/telecom/research/vibe/download.html">this page.</a>      <br />The program allows you to: (1) save the result for your own images, (2) change the few parameters of ViBe to experiment with, and (3) reproduce our results. </li>
<li><b>Linux: link a C/C++ object file to your own code. </b>We provide the object (compiled) code of ViBe for non-commercial applications. Under Linux, download the 32 bits <a href="http://www2.ulg.ac.be/telecom/research/vibe/download/vibe-background-32bits.zip">zip</a> or <a href="http://www2.ulg.ac.be/telecom/research/vibe/download/vibe-background-32bits.tgz">compressed tar file</a>, or the 64 bits <a href="http://www2.ulg.ac.be/telecom/research/vibe/download/vibe-background-64bits.zip">zip</a> or <a href="http://www2.ulg.ac.be/telecom/research/vibe/download/vibe-background-64bits.tgz">compressed tar file</a>. Details on <a href="http://www2.ulg.ac.be/telecom/research/vibe/download.html">this page.</a></li>
</ul>
<p><span id="more-3208"></span>
<p>&#160;</p>
<h5>Licensing opportunities</h5>
<p>ViBe is protected by <a href="http://v3.espacenet.com/publicationDetails/biblio?DB=EPODOC&amp;adjacent=true&amp;locale=en_be&amp;FT=D&amp;date=20090115&amp;CC=WO&amp;NR=2009007198A1&amp;KC=A1"><b>several patents</b></a> (patent track: <a href="http://www.wipo.int/pctdb/en/wo.jsp?WO=2009007198">WO2009007198</a> / Publication date: 2009-01-15; Priority number(s): EP20070112011 20070708) / US (granted): <a href="http://orbi.ulg.ac.be/bitstream/2268/98750/1/Vandroogenbroeck2011Visual.pdf">US 8009918 B2 (pdf)</a> / Japan (granted): <a href="http://orbi.ulg.ac.be/handle/2268/98791">JP 2011 4699564 B2</a>    <br />The <a href="http://www.ulg.ac.be/">University of Liege</a> holds all the rights on the technology and the innovations have been validated during the patent track.    <br />For licensing the technology, please contact <a href="http://www.ulg.ac.be/telecom/people/MarcVanDroogenbroeck.html">Prof. Van Droogenbroeck</a>.</p>
<h5>Major advantages:</h5>
<ul>
<li>Very low computational load. Operations are limited to subtractions and operations on memory blocks. A downscaled version only needs one comparison per pixel and one byte of memory per pixel (see illustration below). </li>
<li>Parameter-free method. There is no need to adapt parameter values to the content. Absolutely all the experiments have been led with the same set of values. </li>
<li>Ready for direct inclusion in commercial products. Suited both for software and hardware inclusions. </li>
<li>Faster and improved performances in comparison with state-the-art techniques (Mixture of Gaussians, Parametric methods, Sacon, etc). </li>
<li>Pixel-based technique, ideal for any pre-processing step. ViBe allows you to model the objects in the videos as you like. </li>
<li>Instantaneous initialization of the background model. ViBe is ready to operate from the second frame of any video sequence. </li>
<li>Robust to noise.</li>
</ul>
<h5>References</h5>
<ul>
<li><a name="Barnich2010ViBe"></a><a href="http://www2.ulg.ac.be/telecom/publi/Author/BARNICH-O.html">O. Barnich</a> and <a href="http://www2.ulg.ac.be/telecom/publi/Author/VAN-DROOGENBROECK-M.html">M. Van Droogenbroeck</a>. <strong><a href="http://ieeexplore.ieee.org/search/freesrchabstract.jsp?tp=&amp;arnumber=5672785">ViBe: A universal background subtraction algorithm for video sequences</a></strong>. In <em>IEEE Transactions on Image Processing</em>, 20(6):1709-1724, June 2011. Also available on <a href="http://hdl.handle.net/2268/81248">the University site</a> in PDF format: <a href="http://orbi.ulg.ac.be/bitstream/2268/81248/1/Barnich2011ViBe.pdf"><img border="0" align="middle" src="http://www2.ulg.ac.be/telecom/research/vibe/pdf.gif" /></a>, and <a href="http://www2.ulg.ac.be/telecom/publi/publications/barnich/Barnich2011ViBe/index.html">HTML format</a>. This paper contains a very <b><em>detailed pseudo-code description of the complete algorithm</em></b>. </li>
<li><a name="Barnich2009ViBe"></a><a href="http://www2.ulg.ac.be/telecom/publi/Author/BARNICH-O.html">O. Barnich</a> and <a href="http://www2.ulg.ac.be/telecom/publi/Author/VAN-DROOGENBROECK-M.html">M. Van Droogenbroeck</a>. <strong>ViBe: a powerful random technique to estimate the background in video sequences</strong>. In <em>International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009)</em>, pages 945-948, April 2009. Available as a <a href="http://ieeexplore.ieee.org//xpls/abs_all.jsp?arnumber=4959741">IEEE publication</a> or on <a href="http://hdl.handle.net/2268/12087">the University site</a>. </li>
<li><a href="http://www.freepatentsonline.com/EP2015252.html">Patent description at the &quot;freepatentsonline&quot; web site</a></li>
</ul>
<h5>Performance</h5>
<p>An independant evaluation is available in S. Brutzer, B. Hoferlin, and G. Heidemann. <strong><a href="http://ieeexplore.ieee.org/search/freesrchabstract.jsp?arnumber=5995508">Evaluation of background subtraction techniques for video surveillance.</a></strong> In IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), pages 1937-1944, Colorado Spring, USA, June 2011.    <br />In their conclusions, they claim: <em>&quot;Considering these aspects, Barnich is a <strong>strong favorite</strong>, since it is simple and almost parameterless.&quot;</em></p>
<h5>Contacts</h5>
<p>For any question, please contact <a href="http://www.ulg.ac.be/telecom/people/MarcVanDroogenbroeck.html"><b>Prof. Van Droogenbroeck</b> </a>.    <br />See also the site of the <a href="http://www.interface.ulg.ac.be/Valorisation-recherche-universitaire/op37.php">Interface</a>, in charge of the partnerships between companies and the <a href="http://www.ulg.ac.be/">University of Liege</a>.</p>
<ul></ul>
<ul><a href="http://www2.ulg.ac.be/telecom/research/vibe/" target="_blank">项目主页</a></ul>
<p>感谢wushuangseu的投递</p>

	Tags: <a href="http://www.cvchina.info/tag/background-subtraction/" title="background subtraction" rel="tag">background subtraction</a>, <a href="http://www.cvchina.info/tag/vibe/" title="vibe" rel="tag">vibe</a>, <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a>, <a href="http://www.cvchina.info/tag/%e8%83%8c%e6%99%af%e5%87%8f%e9%99%a4/" title="背景减除" rel="tag">背景减除</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2011/12/25/vibe/feed/</wfw:commentRss>
		<slash:comments>18</slash:comments>
		</item>
		<item>
		<title>机器学习中的算法(1)-决策树模型组合之随机森林与GBDT</title>
		<link>http://www.cvchina.info/2011/12/17/ml-alg-gbd/</link>
		<comments>http://www.cvchina.info/2011/12/17/ml-alg-gbd/#comments</comments>
		<pubDate>Sat, 17 Dec 2011 14:05:49 +0000</pubDate>
		<dc:creator>忙菇</dc:creator>
				<category><![CDATA[新闻]]></category>

		<guid isPermaLink="false">http://www.cvchina.info/?p=3203</guid>
		<description><![CDATA[&#160; &#160; &#160; &#160; 转载自LeftNotEasy的博客 &#160; 前言：     决策树这种算法有着很多良好的特性，比如说训练时间复杂度较低，预测的过程比较快速，模型容易展示（容易将得到的决策树做成图片展示出来）等。但是同时，单决策树又有一些不好的地方，比如说容易over-fitting，虽然有一些方法，如剪枝可以减少这种情况，但是还是不够的。     模型组合（比如说有Boosting，Bagging等）与决策树相关的算法比较多，这些算法最终的结果是生成N(可能会有几百棵以上）棵树，这样可以大大的减少单决策树带来的毛病，有点类似于三个臭皮匠等于一个诸葛亮的做法，虽然这几百棵决策树中的每一棵都很简单（相对于C4.5这种单决策树来说），但是他们组合起来确是很强大。     在最近几年的paper上，如iccv这种重量级的会议，iccv 09年的里面有不少的文章都是与Boosting与随机森林相关的。模型组合+决策树相关的算法有两种比较基本的形式 &#8211; 随机森林与GBDT((Gradient Boost Decision Tree)，其他的比较新的模型组合+决策树的算法都是来自这两种算法的延伸。本文主要侧重于GBDT，对于随机森林只是大概提提，因为它相对比较简单。     在看本文之前，建议先看看机器学习与数学(3)与其中引用的论文，本文中的GBDT主要基于此，而随机森林相对比较独立。 基础内容：     这里只是准备简单谈谈基础的内容，主要参考一下别人的文章，对于随机森林与GBDT，有两个地方比较重要，首先是information gain，其次是决策树。这里特别推荐Andrew Moore大牛的Decision Trees Tutorial，与Information Gain Tutorial。Moore的Data Mining Tutorial系列非常赞，看懂了上面说的两个内容之后的文章才能继续读下去。     决策树实际上是将空间用超平面进行划分的一种方法，每次分割的时候，都将当前的空间一分为二，比如说下面的决策树：     就是将空间划分成下面的样子：     这样使得每一个叶子节点都是在空间中的一个不相交的区域，在进行决策的时候，会根据输入样本每一维feature的值，一步一步往下，最后使得样本落入N个区域中的一个（假设有N个叶子节点） &#160; &#160; 随机森林(Random Forest):     随机森林是一个最近比较火的算法，它有很多的优点：     在数据集上表现良好     在当前的很多数据集上，相对其他算法有着很大的优势     它能够处理很高维度（feature很多）的数据，并且不用做特征选择     在训练完后，它能够给出哪些feature比较重要     在创建随机森林的时候，对generlization error使用的是无偏估计 [...]]]></description>
			<content:encoded><![CDATA[<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>转载自LeftNotEasy的博客</strong></span></p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>前言：</strong></span></p>
<p><span style="font-size: medium;">    决策树这种算法有着很多良好的特性，比如说训练时间复杂度较低，预测的过程比较快速，模型容易展示（容易将得到的决策树做成图片展示出来）等。但是同时，单决策树又有一些不好的地方，比如说容易over-fitting，虽然有一些方法，如剪枝可以减少这种情况，但是还是不够的。</span></p>
<p><span style="font-size: medium;">    模型组合（比如说有Boosting，Bagging等）与决策树相关的算法比较多，这些算法最终的结果是生成N(可能会有几百棵以上）棵树，这样可以大大的减少单决策树带来的毛病，有点类似于三个臭皮匠等于一个诸葛亮的做法，虽然这几百棵决策树中的每一棵都很简单（相对于C4.5这种单决策树来说），但是他们组合起来确是很强大。</span></p>
<p><span style="font-size: medium;">    在最近几年的paper上，如iccv这种重量级的会议，</span><a href="http://www.cvpapers.com/iccv2009.html"><span style="font-size: medium;">iccv 09</span></a><span style="font-size: medium;">年的里面有不少的文章都是与Boosting与随机森林相关的。模型组合+决策树相关的算法有两种比较基本的形式 &#8211; 随机森林与GBDT((Gradient Boost Decision Tree)，其他的比较新的模型组合+决策树的算法都是来自这两种算法的延伸。本文主要侧重于GBDT，对于随机森林只是大概提提，因为它相对比较简单。</span></p>
<p><span style="font-size: medium;">    在看本文之前，建议先看看</span><a href="http://www.cnblogs.com/LeftNotEasy/archive/2011/01/02/machine-learning-boosting-and-gradient-boosting.html"><span style="font-size: medium;">机器学习与数学(3)</span></a><span style="font-size: medium;">与其中引用的论文，本文中的GBDT主要基于此，而随机森林相对比较独立。</span></p>
<p><span id="more-3203"></span></p>
<p><span style="font-size: large;"><strong>基础内容：</strong></span></p>
<p><span style="font-size: medium;">    这里只是准备简单谈谈基础的内容，主要参考一下别人的文章，对于随机森林与GBDT，有两个地方比较重要，首先是information gain，其次是决策树。这里特别推荐Andrew Moore大牛的<a href="http://www.autonlab.org/tutorials/dtree.html">Decision Trees Tutorial</a>，与<a href="http://www.autonlab.org/tutorials/infogain.html">Information Gain Tutorial</a>。Moore的<a href="http://www.autonlab.org/tutorials/">Data Mining Tutorial系列</a>非常赞，看懂了上面说的两个内容之后的文章才能继续读下去。</span></p>
<p><span style="font-size: medium;">    决策树实际上是将空间用超平面进行划分的一种方法，每次分割的时候，都将<strong>当前的</strong>空间一分为二，比如说下面的决策树：</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353099568.png"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353099220.png" alt="image" width="240" height="169" border="0" /></a></p>
<p><span style="font-size: medium;">    就是将空间划分成下面的样子：</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353092567.png"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353097550.png" alt="image" width="240" height="221" border="0" /></a></p>
<p><span style="font-size: medium;">    这样使得<strong>每一个叶子节点都是在空间中的一个不相交的区域</strong>，在进行决策的时候，会根据输入样本每一维feature的值，一步一步往下，最后使得样本落入N个区域中的一个（假设有N个叶子节点）</span></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>随机森林(Random Forest):</strong></span></p>
<p><span style="font-size: medium;">    随机森林是一个最近比较火的算法，它有很多的优点：</span></p>
<ul>
<li><span style="font-size: medium;">    在数据集上表现良好</span></li>
<li><span style="font-size: medium;">    在当前的很多数据集上，相对其他算法有着很大的优势</span></li>
<li><span style="font-size: medium;">    它能够处理很高维度（feature很多）的数据，并且不用做特征选择</span></li>
<li><span style="font-size: medium;">    在训练完后，它能够给出哪些feature比较重要</span></li>
<li><span style="font-size: medium;">    在创建随机森林的时候，对generlization error使用的是无偏估计</span></li>
<li><span style="font-size: medium;">    训练速度快</span></li>
<li><span style="font-size: medium;">    在训练过程中，能够检测到feature间的互相影响</span></li>
<li><span style="font-size: medium;">    容易做成并行化方法</span></li>
<li><span style="font-size: medium;">    实现比较简单</span></li>
</ul>
<p><span style="font-size: medium;">    随机森林顾名思义，是用随机的方式建立一个森林，森林里面有很多的决策树组成，随机森林的每一棵决策树之间是没有关联的。在得到森林之后，当有一个新的输入样本进入的时候，就让森林中的每一棵决策树分别进行一下判断，看看这个样本应该属于哪一类（对于分类算法），然后看看哪一类被选择最多，就预测这个样本为那一类。</span></p>
<p><span style="font-size: medium;">    在建立每一棵决策树的过程中，有两点需要注意 &#8211; 采样与完全分裂。首先是两个随机采样的过程，random forest对输入的数据要进行行、列的采样。对于行采样，采用有放回的方式，也就是在采样得到的样本集合中，可能有重复的样本。假设输入样本为N个，那么采样的样本也为N个。这样使得在训练的时候，每一棵树的输入样本都不是全部的样本，使得相对不容易出现over-fitting。然后进行列采样，从M个feature中，选择m个(m &lt;&lt; M)。之后就是对采样之后的数据使用完全分裂的方式建立出决策树，这样决策树的某一个叶子节点要么是无法继续分裂的，要么里面的所有样本的都是指向的同一个分类。一般很多的决策树算法都一个重要的步骤 &#8211; 剪枝，但是这里不这样干，由于之前的两个随机采样的过程保证了随机性，所以就算不剪枝，也不会出现over-fitting。</span></p>
<p><span style="font-size: medium;">    按这种算法得到的随机森林中的每一棵都是很弱的，但是大家组合起来就很厉害了。我觉得可以这样比喻随机森林算法：每一棵决策树就是一个精通于某一个窄领域的专家（因为我们从M个feature中选择m让每一棵决策树进行学习），这样在随机森林中就有了很多个精通不同领域的专家，对一个新的问题（新的输入数据），可以用不同的角度去看待它，最终由各个专家，投票得到结果。</span></p>
<p><span style="font-size: medium;">    随机森林的过程请参考<a href="https://cwiki.apache.org/MAHOUT/random-forests.html">Mahout的random forest</a></span><span style="font-size: medium;"> 。这个页面上写的比较清楚了，其中可能不明白的就是Information Gain，可以看看之前推荐过的Moore的页面。</span></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>Gradient Boost Decision Tree:</strong></span></p>
<p><span style="font-size: medium;">   GBDT是一个应用很广泛的算法，可以用来做分类、回归。在很多的数据上都有不错的效果。</span><span style="font-size: medium;">GBDT这个算法还有一些其他的名字，比如说MART(Multiple Additive Regression Tree)，GBRT(Gradient Boost Regression Tree)，Tree Net等，其实它们都是一个东西（参考自<a href="http://en.wikipedia.org/wiki/Gradient_boosting">wikipedia – Gradient Boosting</a>)，发明者是Friedman</span></p>
<p><span style="font-size: medium;">   Gradient Boost其实是一个框架，里面可以套入很多不同的算法，可以参考一下机器学习与数学(3)中的讲解。Boost是&#8221;提升&#8221;的意思，一般Boosting算法都是一个迭代的过程，每一次新的训练都是为了改进上一次的结果。</span></p>
<p><span style="font-size: medium;">   原始的Boost算法是在算法开始的时候，为每一个样本赋上一个权重值，初始的时候，大家都是一样重要的。在每一步训练中得到的模型，会使得数据点的估计有对有错，我们就在每一步结束后，增加分错的点的权重，减少分对的点的权重，这样使得某些点如果老是被分错，那么就会被“严重关注”，也就被赋上一个很高的权重。然后等进行了N次迭代（由用户指定），将会得到N个简单的分类器（basic learner），然后我们将它们组合起来（比如说可以对它们进行加权、或者让它们进行投票等），得到一个最终的模型。</span></p>
<p><span style="font-size: medium;">   而Gradient Boost与传统的Boost的区别是，每一次的计算是为了减少上一次的残差(residual)，而为了消除残差，我们可以在<strong>残差减少的梯度(Gradient)方向</strong>上建立一个新的模型。所以说，在Gradient Boost中，每个新的模型的简历是为了使得之前模型的残差往梯度方向减少，与传统Boost对正确、错误的样本进行加权有着很大的区别。</span></p>
<p><span style="font-size: medium;">   在分类问题中，有一个很重要的内容叫做Multi-Class Logistic，也就是多分类的Logistic问题，它适用于那些类别数&gt;2的问题，并且在分类结果中，样本x不是一定只属于某一个类可以得到样本x分别属于多个类的概率（也可以说样本x的估计y符合某一个几何分布），这实际上是属于Generalized Linear Model中讨论的内容，这里就先不谈了，以后有机会再用一个专门的章节去做吧。这里就用一个结论：<strong>如果一个分类问题符合几何分布，那么就可以用Logistic变换来进行之后的运算</strong>。</span></p>
<p><span style="font-size: medium;">   假设对于一个样本x，它可能属于K个分类，其估计值分别为F1(x)…FK(x)，<strong>Logistic变换如下</strong>，logistic变换是一个平滑且将数据规范化（使得向量的长度为1）的过程，结果为属于类别k的概率pk(x)，</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353094170.png"><span style="color: #000000; font-size: medium;"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353109154.png" alt="image" width="337" height="65" border="0" /></span></a></p>
<p><span style="font-size: medium;">   对于Logistic变换后的结果，损失函数为：</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/20110307235310549.png"><span style="color: #000000; font-size: medium;"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353101944.png" alt="image" width="306" height="62" border="0" /></span></a><span style="font-size: medium;">    其中，yk为输入的样本数据的估计值，当一个样本x属于类别k时，yk = 1，否则yk = 0。</span></p>
<p><span style="font-size: medium;">    将Logistic变换的式子带入损失函数，并且对其求导，可以得到<strong>损失函数的梯度</strong>：</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353106928.png"><span style="color: #000000; font-size: medium;"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353105499.png" alt="image" width="597" height="75" border="0" /></span></a><span style="font-size: medium;">    上面说的比较抽象，下面举个例子：</span></p>
<p><span style="font-size: medium;">    假设输入数据x可能属于5个分类（分别为1,2,3,4,5），训练数据中，x属于类别3，则y = (0, 0, 1, 0, 0)，假设模型估计得到的F(x) = (0, 0.3, 0.6, 0, 0)，则经过Logistic变换后的数据p(x) = (0.16,0.21,0.29,0.16,0.16)，y &#8211; p得到梯度g：(-0.16, -0.21, 0.71, -0.16, -0.16)。观察这里可以得到一个比较有意思的结论：</span></p>
<p><span style="font-size: medium;">    假设gk为样本当某一维（某一个分类）上的梯度:</span></p>
<p><span style="font-size: medium;">    gk&gt;0时，越大表示其在这一维上的概率p(x)越应该提高，比如说上面的第三维的概率为0.29，就应该提高，属于<strong>应该往“正确的方向”前进</strong></span></p>
<p><span style="font-size: medium;">                  越小表示这个估计越“准确”</span></p>
<p><span style="font-size: medium;">    gk&lt;0时，越小，负得越多表示在这一维上的概率应该降低，比如说第二维0.21就应该得到降低。属于<strong>应该朝着“错误的反方向”前进</strong></span></p>
<p><span style="font-size: medium;">                  越大，负得越少表示这个估计越“不错误 ”</span></p>
<p><span style="font-size: medium;">    总的来说，<strong>对于一个样本，最理想的梯度是越接近0的梯度</strong>。所以，我们要能够让函数的估计值能够使得梯度往反方向移动（&gt;0的维度上，往负方向移动，&lt;0的维度上，往正方向移动）最终使得梯度尽量=0），并且<strong>该算法在会严重关注那些梯度比较大的样本，跟Boost的意思类似</strong>。</span></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><span style="font-size: medium;">    得到梯度之后，就是如何让梯度减少了。这里是用的一个<strong>迭代+决策树</strong>的方法，当初始化的时候，随便给出一个估计函数F(x)（可以让F(x)是一个随机的值，也可以让F(x)=0），然后之后每迭代一步就根据当前每一个样本的梯度的情况，建立一棵决策树。就让函数往梯度的反方向前进，最终使得迭代N步后，梯度越小。</span></p>
<p><span style="font-size: medium;">    这里建立的决策树和普通的决策树不太一样，首先，这个决策树是一个叶子节点数J固定的，当生成了J个节点后，就不再生成新的节点了。</span></p>
<p><span style="font-size: medium;">    算法的流程如下:（参考自treeBoost论文）</span></p>
<p><a href="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/201103072353119893.png"><img title="image" src="http://images.cnblogs.com/cnblogs_com/LeftNotEasy/201103/20110307235312285.png" alt="image" width="630" height="360" border="0" /></a></p>
<p><span style="font-size: medium;">     0. 表示给定一个初始值</span></p>
<p><span style="font-size: medium;">     1. 表示建立M棵决策树（迭代M次）</span></p>
<p><span style="font-size: medium;">     2. 表示对函数估计值F(x)进行Logistic变换</span></p>
<p><span style="font-size: medium;">     3. 表示对于K个分类进行下面的操作（其实这个for循环也可以理解为向量的操作，每一个样本点xi</span><span style="font-size: medium;">都对应了K种可能的分类yi，所以yi, F(xi), p(xi)都是一个K维的向量，这样或许容易理解一点）</span></p>
<p><span style="font-size: medium;">     4. 表示求得残差减少的梯度方向</span></p>
<p><span style="font-size: medium;">     5. 表示根据每一个样本点x，与其残差减少的梯度方向，得到一棵由J个叶子节点组成的决策树</span></p>
<p><span style="font-size: medium;">     6. <strong>为当决策树建立完成后，通过这个公式，可以得到每一个叶子节点的增益（这个增益在预测的时候用的）</strong></span></p>
<p><span style="font-size: medium;">       每个增益的组成其实也是一个K维的向量，表示如果在决策树预测的过程中，如果某一个样本点掉入了这个叶子节点，则其对应的K个分类的值是多少。比如说，GBDT得到了三棵决策树，一个样本点在预测的时候，也会掉入3个叶子节点上，其增益分别为（假设为3分类的问题）：</span></p>
<p><span style="font-size: medium;">       (0.5, 0.8, 0.1),  (0.2, 0.6, 0.3),  (0.4, 0.3, 0.3)，那么这样最终得到的分类为第二个，因为选择分类2的决策树是最多的。</span></p>
<p><span style="font-size: medium;">     7. 的意思为，将当前得到的决策树与之前的那些决策树合并起来，作为新的一个模型(跟6中所举的例子差不多)</span></p>
<p><span style="font-size: medium;">     <strong>GBDT的算法大概就讲到这里了，希望能够弥补一下上一篇文章中没有说清楚的部分：）</strong></span></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>实现：</strong></span></p>
<p><span style="font-size: medium;">     看明白了算法，就需要去实现一下，或者看看别人实现的代码，这里推荐一下wikipedia中的gradient boosting页面，下面就有一些开源软件中的一些实现，比如说下面这个：</span><a href="http://elf-project.sourceforge.net/"><span style="font-size: medium;">http://elf-project.sourceforge.net/</span></a><span style="font-size: medium;"> </span></p>
<p>&nbsp;</p>
<p><span style="font-size: large;"><strong>参考资料：</strong></span></p>
<p><span style="font-size: medium;">     除了文章中的引用的内容（已经给出了链接）外，主要还是参考Friedman大牛的文章：Greedy function approximation : A Gradient Boosting Machine</span></p>
<p>&nbsp;</p>
<p><strong><span style="font-size: large;">版权声明：</span></strong></p>
<p>&nbsp;</p>
<p><span style="font-size: medium;">    本文由LeftNotEasy发布于</span><a href="http://leftnoteasy.cnblogs.com/"><span style="font-size: medium;">http://leftnoteasy.cnblogs.com</span></a><span style="font-size: medium;">, 本文可以被全部的转载或者部分使用，但请注明出处，如果有问题，请联系</span><a href="mailto:wheeleast@gmail.com"><span style="font-size: medium;">wheeleast@gmail.com</span></a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>

	Tags: <a href="http://www.cvchina.info/category/news/" title="新闻" rel="tag">新闻</a><br />
]]></content:encoded>
			<wfw:commentRss>http://www.cvchina.info/2011/12/17/ml-alg-gbd/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

<!-- Dynamic page generated in 1.402 seconds. -->
<!-- Cached page generated by WP-Super-Cache on 2012-02-05 10:22:30 -->

