新套路!米其林三星大厨的新菜是用算法设计出来的?

Submitted by like on Tue, 06/20/2017 - 09:45
2005年的某天,韩裔比利时两星大厨Sang-HoonDegeimbre在与Foodpairing的创始人Bernard Lahousse共进晚餐时,望着一个猕猴桃出神:“你知道吗,当我品尝猕猴桃的时候,我总能尝出海的味道。”一直学习生物工程的Lahousse发现,他的第一单生意来了。据他回忆,在他读大学时就听说过学界的一个共识,即人类品尝食物时产生的口感其实有75%到95%来自于嗅觉。即使这个百分比被后来一些学者质疑,但是像Charles Spence这般的质疑者也仍然会在论文中再三肯定气味在人类品尝食物时起到的主要作用(可参见Spence在Flavour上的评论文章《Just how much of what we tastederives from the sense of smell?》)。

1天“写”100多篇? 今日头条搞出一个写稿机器人

Submitted by neurta on Mon, 06/19/2017 - 14:13
里约奥运会开赛一周,AI机器人「张小明」通过对接奥组委的数据库信息,实时撰写新闻稿件,以跟电视直播几乎同时的速度发布稿件。据了解,张小明主要报道乒乓球、网球、羽毛球和女足的比赛,6天共生成超200篇简讯和资讯。 张小明是今日头条实验室研发的AI机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。 “丁宁本轮的对手是现世界排名第7的韩英,实力不俗。但经过4场大战的激烈较量,最终,丁宁还是以总比分4:0战胜对手,笑到了最后,为中国延续了在这个系列赛事中最终夺冠的机会。“ 据了解,张小明平均每天产出30-40篇稿件,以短讯为主。截至目前,张小明的《奥运会乒乓球女单铜牌赛金宋依(朝鲜)4:1奥运名将福原爱(日本) 轻松摘铜》,在头条号获得超过5.4万用户的阅读量。 除了短讯,张小明还能撰写长文资讯:

Deep Residual Learning for Image Recognition

Submitted by like on Mon, 06/19/2017 - 11:40
Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with reference to the layer inputs, instead of learning unreferenced functions. We provide comprehensive empirical evidence showing that these residual networks are easier to optimize, and can gain accuracy from considerably increased depth. On the ImageNet dataset we evaluate residual nets with a depth of up to 152 layers—8× deeper than VGG nets [40] but still having lower complexity. An ensemble of these residual nets achieves 3.57% error on the ImageNet test set. This result won the 1st place on the ILSVRC 2015 classification task. We also present analysis on CIFAR-10 with 100 and 1000 layers.

用python实现随机森林算法的一个实例

Submitted by meixun on Fri, 06/16/2017 - 09:07
前言: 随机森林是一个非常灵活的机器学习方法,从市场营销到医疗保险有着众多的应用。它可以用于市场营销对客户获取和存留建模或预测病人的疾病风险和易感性。 随机森林能够用于分类和回归问题,可以处理大量特征,并能够帮助估计用于建模数据变量的重要性。 这篇文章是关于如何使用Python构建随机森林模型。

Bit-map空间压缩和快速排序去重

Submitted by meixun on Thu, 06/15/2017 - 09:01
4. Bit-map应用之快速查询 同样,我们利用Bit-map也可以进行快速查询,这种情况下对于一个数字只需要一个bit位就可以了,0表示不存在,1表示存在。假设上述的题目改为,如何快速判断一个数字是够存在于上述的2.5亿个数字集合中。 同之前一样,首先我们先对所有的数字进行一次遍历,然后将相应的转态位改为1。遍历完以后就是查询,由于我们的Bit-map采取的是连续存储(整型数组形式,一个数组元素对应32bits),我们实际上是采用了一种分桶的思想。一个数组元素可以存储32个状态位,那将待查询的数字除以32,定位到对应的数组元素(桶),然后再求余(%32),就可以定位到相应的状态位。如果为1,则代表改数字存在;否则,该数字不存在。

增强学习对于机器人运动控制的六字真言 | 干货

Submitted by pengkun on Mon, 06/12/2017 - 16:59
五月末的人机大战让世人大开眼界,顶级围棋手柯洁落下的眼泪、微博的叹息,都是对AlphaGo这颗强劲“大脑”的赞叹。然而,让人工智能走出娱乐和游戏,真正进入人类的实际生活,通过实现机器人的自主运动来为人类提供服务同样是我们长久以来的梦想。 但是,机器人的自主运动该如何实现?随着深度学习部分解决了机器人的视听识别问题,增强学习技术有望成为突破机器人自主运动难题的一把利剑。 增强学习实际上是“试错法”这一在生活中广泛使用的技巧的理论抽象,即为了达到理想目标而不断试验,并在实际尝试中修正方案,从而逐步提高成功率。 比如在围棋程序中,盘面情况称为“状态”,落子选择称为“行为”;根据状态选择行为的方法就称为“策略”,根据当前状态和行为对输赢的预测就称为“价值”,而当前一步的输赢结果称为“回报”。增强学习就是修正策略从而实现价值最大化的过程。

神经网络基础

Submitted by meixun on Fri, 06/09/2017 - 14:09
神经元是神经网络中最基本的结构,也可以说是神经网络的基本单元,它的设计灵感完全来源于生物学上神经元的信息传播机制。我们学过生物的同学都知道,神经元有两种状态:兴奋和抑制。一般情况下,大多数的神经元是处于抑制状态,但是一旦某个神经元收到刺激,导致它的电位超过一个阈值,那么这个神经元就会被激活,处于“兴奋”状态,进而向其他的神经元传播化学物质(其实就是信息)。

如何在MNIST上构建和训练条件生成式对抗网络(CGAN)?

Submitted by like on Fri, 06/09/2017 - 10:20
定义对象条件的标签(要生成哪个数字) 噪声矢量为Generator模型提供了构建块,它将学习如何将噪声结构化为样本。mx.symbol.Deconvolution操作符用于将初始输入从1x1形状向上采样到28x28图像。 用于生成假样本的标签上的信息是由附加到随机噪声的标签索引的独热编码(one-hot encoding)来提供的。对于MNIST来说,0-9索引因此被转换为长度为10的二进制向量。更复杂的应用将需要的是嵌入而不是简单的单向编码来编码条件。

机器学习十大算法介绍

Submitted by pengkun on Fri, 06/09/2017 - 09:50

James Le 在 KDnuggets 上发布了一篇文章,介绍了他是如何入门机器学习的。此外,他在其中摸索出十大常用的机器学习算法,并逐一进行介绍。

如果你想学机器学习,那怎么入门呢?对于我来说,我是这样开始我的机器学习的,首先,我选修了一门人工智能课程。教我课程的老师是Technical University of Denmark的大学教授,他的研究方向就是逻辑与人工智能。我们用的教材是人工智能的经典教材: Peter Norvig’s Artificial Intelligence — A Modern Approach。这本书主要讲了智能主体、对抗搜索、概率论、多智能系统、AI哲学等等。这门课程我上了三个学期,最后我做了一个简单的基于搜索的智能系统,这个系统可以完成虚拟环境下的传输任务。

通过这门课程我学到了很多知识,在将来我还要继续学习。最近几周,我有幸在旧金山的举办的机器学习大会上与众多机器学习大牛交谈,我和他们聊了很多关于深度学习、神经网络、数据结构的内容。此外,我还在网上选修了一门机器学习入门课程,正巧刚刚修完。在接下来内容中,我将和大家分享我在这门课程中所学到的机器学习常用算法。

面向物联网应用的人工智能相关技术研究

Submitted by like on Wed, 06/07/2017 - 15:57

1 引言

目前对物联网的理解,已经从IoT(Internet of Things)扩展到IoE(Internet of Everything),从一开始定义的传感器网络,发展到万物互联时代。据IDC分析,到2020年,全球将有300亿智能设备接入互联网并产生海量数据。随着越来越多的业界领先公司进入到物联网领域,从对物联网基础设施的建设,物联网各类设备的控制,到物联网产生的数据分析处理,最后到基于数据理解的物联网融合应用研发等还有许多问题没有解决,对于物联网世界未来发展所需要解决的核心技术、技术演进路线等并没有统一的认识。

目前,对于物联网技术的研究热点主要从通信角度,研究物联网终端之间新型通信协议、标准,如低功耗广覆盖(Low Power Wide Area,LPWA)等各类新型通信技术研究。这些研究为未来各类场景下,实现各类物体的低成本连接提供了基本的通信保证。另一方面,物联网领域的标志性应用还未出现,虽然有自动驾驶、智能抄表等案例,但目前还未出现从经济效益、业界影响力,到创新性技术应用的标志性物联网应用。通信技术的升级只解决了物联网的联网问题,并未解决信息技术发展的内在驱动力,即广泛认可的应用问题。解决应用问题的核心技术恰恰是传统通信技术研发机构所不擅长的信息内容理解及应用技术。