大数据十大经典算法

Submitted by wukezhou on Mon, 07/10/2017 - 10:07

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 

不仅仅是选中的十大算法,其实参加评选的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。

无人驾驶技术之车道检测

Submitted by wangqingqing on Sun, 07/09/2017 - 15:20
个人兴趣爱好,最近在学习一些无人驾驶相关的技术,便萌生了循序渐进的写一系列文章的想法,这是第一篇。文章主要会以Udacity为主线,综合自己在学习过程中搜集的各种材料,取其精华,补其不足,力求通俗易懂,理论明确,实战有效,即作为一个学习总结,potentially又可以帮助对无人驾驶有兴趣但是零基础的朋友们 —— 注意这里的零基础是指未接触过无人驾驶领域,本系列还是需要一些简单的数学和机器学习知识。

梯度下降优化算法

Submitted by wukezhou on Fri, 07/07/2017 - 09:25

摘要

虽然梯度下降优化算法越来越受欢迎,但通常作为黑盒优化器使用,因此很难对其优点和缺点的进行实际的解释。本文旨在让读者对不同的算法有直观的认识,以帮助读者使用这些算法。在本综述中,我们介绍梯度下降的不同变形形式,总结这些算法面临的挑战,介绍最常用的优化算法,回顾并行和分布式架构,以及调研用于优化梯度下降的其他的策略。

1 引言

CANs(创意对抗网络)重磅发布,机器可生成的「艺术作品」比人类艺术家更受欢迎

Submitted by like on Fri, 07/07/2017 - 09:19
深度学习如何像人类一样产生“创造力”,一直是AI科学家们研究的热点。罗格斯大学和查尔斯顿学院近日联合发布了一篇论文,发布了一种全新的深度学习模型——创意对抗网络(Creative Adversarial Networks,CANs)。CAN通过学习风格和偏离风格规范来生成“艺术作品”。该论文是在2017年6月20日至6月22日在亚特兰大举行的第八届国际计算创意大会(ICCC)发布的论文的扩展版本。

深度解密今日头条的个性化资讯推荐技术

Submitted by pengkun on Fri, 07/07/2017 - 09:11
头条为何能取得成功?很多人会说是头条的个性化推荐技术做得好,个人认为其实不尽然。本文罗列了相关的个性化推荐技术,特别是资讯推荐常用的算法,带大家从“内行”的角度来解密下个性化资讯推荐技术。希望读者读后能发自内心地觉得:头条其实也就那么回事。

程序员是否必须会算法

Submitted by wukezhou on Thu, 07/06/2017 - 10:45

本章的标题既然是“程序员与算法”,就必然要涉及一个基本问题,那就是“程序员是否必须会算法”。这是一个充满争议的问题,虽然并不像“生存还是毁灭”之类的选择那样艰难而沉重,但也绝不是一个轻松的话题。朋友们在我的“算法系列”博客专栏上发表的评论和回复,并不都是我所期待的赞美和鼓励,也常常会有一些冷言冷语。比如,“穷举也算是算法吗”或者“请你说明一下算法在XX系统中能起到什么作用”。

有一次,一个网友通过邮件问我:“你写的都是小儿科的东西,几十行代码就能搞定,能不能整一点高深的算法?”我反问他什么是他所理解的高深的算法,他答复说:“像遗传算法、蚁群算法之类的。”于是我给了他一个遗传算法求解0-1背包问题的例子(参见第16章),并告诉他,这也就是几十行代码的算法,怎么理解成是高深的算法?他刚开始不承认这是遗传算法,直到我给了他Denis Cormier公开在北卡罗来纳州立大学服务器上的遗传算法的源代码后,他才相信他一直认为深不可测的遗传算法的原理原来是这么简单。

从大数据到块数据

Submitted by yanqin on Thu, 07/06/2017 - 10:18
大数据时代的到来,颠覆了我们的传统社会,但是大数据真的是万能的吗?事实上,大数据也存在一些悖论。因此,一些研究者提出了块数据的概念以弥补大数据的不足。