基于强化学习开发人机对弈五子棋游戏

Submitted by donghonglin on Mon, 04/23/2018 - 09:25
今天通过一个实例来具体讲解状态空间、价值函数等概念,例子是编写一个可以人机对弈的五子棋程序。由于完整的棋盘导致状态空间太大,个人PC一时难以训练,因此这里我们使用的是5*5大小的棋盘。加入两个玩家的棋子为X和O,那么赢的情况就是: 同一行或者同一列的棋子相同; 正对角线或反对角线的棋子相同。

语义分割中的弱监督学习

Submitted by donghonglin on Sat, 04/21/2018 - 15:58
我们所关注的弱监督问题是指为实现某个计算机视觉任务,采用了比该任务更弱的一种人工标注作为监督信息。一般来讲,这种弱监督的标注比原始的标注更容易获取。例如,对于目标检测任务,image-level(图像层面)的标签相比物体的bounding box是一种弱监督的标注;对于语义分割任务,image-level的标签和物体的bounding box相比pixel-level(像素层面)的标签则是一种弱监督的标注。

详解计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割

Submitted by donghonglin on Sat, 04/21/2018 - 13:14
什么是计算机视觉呢? 这里给出了几个比较严谨的定义: ✦ “对图像中的客观对象构建明确而有意义的描述”(Ballard&Brown,1982) ✦ “从一个或多个数字图像中计算三维世界的特性”(Trucco&Verri,1998) ✦ “基于感知图像做出对客观对象和场景有用的决策”(Sockman&Shapiro,2001)

稀疏&集成的卷积神经网络学习

Submitted by donghonglin on Thu, 04/19/2018 - 16:19
目标识别是指用计算机实现人的视觉功能,它的研究目标就是使计算机具有从一幅或多幅图像或者是视频中认知周围环境的能力(包括对客观世界三维环境的感知、识别与理解)。目标识别作为视觉技术的一个分支,就是对视场内的物体进行识别,如人或交通工具,先进行检测,检测完后进行识别,然后分析他们的行为。

AI玩微信跳一跳的正确姿势 --跳一跳Auto-Jump算法详解

Submitted by donghonglin on Thu, 04/19/2018 - 14:23
我们开发了微信跳一跳Auto-Jump算法,重新定义了玩跳一跳的正确姿势,我们的算法不仅远远超越了人类的水平,在速度和准确度上也远远超越了目前已知的所有算法,可以说是跳一跳界的state-of-the-art.

超级干货|从神经元到CNN、RNN、GAN,一篇文章讲清楚

Submitted by chenrouyu on Thu, 04/19/2018 - 13:10
这里整理出一份清单来梳理所有的神经网络架构。其中大部分是人工神经网络,也有一些完全不同的怪物。尽管所有这些架构都各不相同、功能独特,当我在画它们的节点图时……其中潜在的关系开始逐渐清晰起来。

收敛

Submitted by chenrouyu on Wed, 04/18/2018 - 13:37
本文有三部分: Part I: Introduction of Convergence Rate (informal) Part II: Sublinear Convergence & Linear Convergence & Quadratic Convergence Part III: Example Convergence Rate of GD under Convex, Strong Convex, Non-Convex