发明名称 --- 一种基于动态数字验证码的语音门禁系统

Submitted by neurta on Mon, 12/09/2019 - 11:29
1.一种基于动态数字验证码的语音门禁系统,包括声纹注册终端、服务器与门禁终端,其特征在于,所述声纹注册终端与门禁终端连接在服务器上,所述的声纹注册终端包括声纹网络通信模块、声纹录音模块和声纹显示模块,所述的声纹网络通信模块用于接收和发送声音数据或控制信号,所述的声纹录音模块用于采集用户录音,所述的声纹显示模块用于显示动态数字码或其它提示信息。 2.根据权利要求1所述的一种基于动态数字验证码的语音门禁系统,其特征在于:所述的服务器包括服务器网络通信模块、动态数字码生成模块、声纹识别模块、语音识别模块、管理模块与存储模块。 3.根据权利要求1所述的一种基于动态数字验证码的语音门禁系统,其特征在于:所述的门禁终端包括网络通信模块、控制模块、显示模块、报警模块、录音模块与感应模块。 4.根据权利要求2所述的一种基于动态数字验证码的语音门禁系统,其特征在于:所述的服务器网络通信模块用于与声纹注册终端和门禁终端进行通信,接收以及发送声音数据或控制信号;所述的动态数字码生成模块用

2020 IEEE Fellow名单出炉

Submitted by neurta on Wed, 11/27/2019 - 12:45

IEEE 全称是美国电子电气工程师学会(Institute of Electrical and Electronic Engineers),是国际性电子技术与信息科学工程师学会,在 160 多个国家拥有超过 40 万会员。IEEE Fellow 为学会最高等级会员,是 IEEE 授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就。当选人需要对工程科学与技术的进步或应用做出重大贡献,为社会带来重大价值。当选人数不超过 IEEE 当年会员总数的 0.1%。

 

去年,机器之心就对 IEEE 2019 Fellow 进行了报道。据统计,去年晋升 IEEE Fellow 的华人学者近百位,来自大陆地区高校和企业的新晋 Fellow 30 多位,其中包括清华大学魏少军、Petuum 创始人兼 CEO 邢波教授这样的资深学者,非常引人注目。

 

结巴分词

Submitted by neurta on Tue, 11/26/2019 - 15:54
常见问题 1. 模型的数据是如何生成的? 详见: https://github.com/fxsjy/jieba/issues/7 2. “台中”总是被切成“台 中”?(以及类似情况) P(台中) < P(台)×P(中),“台中”词频不够导致其成词概率较低 解决方法:强制调高词频 jieba.add_word('台中') 或者 jieba.suggest_freq('台中', True) 3. “今天天气 不错”应该被切成“今天 天气 不错”?(以及类似情况) 解决方法:强制调低词频 jieba.suggest_freq(('今天', '天气'), True) 或者直接删除该词 jieba.del_word('今天天气') 4. 切出了词典中没有的词语,效果不理想? 解决方法:关闭新词发现 jieba.cut('丰田太省了', HMM=False) jieba.cut('我们中出了一个叛徒', HMM=False) 更多问题请点击:https://github.com/fxsjy/jieba/issues?sort=updated&state=closed

阿里妈妈造发布国内首个工业级的图深度学习开源框架Euler

Submitted by neurta on Sun, 05/12/2019 - 13:34
https://github.com/alibaba/euler 1.1Euler的核心能力 1)大规模图的分布式学习 工业界的图往往具有数十亿节点和数百亿边,有些场景甚至可以到数百亿节点和数千亿边,在这样规模的图上单机训练是不可行的。Euler支持图分割和高效稳定的分布式训练,可以轻松支撑数十亿点、数百亿边的计算规模。 2)支持复杂异构图的表征 工业界的图关系大都错综复杂,体现在节点异构、边关系异构,另外节点和边上可能有非常丰富的属性,这使得一些常见的图神经网络很难学到有效的表达。Euler在图结构存储和图计算的抽象上均良好的支持异构点、异构边类型的操作,并支持丰富的异构属性,可以很容易的在图学习算法中进行异构图的表征学习。 3)图学习与深度学习的结合 工业界有很多经典场景,例如搜索/推荐/广告场景,传统的深度学习方法有不错效果,如何把图学习和传统方法结合起来,进一步提升模型能力是很值得探索的。Euler支持基于深度学习样本的mini-batch训练,把图表征直接输入到深度学习网络中联合训练。 4)分层抽象与灵活扩展 Euler系统抽象为图引擎层、图操作算子层、算法实现层三个层次,可以快速地在高层扩展一个图学习算法。实际上,Euler也内置了大量的算法实现供大家直接使用。

NLP自然语言处理tf-idf 三个基本应用【更新中】

Submitted by neurta on Sat, 05/11/2019 - 14:16
任务三:如何通过词频,对文章进行自动摘要 信息都包含在句子中,有些句子包含的信息多,有些句子包含的信息少。 "自动摘要"就是要找出那些包含信息最多的句子。 句子的信息量用"关键词"来衡量。如果包含的关键词越多,就说明这个句子越重要。 Luhn提出用"簇"(cluster)表示关键词的聚集。所谓"簇"就是包含多个关键词的句子片段。

低纬度房价预测入门测试

Submitted by neurta on Thu, 04/25/2019 - 13:29
Utilities:第一个映入我眼帘的是Utilities,因为公共设施越齐全肯定越贵嘛,但是我又观察了具体的训练数据集,发现每一个房屋都是“AllPub”,即都具备基础的公共设施,所以这一项不能入选。 LotArea:英文理解能力有限,并不知道这什么意思,姑且认为是“地皮面积”,很好理解,面积越大肯定越贵嘛。。。 Neighborhood:这应表示房屋所处市区的位置,这个必选啊,合不合适在后面再具体分析。 OverallQual:对房子的整体材料和装修进行评估 YearBuilt:建造年份 TotalBsmtSF&GrLivArea:训练数据中有很多特征都涉及到了面积,所以没必要每个都考虑进去,为了简化,选择了TotalBsmtSF(地下室面积)&GrLivArea(生活面积) Heating:供暖方式应该很重要,但是数据显示基本上都是GasA类型,所以不予考虑, CentralAir:中央空调这个可以考虑一下,因为有的有,有的没有。 MiscVal: 在其他类别中未涉及的其他功能的价值,一般都是“shed(棚子)”,价格在400-1500美元之间,可以考虑一下 GarageCars&GarageArea:车库可容纳的车辆数以及其面积,这个可以算成单位车辆拥有的面积来计算

kaggle开放数据卫星图片识别棕榈种植园比赛

Submitted by neurta on Wed, 04/24/2019 - 12:52
训练模型所要使用的数据标签。 处理「图像分类数据集」和「表格数据集」的主要区别在于标签的存储方式。这里的标签指的是图像中的内容。在这个特定的数据集中,标签以 CSV 文件格式存储。 想要了解更多计算「分数」列的方法,点击: https://success.figure-eight.com/hc/en-us/articles/201855939-How-to-Calculate-a-Confidence-Score。 我们将使用 seaborn 的 countplot 函数来观察训练数据的分布。我们从下图中看到,大约 14300 个图像中没有发现油棕种植园,而仅有 942 个图像中发现了油棕种植园。这就是所谓的不平衡数据集,但我们在这里不讨论这个深度学习问题。我们此刻正迈出了一小步。

中央音乐学院首招音乐人工智能方向博士生

Submitted by neurta on Wed, 04/24/2019 - 10:30

个人也注意到了最近不少结合深度学习进行音乐编曲、创作的paper和应用,欢迎大家来分享音乐与AI如何结合的想法。

相关问题:计算机音乐是否通过机器学习等方法进行过作曲、演奏?

中央音乐学院的招生细则:(中央音乐学院-中央音乐学院音乐人工智能首招博士生!今天开始报名啦!俞峰院长携手清华、北大专家组建跨学科导师阵容!)

科学技术是音乐发展的主要推动力之一,人工智能将是未来音乐发展的又一重要契机。中央音乐学院将于2019年首次招收“音乐人工智能与音乐信息科技”方向的博士生,着力培养音乐与理工科交叉融合的复合型拔尖创新人才,助力音乐与科技的融合,助力“一流学科”建设。欢迎计算机、智能和电子信息类考生报考!

一、学习年限

学制三年

二、导师队伍

本方向将采取双导师培养制(音乐导师+科技导师),以下是三位导师信息:

  俞峰,中央音乐学院院长,教授、博导,“万人计划”领军人才,“四个一批”人才。中国指挥学会会长、全国艺术专业学位研究生教指委副主任、中国文联第十届全国委员会委员,享受国务院政府特殊津贴。

如何让RNN神经元拥有基础通用的注意力能力

Submitted by huzhenda on Sat, 09/22/2018 - 14:34

循环神经网络(RNNs)是序列建模中被广泛使用的网络结构,它通过控制当前信息以及历史信息的贡献大小来实现序列信息的积累。RNN神经元将当前时刻的输入向量作为一个整体,通过门设计控制其信息载入到模型的信息量。然而,输入向量中的不同元素通常具有不同的重要性,RNNs忽略了对此重要属性的探索及利用以加强网络能力。

为此,微软亚洲研究院和西安交通大学合作,提出了通过对RNN层加入一个简单有效的元素注意力门,使得RNN神经元自身拥有基础通用的注意力能力,对不同的元素自适应地赋予不同的重要性来更加细粒度地控制输入信息流。该注意力门设计简单,并且通用于不同的RNN结构以及不同的任务。

RNN的网络结构

循环神经网络(Recurrent Neural Networks, 缩写RNNs),例如标准RNN、LSTM、GRU等,已经被广泛用于对时间序列数据的处理和建模,来解决许多应用问题,例如行为识别、机器翻译、手写识别等。RNN在对时域动态特性建模以及特征学习上具有强大的能力。如图1所示,在每个时间步,RNN神经元通过当前时刻的输入x_t和前一时刻的隐状态信息h_(t-1)来更新当前时刻的隐状态h_t,从而具有对历史信息的记忆性。

一文详解深度学习在命名实体识别(NER)中的应用

Submitted by huzhenda on Sat, 09/15/2018 - 14:43

近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别(Named Entity Recognition,NER)的研究中,深度学习也获得了不错的效果。最近,笔者阅读了一系列基于深度学习的NER研究的相关论文,并将其应用到达观的NER基础模块中,在此进行一下总结,与大家一起分享学习。

1. NER 简介

NER又称作专名识别,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。因此实体这个概念可以很广,只要是业务需要的特殊文本片段都可以称为实体。