基于图神经网络的对话情感纠错模型

Submitted by neurta on Thu, 05/13/2021 - 10:15
本申请涉及基于图神经网络的对话情感纠错模型,包括:多模态特征抽取模块、基于单句的情感识别模块、交互建模模块、时序建模模块和情感预测模块;所述多模态特征抽取模块和所述基于单句的情感识别模块连接,所述基于单句的情感识别模块与所述交互建模模块连接,所述交互建模模块与所述时序建模模块连接,所述时序建模模块与所述情感预测模块连接。

ACM Prize Awarded to Pioneer in Quantum Computing

Submitted by neurta on Fri, 04/16/2021 - 11:21
Scott Aaronson is the David J. Bruton Jr. Centennial Professor of Computer Science at the University of Texas at Austin. His primary area of research is theoretical computer science, and his research interests center around the capabilities and limits of quantum computers, and computational complexity theory more generally.

ICLR 2021初审结果公布,高分论文有这些!

Submitted by neurta on Wed, 03/31/2021 - 10:29
在本次ICLR 2021上,有心人注意到了一篇长达245页的论文《Deep Networks and the Multiple Manifold Problem》。 确定这不是把博士论文投稿过来的?这么长的论文先不说搞不搞得明白,确定审稿人哪怕能读完了这篇论文? 经查阅,本篇论文的初审得分是5、5、7、8,属于不算太差。这篇论文研究了多重流形问题,这是一种在机器视觉应用中建模的二进制分类任务,其中训练了一个深层的全连接神经网络来分离单位球面的两个低维子流形...... 一句话来说:本文证明了深度全连接神经网络的有限时间( finite-time )泛化结果,该神经网络通过梯度下降训练以对结构化数据进行分类,其中所需的宽度,深度和样本复杂度仅取决于数据的固有属性。把这篇论文从头翻到尾,从尾翻到头,确定全文只有三张图,而剩下的200多页全部都是令人感到敬畏的数学证明公式。

盘点CVPR 2019影响力最大20篇论文

Submitted by neurta on Mon, 03/15/2021 - 09:22
这 20 篇论文全部开源了。不开源的论文复现代价大,别人参考的门槛会高很多,维护好论文对应的开源软件能极大提高论文影响力。 2. 方向分布在GAN、人脸识别、神经架构搜索、语义分割、图像合成、姿态估计、迁移学习、3D目标检测、全景分割、目标跟踪、图像分类、网络结构设计(可变形卷积)、对抗学习、三维重建等方向。 3. 引用数排名第一的 StyleGAN 引用次数 956 远超第二名 ArcFace 689 次,和第三名 Mnasnet 486 次。第 10 名 FBnet 228次,第20 名 Sophie 157 次。 4. 这些论文绝大多数有工业界巨头的身影,英伟达贡献 2 篇 (第一名来自英伟达),谷歌贡献 4 篇,Facebook 贡献 4 篇,亚马逊1篇, 国内微软亚研院2篇,商汤 1 篇,京东 1篇。 5. 目标检测是计算机视觉领域非常火的方向,但入选的两篇全是3D点云目标检测。 6. 人脸识别在工业界应用很火,但只有一篇论文入前20(大名鼎鼎的 ArcFace),说明这个领域的技术也许已经趋于成熟。

Tags

神经网络如何外推:从前馈到图形神经网络

Submitted by neurta on Thu, 01/14/2021 - 08:26
我们研究了通过梯度下降训练的神经网络是如何外推的,也就是说,它们在训练分布的支持范围之外学到了什么。以前的工作报告了用神经网络外推时的混合经验结果:虽然多层感知器(MLP)在某些简单任务中无法很好地外推,但是具有MLP模块的结构化网络图神经网络(GNN)在较复杂的任务中已显示出一定的成功。通过理论解释,我们确定了MLP和GNN良好推断的条件。首先,我们对ReLU MLP从原点沿任何方向快速收敛到线性函数的观察进行量化,这意味着ReLU MLP不会外推大多数非线性函数。但是,当训练分布足够“多样化”时,他们证明可以学习线性目标函数。其次,结合分析GNN的成功和局限性,这些结果提出了一个假设,我们为该假设提供了理论和经验证据:GNN在将算法任务外推到新数据(例如较大的图或边权重)方面的成功取决于编码任务架构或功能中的特定于非线性。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。较大的图形或边缘权重)依赖于对体系结构或功能中特定于任务的非线性进行编码。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。较大的图形或边缘权重)依赖于对体系结构或功能中特定于任务的非线性进行编码。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。

基于冲突的搜索,以实现最佳的多智能体寻路

Submitted by neurta on Tue, 01/12/2021 - 16:31
在多主体寻路问题(MAPF)中,我们得到了一组主体,每个主体都有各自的起始位置和目标位置。任务是查找所有代理的路径,同时避免冲突。解决此问题的大多数先前工作已将单个代理视为单个“联合代理”,然后应用了A *算法的单代理搜索变体。 在本文中,我们提出了一种基于冲突的搜索(CBS)新的最优多主体寻路算法。CBS是一种两级算法,不会将问题转换为单个“联合代理”模型。在较高级别上,对冲突树(CT)执行搜索,该树是基于各个代理之间的冲突的树。CT中的每个节点代表了一组对代理人运动的约束。在低级别,执行快速单代理搜索以满足高层CT节点施加的约束。在许多情况下,这种两级公式使CBS可以检查少于A *的状态,同时仍保持最佳状态。我们分析CBS并显示其优缺点。 此外,我们介绍了Meta-Agent CBS(MA-CBS)算法。MA-CBS是CBS的概括。与基本CBS不同,MA-CBS不仅限于低级别的单代理搜索。取而代之的是,MA-CBS允许将代理合并为一小组联合代理。这减轻了基本CBS的某些缺点,并进一步提高了性能。实际上,MA-CBS是可以建立在任何最佳而完整的MAPF求解器之上的框架,以增强其性能。在各种问题上的实验结果表明,与以前的方法相比,速度提高了一个数量级。

VersatileGait: A Large-Scale Synthetic Gait Dataset with Fine-Grained Attributes and Complicated Scenarios

Submitted by neurta on Sun, 01/10/2021 - 16:25
With the motivation of practical gait recognition applications, we propose to automatically create a large-scale synthetic gait dataset (called VersatileGait) by a game engine, which consists of around one million silhouette sequences of 11,000 subjects with fine-grained attributes in various complicated scenarios. Compared with existing real gait datasets with limited samples and simple scenarios, the proposed VersatileGait dataset possesses several nice properties, including huge dataset size, high sample diversity, high-quality annotations, multi-pitch angles, small domain gap with the real one, etc. Furthermore, we investigate the effectiveness of our dataset (e.g., domain transfer after pretraining). Then, we use the fine-grained attributes from VersatileGait to promote gait recognition in both accuracy and speed, and meanwhile justify the gait recognition performance under multi-pitch angle settings. Additionally, we explore a variety of potential applications for research. Extensive experiments demonstrate the value and effectiveness of the proposed VersatileGait in gait recognition along with its associated applications. We will release both VersatileGait and its corresponding data generation toolkit for further studies.

一种可自动视觉识别零件种类的零件检测系统

Submitted by neurta on Sun, 01/10/2021 - 15:05
涉及一种可自动视觉识别零件种类的零件检测系统,包括检测箱、第一检测探头、第二检测探头、轨道、光源、摄影装置、检测托盘、电机、夹具、压力传感器、超声波探头和中控处理器。本发明通过在检测箱内设置光源,并将光源与中控处理器相连,能够使中控处理器完成对零件形状和材质的判断时,针对性的调节光源的亮度和色调,从而使所述系统在针对不同的零件进行检测时,均能够使用针对性的光照以使各所述探头能够清晰地采集到零件表面的缺陷,有效避免了光照不足或光照过量导致的图像采集不清晰的情况发生,提高了所述系统的检测效率。

深度学习遥感太空望远镜的自动校准

Submitted by neurta on Thu, 12/31/2020 - 14:57
作为美国宇航局太阳物理系统天文台(HSO)卫星群的一部分, 太阳动力学观测站(SDO)自年以来一直对太阳进行监测 2010轨道上的紫外线(UV)和极端紫外线(EUV)仪器,如 SDO的大气成像组件(AIA)仪器,与时间有关 降低仪器灵敏度的退化。(E)UV的精确校准 取决于目前不常用的周期性探测仪器 对于深空的太阳物理任务来说并不实用。在目前的工作中,我们 开发一个卷积神经网络(CNN)自动校准SDO/AIA 通道和校正灵敏度退化利用空间模式在 实现(E)紫外成像自校准的多波长观测 仪器。我们的结果消除了发展未来HSO的主要障碍 与SDO具有相同科学口径的任务,但在深空,能够观察 太阳从更多的有利位置而不仅仅是SDO目前的地球同步轨道。 该方法可用于其它成像系统的自动标定 表现出相似的退化形式。

基于数字图像处理的海洋悬浮颗粒物浓度测定装置及方法

Submitted by neurta on Thu, 12/24/2020 - 15:23
发明提供了基于数字图像处理的海洋悬浮颗粒物浓度测定装置及方法,基于海水和海洋悬浮颗粒物对光的不同反射性原理,利用数字图像处理技术,建立了一套基于数字图像处理技术的海洋悬浮颗粒物浓度测定装置及用以表征海洋悬浮颗粒物浓度的海洋悬浮颗粒物图像特征值算法,该算法提取出海洋悬浮颗粒物图像特征值,该海洋悬浮颗粒物图像特征值可以实现海洋悬浮颗粒物真实浓度的反演。该方法尝试将数字图像处理技术应用于海洋悬浮颗粒物浓度的测量,其测量精度仅依赖于测量装置的拍摄精度和后续算法的改进,可以克服其易受海洋悬浮颗粒物粒径大小以及粒径分布影响的缺点,同时具有直观、连续观测以及操作简便等优点,在海洋调查中具有广阔的应用前景。