21年校招DL/NLP/推荐系统/ML/算法基础面试必看300问及答案

Submitted by neurta on Mon, 05/31/2021 - 10:47
生成与判别模型     o什么叫生成模型     o什么叫判别模型     o什么时候会选择生成/判别模型     oCRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型     o我的理解     先验概率和后验概率     o写出全概率公式&贝叶斯公式     o说说你怎么理解为什么有全概率公式&贝叶斯公式     o什么是先验概率     o什么是后验概率     o经典概率题     频率概率     o极大似然估计 - MLE     o最大后验估计 - MAP     o极大似然估计与最大后验概率的区别     o到底什么是似然什么是概率估计     AutoML     oAutoML问题构成     o特征工程选择思路     o模型相关的选择思路     o常见梯度处理思路     oAutoML参数选择所使用的方法     o讲讲贝叶斯优化如何在automl上应用     o以高斯过程为例,超参搜索的f的最优解求解acquisition function有哪些     o高斯过程回归手记     oAutoSklearn详解手记     oAutoML常规思路手记     数学     数据质量     o期望     o方差     o标准差     o协方差     o相关系数     最大公约数问题     o辗转相除法     o其他方法     牛顿法     o迭代公式推导     o实现它     概率密度分布     o均匀分布     o伯努利分布     o二项分布     o高斯分布     o拉普拉斯分布     o泊松分布     平面曲线的切线和法线     o平面曲线的切线     o平面曲线的法线          导数     o四则运算     o常见导数     o复合函数的运算法则     o莱布尼兹公式          微分中值定理

看Youtube怎么利用深度学习做推荐

Submitted by neurta on Mon, 05/31/2021 - 10:27
召回:从百万级别的候选视频中选出几百个用户喜欢的视频。 对召回系统的要求是,“低延时”与“高精度(precision)”,“个性化”方面可以适当放宽以保证性能要求 排序:将召回的视频打分,将用户最有可能点击的视频排在前面。 结果的“个性化”是排序的重要任务 Youtube在这两个子系统中,都使用了深度神经网络,结构上并没有太大的不同,主要是体现在所使用的特征上。 “召回”使用的特征,相对较少和简单,以满足性能要求。 “排序”使用了更多的特征,以保证精准的个性化。

苍蝇大脑可能使用通用设计原理来做出预测

Submitted by neurta on Mon, 05/24/2021 - 09:00
摘要:研究结果表明,预测可能是动物神经系统支持快速行为改变的普遍特征。 资料来源:芝加哥大学 根据芝加哥大学的最新研究,苍蝇可以预测其视觉环境的变化,从而执行规避动作。这种依赖于预测信息来指导行为的建议表明,预测可能是动物神经系统在支持快速行为改变方面的普遍特征。 该研究于5月20日发表在《 PLOS计算生物学》上。 动物使用其感觉神经系统来获取有关其环境的信息,然后根据所检测到的东西进行某些行为。但是,神经系统需要花费一些时间来处理此感官信息,这意味着在以前的信息已被完全处理之前,环境可能会发生变化。 UChicago的有机生物学与解剖学副教授Stephanie Palmer博士说:“这在捕食者/猎物相互作用中确实很重要。”

基于图神经网络的对话情感纠错模型

Submitted by neurta on Thu, 05/13/2021 - 10:15
本申请涉及基于图神经网络的对话情感纠错模型,包括:多模态特征抽取模块、基于单句的情感识别模块、交互建模模块、时序建模模块和情感预测模块;所述多模态特征抽取模块和所述基于单句的情感识别模块连接,所述基于单句的情感识别模块与所述交互建模模块连接,所述交互建模模块与所述时序建模模块连接,所述时序建模模块与所述情感预测模块连接。

ACM Prize Awarded to Pioneer in Quantum Computing

Submitted by neurta on Fri, 04/16/2021 - 11:21
Scott Aaronson is the David J. Bruton Jr. Centennial Professor of Computer Science at the University of Texas at Austin. His primary area of research is theoretical computer science, and his research interests center around the capabilities and limits of quantum computers, and computational complexity theory more generally.

ICLR 2021初审结果公布,高分论文有这些!

Submitted by neurta on Wed, 03/31/2021 - 10:29
在本次ICLR 2021上,有心人注意到了一篇长达245页的论文《Deep Networks and the Multiple Manifold Problem》。 确定这不是把博士论文投稿过来的?这么长的论文先不说搞不搞得明白,确定审稿人哪怕能读完了这篇论文? 经查阅,本篇论文的初审得分是5、5、7、8,属于不算太差。这篇论文研究了多重流形问题,这是一种在机器视觉应用中建模的二进制分类任务,其中训练了一个深层的全连接神经网络来分离单位球面的两个低维子流形...... 一句话来说:本文证明了深度全连接神经网络的有限时间( finite-time )泛化结果,该神经网络通过梯度下降训练以对结构化数据进行分类,其中所需的宽度,深度和样本复杂度仅取决于数据的固有属性。把这篇论文从头翻到尾,从尾翻到头,确定全文只有三张图,而剩下的200多页全部都是令人感到敬畏的数学证明公式。

盘点CVPR 2019影响力最大20篇论文

Submitted by neurta on Mon, 03/15/2021 - 09:22
这 20 篇论文全部开源了。不开源的论文复现代价大,别人参考的门槛会高很多,维护好论文对应的开源软件能极大提高论文影响力。 2. 方向分布在GAN、人脸识别、神经架构搜索、语义分割、图像合成、姿态估计、迁移学习、3D目标检测、全景分割、目标跟踪、图像分类、网络结构设计(可变形卷积)、对抗学习、三维重建等方向。 3. 引用数排名第一的 StyleGAN 引用次数 956 远超第二名 ArcFace 689 次,和第三名 Mnasnet 486 次。第 10 名 FBnet 228次,第20 名 Sophie 157 次。 4. 这些论文绝大多数有工业界巨头的身影,英伟达贡献 2 篇 (第一名来自英伟达),谷歌贡献 4 篇,Facebook 贡献 4 篇,亚马逊1篇, 国内微软亚研院2篇,商汤 1 篇,京东 1篇。 5. 目标检测是计算机视觉领域非常火的方向,但入选的两篇全是3D点云目标检测。 6. 人脸识别在工业界应用很火,但只有一篇论文入前20(大名鼎鼎的 ArcFace),说明这个领域的技术也许已经趋于成熟。

Tags

神经网络如何外推:从前馈到图形神经网络

Submitted by neurta on Thu, 01/14/2021 - 08:26
我们研究了通过梯度下降训练的神经网络是如何外推的,也就是说,它们在训练分布的支持范围之外学到了什么。以前的工作报告了用神经网络外推时的混合经验结果:虽然多层感知器(MLP)在某些简单任务中无法很好地外推,但是具有MLP模块的结构化网络图神经网络(GNN)在较复杂的任务中已显示出一定的成功。通过理论解释,我们确定了MLP和GNN良好推断的条件。首先,我们对ReLU MLP从原点沿任何方向快速收敛到线性函数的观察进行量化,这意味着ReLU MLP不会外推大多数非线性函数。但是,当训练分布足够“多样化”时,他们证明可以学习线性目标函数。其次,结合分析GNN的成功和局限性,这些结果提出了一个假设,我们为该假设提供了理论和经验证据:GNN在将算法任务外推到新数据(例如较大的图或边权重)方面的成功取决于编码任务架构或功能中的特定于非线性。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。较大的图形或边缘权重)依赖于对体系结构或功能中特定于任务的非线性进行编码。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。较大的图形或边缘权重)依赖于对体系结构或功能中特定于任务的非线性进行编码。我们的理论分析建立在超参数网络与神经正切核的连接上。根据经验,我们的理论适用于不同的培训环境。

基于冲突的搜索,以实现最佳的多智能体寻路

Submitted by neurta on Tue, 01/12/2021 - 16:31
在多主体寻路问题(MAPF)中,我们得到了一组主体,每个主体都有各自的起始位置和目标位置。任务是查找所有代理的路径,同时避免冲突。解决此问题的大多数先前工作已将单个代理视为单个“联合代理”,然后应用了A *算法的单代理搜索变体。 在本文中,我们提出了一种基于冲突的搜索(CBS)新的最优多主体寻路算法。CBS是一种两级算法,不会将问题转换为单个“联合代理”模型。在较高级别上,对冲突树(CT)执行搜索,该树是基于各个代理之间的冲突的树。CT中的每个节点代表了一组对代理人运动的约束。在低级别,执行快速单代理搜索以满足高层CT节点施加的约束。在许多情况下,这种两级公式使CBS可以检查少于A *的状态,同时仍保持最佳状态。我们分析CBS并显示其优缺点。 此外,我们介绍了Meta-Agent CBS(MA-CBS)算法。MA-CBS是CBS的概括。与基本CBS不同,MA-CBS不仅限于低级别的单代理搜索。取而代之的是,MA-CBS允许将代理合并为一小组联合代理。这减轻了基本CBS的某些缺点,并进一步提高了性能。实际上,MA-CBS是可以建立在任何最佳而完整的MAPF求解器之上的框架,以增强其性能。在各种问题上的实验结果表明,与以前的方法相比,速度提高了一个数量级。

VersatileGait: A Large-Scale Synthetic Gait Dataset with Fine-Grained Attributes and Complicated Scenarios

Submitted by neurta on Sun, 01/10/2021 - 16:25
With the motivation of practical gait recognition applications, we propose to automatically create a large-scale synthetic gait dataset (called VersatileGait) by a game engine, which consists of around one million silhouette sequences of 11,000 subjects with fine-grained attributes in various complicated scenarios. Compared with existing real gait datasets with limited samples and simple scenarios, the proposed VersatileGait dataset possesses several nice properties, including huge dataset size, high sample diversity, high-quality annotations, multi-pitch angles, small domain gap with the real one, etc. Furthermore, we investigate the effectiveness of our dataset (e.g., domain transfer after pretraining). Then, we use the fine-grained attributes from VersatileGait to promote gait recognition in both accuracy and speed, and meanwhile justify the gait recognition performance under multi-pitch angle settings. Additionally, we explore a variety of potential applications for research. Extensive experiments demonstrate the value and effectiveness of the proposed VersatileGait in gait recognition along with its associated applications. We will release both VersatileGait and its corresponding data generation toolkit for further studies.