AI技术在今天应用已经非常广泛,但能否实际用在科研与生产中非常关键,深度神经网络作为其中最重要的核心技术之一, 在2022年的最佳五大应用如下。
一、用于非常深层的神经网络的 Langevin 算法应用于图像分类
作者:Pierre Bras
训练一个非常深层的神经网络是一项具有挑战性的任务,因为神经网络越深,它就越非线性。我们将各种预处理 Langevin 算法的性能与它们的非 Langevin 算法进行比较,以训练深度增加的神经网络。对于浅层神经网络,Langevin 算法不会带来任何改进,但是网络越深,Langevin 算法提供的增益就越大。向梯度下降中添加噪声可以逃避局部陷阱,这对于非常深的神经网络来说更为常见。在这种启发式之后,引入了一种新的 Langevin 算法,称为 Layer Langevin,它包括仅将 Langevin 噪声添加到与最深层关联的权重。
二、用于法律文件检索的注意力深度神经网络
作者:Ha-Thanh Nguyen、Manh-Kien Phi、Xuan-Bach Ngo、Vu Tran、Le-Minh Nguyen、Minh-Phuong Tu
法律文本检索是广泛的法律文本处理任务的关键组成部分,例如法律问题回答、法律案件内涵和成文法检索。法律文本检索的性能在很大程度上取决于文本的表示,包括查询和法律文档。基于良好的表示,法律文本检索模型可以有效地将查询与其相关文档相匹配。由于法律文件通常包含很长的文章,并且只有部分与查询相关,因此现有模型要表示此类文件是一个很大的挑战。在这里研究了基于注意力神经网络的文本表示在成文法文件检索中的应用,它提出了一种使用具有注意机制的深度神经网络的通用方法。基于它,开发了两种具有稀疏注意力的层次结构来表示长句子和文章,我们将它们命名为 Attentive CNN 和 Paraformer。这些方法在不同大小和特征的英语、日语和越南语数据集上进行了评估。实验结果表明:
i)在跨数据集和语言的检索性能方面,注意力神经方法大大优于非神经方法;
ii) 预训练的基于 transformer 的模型以高计算复杂度为代价在小型数据集上实现了更好的精度,而更轻的权重 Attentive CNN 在大型数据集上实现了更好的精度;
iii)Paraformer 在 COLIEE 数据集上优于最先进的方法,在 top-N 检索任务中实现了最高的召回率和 F2 分数。
三、HubbardNet:使用深度神经网络对 Bose-Hubbard 模型谱进行有效预测
作者: Ziyan , Marios Mattheakis
提出了一种基于深度神经网络 (DNN) 的模型 (HubbardNet),以变分方式找到一维和二维 Bose-Hubbard 模型的基态和激发态波函数。将此模型用于具有 M 个位点的正方形晶格,从单次训练中获得能谱作为现场库仑斥力 U 和粒子总数 N 的分析函数。这种方法无需为每组不同的值 (U,N) 求解新的哈密顿量。这表明DNN 参数化解与哈密尔顿精确对角化的结果非常一致,并且在计算缩放方面优于精确对角化。
四、使用 YOLOv5 深度神经网络(arXiv)进行脑癌分割
作者:Dr. Taimur Ahad
异常脑细胞的扩张被称为脑肿瘤。大脑的结构极其复杂,有几个区域控制着各种神经系统过程。大脑或颅骨的任何部分都可能发生脑瘤,包括大脑的保护层、颅底、脑干、鼻窦、鼻腔和许多其他地方。在过去的十年中,计算机辅助脑肿瘤诊断领域取得了许多进展。最近,实例分割在众多计算机视觉应用中引起了极大的兴趣。它试图为各种场景对象分配各种 ID,即使它们是同一类的成员。通常,两阶段流水线用于执行实例分割。这项研究展示了使用 YOLOv5 进行脑癌分割。Yolo 将数据集作为图片格式和相应的文本文件。You Only Look Once (YOLO) 是一种广泛使用的病毒式算法。YOLO 以其物体识别特性而闻名。You Only Look Once (YOLO) 是一种流行的算法,已经流行起来。YOLO 以其识别物体的能力而闻名。YOLO V2、V3、V4、V5是近年来专家发表的一些YOLO最新版本。早期脑肿瘤检测是神经科医生和放射科医生最重要的工作之一。然而,从磁共振成像 (MRI) 数据中手动识别和分割脑肿瘤可能很困难且容易出错。为了对病情进行早期诊断,需要一个自动脑肿瘤检测系统。研究论文的模型分为三类。它们分别是脑膜瘤、垂体瘤、胶质瘤。结果表明,模型在 M2 10 核 GPU 的运行时使用方面达到了具有竞争力的准确性
五、基于深度神经网络的偏均值相关性检验与测量
作者:Leheng Cai
在回归建模中研究协变量 W 的子集对于给定协变量 Z 的响应 Y 的重要性非常重要。为此,这里针对基于深度神经网络和数据拆分的部分均值独立性问题提出了一种新的显着性检验。检验统计量在原假设下收敛于标准卡方分布,而在备择假设下收敛于正态分布。这里还提出了一种基于多重数据拆分的强大集成算法,以增强测试能力。如果原假设被拒绝,则提出了一种新的部分广义相关性度量(pGMC)来衡量在控制 Z 的非线性效应后给定 W 的 Y 的部分均值依赖性,这是 Zheng 等人提出的 GMC 的有趣扩展阿尔(2012)。这个方法展示了 pGMC 的吸引人的理论特性,并建立了其估计量具有最佳根 N 收敛率的渐近正态性。
此外,还导出了 pGMC 的有效置信区间。作为没有条件协变量 Z 的重要特例,还考虑了一种新的协变量整体显着性测试,用于无模型设置中的响应。同时还引入了 GMC 的新估计量并推导出其渐近正态性。还进行了数值研究和实际数据分析,以与现有方法进行比较,并说明提出的程序的有效性和灵活性。