- 谢娟英;兰翔;许升全;
通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能力的分割模型。为此,通过改进SAM(segment anything model)模型,提出一种鲁棒的蝴蝶生态图像分割新模型SABM(segment any butterfly model)。SABM模型通过引入双路卷积模块、蝴蝶词元(butterfly token)及一个3层MLP(multi-layer perceptron)使模型具有更好的特征学习能力。707张蝴蝶生态图像数据集的2折交叉验证实验表明,SABM模型对蝴蝶生态图像的分割能力超越了SAM及其现有的改进SOTA模型。7 645张全新蝴蝶生态图像数据集的分割实验测试发现,SABM模型具有非常好的泛化性能,对7 645张全新蝴蝶生态图像的蝴蝶实现了非常好的分割。该分割结果为未来的蝴蝶生态图像分割研究提供了10倍于现有数据的大数据集,为野外环境下的蝴蝶物种自动识别提供了更好的可用数据,也为测试聚类算法性能提供了富有挑战性的数据集。另外,还在医学图像数据测试了SABM模型的鲁棒性。
2025年06期 v.53;No.222 1-14页 [查看摘要][在线阅读][下载 1622K] [下载次数:147 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:15 ] - 孙晨静;冯茹苹;杨渊元;马思源;常雨昕;高洁;葛宝;赵世杰;李锦;强宁;
基于功能磁共振成像数据的脑网络检测是理解大脑认知和功能的关键,也是探索脑功能障碍疾病的基础。随着深度学习技术的发展,越来越多的研究者开始将其应用于脑网络检测领域。基于此,综述了目前这一领域的主要研究成果和进展。首先,介绍了基于功能磁共振成像的脑网络检测基本原理。随后,介绍了应用于脑网络检测的深度学习模型及相关应用,分析了这些模型的优势和局限性。最后,总结了深度学习方法应用于脑网络检测所面临的挑战和未来的研究方向。为进一步推动基于深度学习和功能磁共振影像的脑网络检测及应用研究提供了重要参考。
2025年06期 v.53;No.222 15-31页 [查看摘要][在线阅读][下载 1516K] [下载次数:394 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:11 ] - 倪建云;张凤杰;尚红志;谷海青;曹稳军;
针对移动机器人路径规划对路径长度最短以及平滑度的性能要求,提出一种改进A-star算法融合提升动态窗口法(dynamic window approach,DWA)求解机器人动态路径规划问题的方法。设计了A-star算法新的启发函数,并对其进行动态权重分配,增加新的评估函数,实现了全局规划路径最短,减少了规划路径的拐点和冗余节点。针对DWA算法,设计了静态障碍物和动态障碍物距离函数,增添路径偏差距离函数,并以全局路径进行指导,使DWA算法规划的路径贴合全局路径,能够及时躲避未知障碍物和动态障碍物,为全局最优路径。仿真结果表明:复杂环境下,改进的A-star算法相比传统算法在路径长度上缩短34.4%,拐点减少53.5%。
2025年06期 v.53;No.222 32-40页 [查看摘要][在线阅读][下载 1650K] [下载次数:375 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:13 ] - 曹发生;曹维;苏燕青;
虽然SASRec(self-attention sequential recommendation)模型在稀疏性数据集和稠密型数据集上的结果都优于各种序列推荐模型,但是在序列推荐中也会受到表征退化的困扰,即高频出现的物品常常会集中在表征空间的一小块区域,从而降低推荐性能。为了解决该问题,引入了一个对比学习损失函数,在embedding空间里添加高斯噪声做数据增强,并使用原始物品序列和数据增强后的物品序列来构建正样本对,促使相似实例在映射空间里的距离越近越好,不同实例在映射空间里的分布呈现均匀性,尽可能让实例映射成embedding之后还能保留自己的个性化信息。对两个基准数据集的综合实验研究表明,该对比学习模型方法可以平滑地调整学习表示的流行度偏差。该对比学习基于图推荐模型SGL(self-supervised graph learning for recommendation),该模型在表示学习中存在负采样偏差,提出的模型可以有效地提高推荐性能。
2025年06期 v.53;No.222 41-50页 [查看摘要][在线阅读][下载 1467K] [下载次数:61 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ] - 樊晔;王阳;
岩画作为一种特殊的历史文化遗产,其数量大、分布广,图像分类面临复杂元素交叉干扰的挑战,难以实现高效准确的分类识别,而深度学习等技术的发展为岩画的保护研究提供了新的契机。基于此,提出一种双分支注意力融合网络(DBAFN),融合ResNet50的局部特征提取能力与ViT(vision Transformer)的全局语义建模能力,以贺兰山岩画为例,通过门控注意力机制动态加权特征,提升岩画分类精度。在包含1 200幅贺兰山岩画图像(人面像、动物、狩猎场景)的数据集上,DBAFN实现85.62%的分类准确率,较单一ResNet50(81.46%)和单一ViT(80.02%)提升显著,其中狩猎岩画F_1值提高至82.35%。实验表明,该网络能有效解决岩画误分类问题,为文化遗产语义解析与跨学科研究提供新路径,助推人工智能在文化遗产数字化保护领域的应用。
2025年06期 v.53;No.222 51-61页 [查看摘要][在线阅读][下载 1650K] [下载次数:169 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:8 ] - 戎岩;杨景龙;张鹏昌;曾子木;
提出了一种基于三维高光谱与Transformer的网络,用于中国中原风格与西域风格壁画的风格特征分类。通过采集壁画的高光谱图像,并构建相应的数据集,在此基础上,采用迁移学习的方法对所提出的网络进行训练。实验结果表明,与其他传统方法相比,文中方法的准确率相较于最优算法提升了0.92%,精确率提升了0.12%,召回率提升了1.4%,F_1分数提升了0.75%。此外,通过与基于彩色图像的深度学习分类方法的对比,相较于结果最优的方法,准确率提升了4.5%,精确率提升了1.9%,召回率提升了5.4%,F_1分数提升了3.7%。研究验证了高光谱信息在提升分类准确性方面的独特优势。
2025年06期 v.53;No.222 62-70页 [查看摘要][在线阅读][下载 1570K] [下载次数:172 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:12 ]