• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2024,33(4):1-12, DOI: 10.15888/j.cnki.csa.009459
    [摘要] (153) [HTML] (33) [PDF 2.72 M] (329)
    摘要:
    在核心任务场景下训练深度神经网络 (DNN) 需要越来越多的算力资源, 这刺激了基于云端预测API接口的模型的窃取与盗用, 同时也违反了模型所有者的知识产权. 为了追踪公开的非法模型副本, 深度神经网络的模型指纹技术为希望保持模型完整性的模型所有者提供了一种强大的版权验证方案. 然而, 现有的模型指纹方案主要基于输出层面的内在痕迹 (例如: 特定输入样本下的错误预测行为) , 这导致在模型指纹验证阶段缺乏隐蔽性. 本文基于模型预测时的显著图 (saliency map) 痕迹, 提出了一种全新的任意下游任务通用的模型指纹方案. 本文的方案提出了受约束的显著图操控目标, 构建标签不变和自然的指纹样本, 显著提高了模型指纹的隐蔽性. 根据对3种典型任务场景下全面的评估结果, 本文提出的方法被证明能够显著地增强现有方案的指纹版权验证的效果, 同时保持高度的模型指纹隐蔽性.
    2024,33(4):13-25, DOI: 10.15888/j.cnki.csa.009461
    [摘要] (119) [HTML] (26) [PDF 2.65 M] (308)
    摘要:
    多模态情感分析旨在通过用户上传在社交平台上的视频来判断用户的情感. 目前的多模态情感分析研究主要是设计复杂的多模态融合网络来学习模态之间的一致性信息, 在一定程度上能够提升模型的性能, 但它们大部分都忽略了模态之间的差异性信息所起到的互补作用, 从而导致情感分析出现偏差. 本文提出了一个基于双编码器表示学习的多模态情感分析模型DERL (dual encoder representation learning), 该模型通过双编码器结构学习模态不变表征和模态特定表征. 具体来说, 我们利用基于层级注意力机制的跨模态交互编码器学习所有模态的模态不变表征, 获取一致性信息; 利用基于自注意力机制的模态内编码器学习模态私有的模态特定表征, 获取差异性信息. 此外, 我们设计两个门控网络单元对编码后的特征进行增强和过滤, 以更好地结合模态不变和模态特定表征, 最后在融合时通过缩小不同多模态表示之间的L2距离以捕获它们之间潜在的相似情感用于情感预测. 在两个公开的数据集CMU-MOSI和CMU-MOSEI上的实验结果表明该模型优于一系列基线模型.
    2024,33(4):26-38, DOI: 10.15888/j.cnki.csa.009466
    [摘要] (121) [HTML] (36) [PDF 1.86 M] (446)
    摘要:
    肝癌是一种恶性肝肿瘤, 起源于肝细胞. 肝癌诊断一直是医学难点问题, 也是各领域研究的热点问题, 早期确诊肝癌可以降低肝癌的死亡率. 组织病理学图像检查是肿瘤学诊断的黄金标准, 图像会显示组织切片的细胞和组织结构, 可以用于确定细胞类型、组织结构、异常细胞的数量和形态, 并评估肿瘤具体情况. 本文重点研究了卷积神经网络针对病理图像的肝癌诊断算法, 包括肝肿瘤检测、图像分割以及术前预测这3个方面的应用, 详细阐述了卷积神经网络各算法的设计思路和相关改进目的及方法, 以便为研究人员提供更清晰的参考思路. 总结性分析了卷积神经网络算法在诊断中的优缺点, 并对未来可能的研究热点和相关难点进行了探讨.
    2024,33(4):39-49, DOI: 10.15888/j.cnki.csa.009469
    [摘要] (123) [HTML] (29) [PDF 2.10 M] (206)
    摘要:
    针对联邦学习框架下, 基于卷积注意力模块的多客户端脑肿瘤分类方法对于MRI图像中肿瘤区域细节提取能力不足、通道注意力与空间注意力相互干扰的问题, 以及针对多点医疗肿瘤数据分类准确性低的问题, 提出了一种融合联邦学习框架和改进的CBAM-ResNet18网络的脑肿瘤分类方法. 利用联邦学习特性联合多点脑肿瘤数据, 采用Leaky ReLU激活函数代替ReLU激活函数以减轻神经元死亡, 将卷积注意力模块中的通道注意力模块由先降维再升维改成先升维再降维, 充分提高网络对图像细节的提取能力, 将卷积注意力模块中的通道注意力模块与空间注意力模块由级联结构改为并联结构, 使得网络的特征提取能力不会受到二者先后顺序的影响. 通过在Kaggle公开的脑肿瘤MRI数据集上的进行实验, 该方法的准确率、精准度、召回率与F1值分别为97.78%、97.68%、97.61%与97.63%, 比基准模型分别高6.54%、4.78%、6.80%、7.00%. 实验结果证明, 该方法不仅能够打破数据孤岛, 实现多点数据融合, 而且比多数现有主流模型的性能更好.
    2024,33(4):50-59, DOI: 10.15888/j.cnki.csa.009486
    [摘要] (55) [HTML] (99) [PDF 2.16 M] (320)
    摘要:
    视障人士是社会中的弱势群体, 独立出行面临重重障碍. 为视障人士提供安全可靠的辅助设备体现了社会文明的进步. 介绍了辅助视障出行有关的障碍物检测识别关键技术和路径规划相关算法. 重点对障碍物检测之后的路径规划算法进行分析, 综合对比各种技术的应用特点及场景并讨论了相关方法在视障辅助设备中的研究进展. 总结了多技术融合使用在智能辅助设备中的应用现状. 在此基础上, 结合人工智能及嵌入式设备等技术的进步展望了未来辅助视障出行设备的发展方向.
    2024,33(4):60-68, DOI: 10.15888/j.cnki.csa.009458
    [摘要] (95) [HTML] (82) [PDF 1.72 M] (356)
    摘要:
    单通道语音增强任务中相位估计不准确会导致增强语音的质量较差, 针对这一问题, 提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network, DCACRN)的语音增强方法, 在复数域同时实现了语音幅度信息和相位信息的增强. 首先使用基于复数卷积网络的编码器从输入语音信号中提取复数表示的特征, 并引入卷积跳连模块用以将特征映射到高维空间进行特征融合, 加强信息间的交互和梯度的流动. 然后设计了基于轴向自注意力机制的编码器-解码器结构, 利用轴向自注意力机制来增强模型的时序建模能力和特征提取能力. 最后通过解码器实现对语音信号的重构, 同时利用混合损失函数优化网络模型, 提升增强语音信号的质量. 实验在公开数据集Valentini和DNS Challenge上进行, 结果表明所提方法相对于其他模型在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility, STOI)两项指标上均有提升, 在非混响数据集中, PESQ比DCTCRN (deep cosine transform convolutional recurrent network)提高了12.8%, 比DCCRN (deep complex convolutional recurrent network)提高了3.9%, 验证了该网络模型在语音增强任务中的有效性.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009507
    摘要:
    混合样本数据增强方法只注重模型对于图像所属类别的正向表达, 而忽略图像是否属于某一类别的反向判定. 为了解决描述图像类别方式单一而影响模型性能的问题, 提出一种反向目标干扰的图像数据增强方法. 该方法增加图像背景及目标的多样性, 防止网络模型过拟合. 其次采用反向学习机制, 让网络模型在正确辨别原图像所属类别的同时, 对填充图像不属于该类别的属性进行充分学习, 从而增强网络模型对原图像所属类别辨识的置信度. 最后, 为验证该方法的有效性, 使用不同的网络模型在CIFAR-10、CIFAR-100等5个数据集上进行大量实验. 实验结果表明, 本文方法与其他先进的数据增强方法相比较, 可以显著提高模型在复杂背景下的学习效果和泛化能力.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009509
    摘要:
    结肠息肉的准确分割对于切除异常组织和降低息肉转换为结肠癌的风险具有重要意义. 目前的结肠息肉分割模型在对息肉图像进行分割时存在着较高的误判率和分割精度较低的问题. 为了实现对息肉图像的精准分割, 提出了一种融合多尺度门控卷积和窗口注意力的结肠息肉分割模型(MGW-Net). 首先, 设计一种改进的多尺度门控卷积块(MGCM)取代U-Net的卷积块, 来实现对结肠息肉图像信息的充分提取. 其次, 为了减少跳跃连接处的信息损失并充分利用网络底部信息, 结合改进的空洞卷积和混合增强的残差窗口注意力构建了多信息融合增强模块(MFEM), 以优化跳跃连接处的特征融合. 在CVC-ClinicDB和Kvasir-SEG数据集上的实验结果表明, MGW-Net的相似性系数分别为93.8%和92.7%, 平均交并比分别为89.4%和87.9%, 在CVC-ColonDB、CVC-300和ETIS数据集上的实验结果表明其拥有较强的泛化性能, 从而验证了MGW-Net可以有效地提高对结肠息肉分割的准确性和鲁棒性.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009514
    摘要:
    在输电线路防外力破坏巡检场景中, 当前部署于边缘端的轻量级目标检测算法, 存在检测精度不足、推理速度慢等问题. 针对以上问题, 本文提出一种基于全局上下文增强的稀疏卷积电网防外力破坏检测算法Fast-YOLOv5. 基于YOLOv5算法, 设计了FasterNet+网络作为新的特征提取网络, 在保持检测精度的同时, 提升模型的推理速度, 并降低计算复杂度; 在算法的瓶颈层中, 设计了具有高效通道注意力的ECAFN模块, 通过自适应地校准通道方向上的特征响应, 高效获取跨通道的交互信息来提升检测效果, 并进一步减少参数量和计算量; 提出了具有上下文增强的稀疏卷积网络SCN替换模型的检测层, 通过捕获全局上下文信息来增强前景焦点特征, 提高模型的预测能力. 实验结果表明, 改进后的模型与原模型相比, 精度提升了1.9%, 检测速度提升了1倍, 达到56.2 FPS, 参数量和计算量分别下降了50%和53%, 更符合输电线路高效检测的要求.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009525
    摘要:
    为了解决现有遥感图像超分辨率重建模型对长期特征相似性和多尺度特征相关性关注不足的问题, 提出了一种基于跨尺度混合注意力机制的遥感图像超分辨率重建算法. 首先提出了一个全局层注意力机制(global layer attention, GLA), 利用层注意力机制加权融合不同层级的全局特征, 建模低分辨率与高分辨率图像特征间的长期依赖关系. 同时, 设计了跨尺度局部注意力机制(cross-scale local attention, CSLA), 在多尺度的低分辨率特征图中寻找与高分辨率图像匹配的局部信息补丁, 并融合不同尺度的补丁特征, 以优化模型对图像细节信息的恢复能力. 最后, 提出一种局部信息感知损失函数来指导图像的重建过程, 进一步提高了重建图像的视觉质量和细节保留能力. 在UC-Merced数据集上的实验结果表明, 本文方法在3种放大倍数下的平均PSNR/SSIM优于大多数主流方法, 并在视觉效果方面展现出更高的质量和更好的细节保留能力.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009526
    摘要:
    书法字文档图像在不良光照条件下的灰度值分布差异较大, 低光照区域图像对比度较低、笔画形态纹理特征出现退化, 传统方法通常仅考虑了局部信息的均值、平方差、熵等因素, 在形态纹理方面考虑较少, 从而对低对比度区域的特征信息不敏感. 针对此类问题, 本文提出了一种多维侧窗聚类分块的退化书法文档的二值化方法CS-SWF (clustering segmentation based SWF), 该方法首先利用SWF卷积核描述具有相似形态学特征的像素块, 之后提出多种修正规则利用下采样提取低纬度信息去修正特征区域. 最后, 对特征图中聚类块进行前后景分离, 得到二值化结果图. 本文使用FMPSNRDRD为指标, 将现有方法和本文方法进行对比, 实验结果表明, 在自建的100张手写退化文档图像数据集下, 本文方法在低对比度暗部区域的二值化效果较为稳定, 在精准度和鲁棒性上优于对比算法.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009527
    摘要:
    为预防和减少WUI火灾的发生, 挖掘WUI火灾关键致灾因子, 厘清致灾因子间的作用机制. 本文首先基于本文挖掘技术从WUI火灾事故案例中得到致灾因子, 使用Apriori算法得到致灾因子之间的关联规则. 然后使用复杂网络理论构建WUI火灾致灾因子网络, 计算网络拓扑特征参数, 探析WUI火灾致灾因子网络特征. 最后引入WUI火灾致因链风险度指标, 挖掘出高风险连边, 并提出断链措施. 结果表明: WUI火灾致灾因子网络具有小世界特性, 高温、强风、干旱等对其他致灾因子影响较大. 燃烧废弃物、植物起火、应急响应速度、人为纵火、强风在不同致灾因子转换中具有重要作用, 应加强管控. 网络中风险度最高的边是燃烧废弃物→植物起火, 通过颁布禁止擅自燃烧废弃物等规定, 即可切断该风险链, 实现对WUI火灾的预防和主动控制.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009528
    摘要:
    多器官医学图像分割有助于医生做出临床诊断. 针对CNN提取全局特征能力弱, Transformer提取局部特征能力弱, 以及Transformer具有二次方计算复杂度的问题, 提出了用于多器官医学图像分割的多级特征交互Transformer模型. 所提模型采用CNN提取局部特征, 局部特征经Swin Transformer输出全局特征; 通过下采样分别产生多级局部和全局特征, 每级局部和全局特征经过交互并增强; 每级增强后的特征经多级特征融合模块进行交叉融合; 再次融合后的特征经过上采样和分割头输出分割掩码. 所提模型在Synapse和ACDC数据集上进行实验, 平均DSC和平均HD95系数值为80.16%和19.20 mm, 均优于LGNet和RFE-UNet等代表性模型. 该模型对多器官医学图像分割是有效的.
    优先出版日期:  2024-04-19 , DOI: 10.15888/j.cnki.csa.009533
    摘要:
    在低照度环境下拍摄到的视频往往有对比度低、噪点多、细节不清晰等问题, 严重影响后续的目标检测、分割等计算机视觉任务. 现有的低照度视频增强方法大都是基于卷积神经网络构建的, 由于卷积无法充分利用像素之间的长程依赖关系, 生成的视频往往会有部分区域细节丢失、颜色失真的问题. 针对上述问题, 提出了一种局部与全局相融合的孪生低照度视频增强网络模型, 通过基于可变形卷积的局部特征提取模块来获取视频帧的局部特征, 并且设计了一个轻量级自注意力模块来捕获视频帧的全局特征, 最后通过特征融合模块对提取到的局部特征和全局特征进行融合, 指导模型能生成颜色更真实、更具细节的增强视频. 实验结果表明, 本方法能有效提高低照度视频的亮度, 生成颜色和细节都更丰富的视频, 并且在峰值信噪比和结构相似性等评价指标中也都优于近几年提出的方法.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009518
    摘要:
    合成孔径雷达(SAR)图像为土地覆盖分类提供了重要的时序数据源. 现有的时间序列匹配算法可以充分挖掘时序特征的相似性信息, 从而获得较好的分类效果. 本文引入了综合考虑形状相似性和物候差异的经典时序匹配算法TWDTW (time weighted dynamic time warping)指导SAR土地覆盖分类, 并针对传统TWDTW仅考虑单一特征时间序列上的相似性匹配问题, 提出了一种基于多特征联合的时间加权动态时间规整算法(Mult-TWDTW). 该方法首先提取后向散射系数、干涉相干性以及双极化雷达植被指数(dual polarization radar vegetation Index, DpRVI) 这3种特征, 然后在TWDTW算法基础上联合多个特征设计了Mult-TWDTW模型. 为验证所提方法的有效性, 使用Sentinel-1A时序数据在丹江口区域完成土地覆盖分类, 并将Mult-TWDTW与MLP、1D-CNN、K-means、SVM和使用单特征的TWDTW算法进行对比. 实验结果显示, Mult-TWDTW算法得到了最好的分类效果, 总体精度和Kappa系数可以达到95.09%和91.76, 表明Mult-TWDTW算法有效联合了多个特征信息, 能够提升时序匹/配算法在多种土地覆盖类别分类中的潜力.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009519
    摘要:
    在数字化的时代里, 越来越多人偏爱在电商平台购物, 随着农产品电商平台的发展, 消费者面对众多选择时难以找到适合自己的产品. 为了提高用户满意度和购买意愿, 农产品电商平台需要根据用户的兴趣偏好向其推荐合适的农产品. 考虑到季节、地域、用户兴趣和农产品属性等多种农业特征, 通过特征交互可以更好地捕捉用户需求. 传统的点击通过率CTR (click through rate)预测模型只关注用户评分, 以简单的方式计算特征交互, 而忽略了特征交互的重要性. 本文提出了一种名为细粒度特征交互选择网络FgFisNet (fine-grained feature interaction selection networks)的新模型. 该模型通过引入细粒度交互层和特征交互选择层, 组合内积和哈达玛积有效的学习特征交互, 然后在训练过程中自动识别重要的特征交互, 并删除冗余的特征交互, 最后将重要的特征交互和一阶特征输入到深度神经网络, 得到最终的CTR预测值. 在农产品电商真实数据集上进行广泛的实验, FgFisNet方法取得了显著的经济效益.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009515
    摘要:
    针对现有的图像质量评价方法较少利用人眼视网膜和视觉皮层的颜色编码机制, 并且未能充分考虑图像色彩信息对图像质量的影响, 提出了一种基于多视觉特征的可见光(微光)与红外彩色融合图像色彩和谐性客观评价模型. 该模型在图像质量评估中融入了更多的颜色信息, 综合考虑多种人眼视觉特征包括视觉对立色彩特征、色彩信息波动特征和高级视觉内容特征, 经过特征融合和支持向量回归训练, 实现彩色融合图像的色彩和谐性客观评价. 采用3种典型场景融合图像数据库进行实验比较与分析. 实验结果表明, 与现有的8种图像质量客观评价方法相比, 所提出的方法与人眼主观感受更加一致, 具有较高的预测准确度.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009516
    摘要:
    网络功能虚拟化技术的兴起使得实例化为服务功能链(SFC)的网络服务能够共享基底网络, 缓解了传统网络体系结构僵化的问题. 然而, 网络中大量服务请求给多域SFC编排带来了新的挑战. 首先由于域内网络资源信息及内部策略的保密性, 使得多域SFC的编排更为复杂. 其次多域SFC编排要确定最佳候选编排域集, 先前的研究较少考虑域间负载的均衡性, 对服务接受率造成了消极影响. 此外跨网络域编排服务请求对服务的成本和响应时间提出了更严格的要求. 为解决上述挑战, 在本文中, 我们首先针对多域网络隐私性需求, 提出了域级图的构造方法; 然后基于域间负载均衡提出了域权重的计算方法进行SFC编排域的选择; 最后, 针对多域网络成本和响应时间需求, 提出编排算法. 实验结果表明, 提出的算法有效地权衡了平均服务成本和接受率, 并且在服务平均响应时间方面也得到了优化.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009517
    摘要:
    本文提出一种低集群计算资源条件下, 大规模轨迹类数据同时空关系的快速连接查询算法DPCP-CROSS-JOIN. 该算法通过对轨迹数据时间字段进行分段交叉编码和位置网格化等方式对连续的轨迹数据离散化, 并以日期和网格区域编码进行两级分区存储. 通过交叉“等值”连接查询, 实现时空连接查询的3级索引, 4级加速, 将$n\cdot n $对象间同时空关系连接查询时间复杂度从O(n2)降为O(nlogn). 在Hadoop集群上使用Hive和TEZ等进行大规模轨迹数据连接查询时能将连接查询效率最高提升到30.66倍. 该算法以时间段编码作为关联条件, 巧妙绕开连接过程中复杂表达式的实时计算, 以“等值”替代复杂表达式计算连接, 提高MapReduce任务并行度, 提升集群存储和计算资源利用率. 在面对仅使用一般优化已几乎无法完成的, 更大规模类似任务, 仍能在数分钟内完成. 实验表明, 该算法具有高效和稳定等特性, 尤其适用低“算力”资源条件下大规模轨迹数据的同时空关系连接查询. 此方法还可作为时空轨迹伴随查找, 对象间关系亲密度判定等的原子算法, 可广泛应用于维护国家安全、社会治安秩序, 预防和打击犯罪, 辅助城乡规划统筹等领域.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009511
    摘要:
    在联邦学习环境中选取适宜的优化器是提高模型性能的有效途径, 尤其在数据高度异构的情况下. 本文选取FedAvg算法与FedALA算法作为主要研究对象, 并提出其改进算法pFedALA. pFedALA通过令客户端在等待期间继续本地训练, 有效降低了由于同步需求导致的资源浪费. 在此基础上, 本文重点分析这3种算法中优化器的作用, 通过在MNIST和CIFAR-10数据集上测试, 比较了SGD、Adam、ASGD以及AdaGrad等多种优化器在处理非独立同分布(Non-IID)、数据不平衡时的性能. 其中重点关注了基于狄利克雷分布的实用异构以及极端的异构数据设置. 实验结果表明: 1) pFedALA算法呈现出比FedALA算法更优的性能, 表现为其平均测试准确率较FedALA提升约1%; 2)传统单机深度学习环境中的优化器在联邦学习环境中表现存在显著差异, 与其他主流优化器相比, SGD、ASGD与AdaGrad优化器在联邦学习环境中展现出更强的适应性和鲁棒性.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009512
    摘要:
    航拍高分辨率图像的场景类别多且类间相似度高, 经典的基于深度学习的分类方法, 由于在提取特征过程中会产生冗余浮点运算, 运行效率较低, FasterNet通过部分卷积提高了运行效率但会降低模型的特征提取能力, 从而降低模型的分类精度. 针对上述问题, 提出了一种融合FasterNet和注意力机制的混合结构分类方法. 首先采用“十字型卷积模块”对场景特征进行部分提取, 以提高模型运行效率. 然后采用坐标注意力与通道注意力相融合的双分支注意力机制, 以增强模型对于特征的提取能力. 最后将“十字型卷积模块”与双分支注意力模块之间进行残差连接, 使网络能训练到更多与任务相关的特征, 从而在提高分类精度的同时, 减小运行代价, 提高运行效率. 实验结果表明, 与现有基于深度学习的分类模型相比, 所提出的方法, 推理时间短而且准确率高, 参数量为19M, 平均一张图像的推理时间为7.1 ms, 在公开的数据集NWPU-RESISC45、EuroSAT、VArcGIS (10%)和VArcGIS (20%)的分类精度分别为96.12%、98.64%、95.42%和97.87%, 与FasterNet相比分别提升了2.06%、0.77%、1.34%和0.65%.
    优先出版日期:  2024-04-07 , DOI: 10.15888/j.cnki.csa.009513
    摘要:
    为了解决在街道场景图像语义分割任务中传统U-Net网络在多尺度类别下目标分割的准确率较低和图像上下文特征的关联性较差等问题, 提出一种改进U-Net的语义分割网络AS-UNet, 实现对街道场景图像的精确分割. 首先, 在U-Net网络中融入空间通道挤压激励(spatial and channel squeeze & excitation block, scSE)注意力机制模块, 在通道和空间两个维度来引导卷积神经网络关注与分割任务相关的语义类别, 以提取更多有效的语义信息; 其次, 为了获取图像的全局上下文信息, 聚合多尺度特征图来进行特征增强, 将空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)多尺度特征融合模块嵌入到U-Net网络中; 最后, 通过组合使用交叉熵损失函数和Dice损失函数来解决街道场景目标类别不平衡的问题, 进一步提升分割的准确性.实验结果表明, 在街道场景Cityscapes数据集和CamVid数据集上AS-UNet网络模型的平均交并比(mean intersection over union, MIoU)相较于传统U-Net网络分别提高了3.9%和3.0%, 改进的网络模型显著提升了对街道场景图像的分割效果.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009510
    摘要:
    卷积神经网络(CNN)作为医学图像分割领域中U-Net基线网络的重要组成部分, 其主要作用是处理局部特征信息之间的关系. 而Transformer是一种能够有效强化特征信息之间的远距离依赖关系的视觉模型. 目前的研究表明, 结合Transformer和CNN可以在一定程度上提高医学图像分割的准确性. 但是, 由于医学图像的标注数据较少, 而且训练Transformer模型需要大量数据, 这使得Transformer模型面临耗时长和参数量大的挑战. 基于这些考虑, 本文在UNeXt模型的基础上, 结合多尺度混合MLP和CNN, 提出了一种新型的基于混合MLP的医学图像分割模型——LM-UNet. 这种模型能够有效地增强局部与全局信息之间的联系, 并加强特征信息间的融合. 在多个数据集上的实验表明, LM-UNet模型在皮肤数据集上的分割性能明显提升, 平均Dice系数达到92.58%, 平均IoU系数达到86.52%, 分别比UNeXt模型提高了3%和3.5%. 在软骨和乳腺数据集上的分割效果也有显著提升, 平均Dice系数分别比UNeXt提高了2.5%和1.0%. 因此, LM-UNet模型不仅提高了医学图像分割的准确性, 还增强了其泛化能力.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009499
    摘要:
    准确预测风电功率对于提高电力系统的效率和安全性具有重要意义, 而风能的间歇性和随机性特点导致风电功率难以准确预测. 因此, 提出一种改进Informer的风电功率预测模型PCI-Informer (PATCH-CNN-IRFFN-Informer). 将序列数据划分为子序列级补丁, 并进行特征提取和整合, 提高模型对序列数据的处理能力和效果; 采用多尺度因果卷积自注意力机制, 实现多尺度局部特征融合, 提高模型对局部信息的理解和建模能力; 引入反向残差前馈网络 (IRFFN), 增强模型对局部结构信息的提取和保留能力. 某风电场数据实验结果表明, 与主流预测模型相比, PCI-Informer模型在不同预测步长下均取得了更好的预测效果, 在MAE指标上相比Informer模型平均降低了11.1%, 有效提高了短期风电功率的预测精度.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009500
    摘要:
    GSNet使用抓取度区分杂乱场景的可抓取区域, 显著地提高了杂乱场景中机器人抓取位姿检测准确性, 但是GSNet仅使用一个固定大小的圆柱体来确定抓取位姿参数, 而忽略了不同大小尺度的特征对抓取位姿估计的影响. 针对这一问题, 本文提出了一个多尺度圆柱体注意力特征融合模块(Ms-CAFF), 包含注意力融合模块和门控单元两个核心模块, 替代了GSNet中原始的特征提取方法, 使用注意力机制有效地融合4个不同大小圆柱体空间内部的几何特征, 从而增强了网络对不同尺度几何特征的感知能力. 在大规模杂乱场景抓取位姿检测数据集GraspNet-1Billion的实验结果表明, 在引入模块后将网络生成抓取位姿的精度最多提高了10.30%和6.65%. 同时本文将网络应用于实际实验, 验证了方法在真实场景当中的有效性.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009504
    摘要:
    网络连接数据的统计推断问题已成为近年来统计学研究的热点问题. 传统模型中样本数据间的独立性假设通常不能满足现代网络连接数据的分析需求. 本文研究了网络连接数据中每个节点的独立效应, 并借助融合惩罚的思想, 使得相互连接节点的独立效应趋同. 同时借助仿变量方法(Knockoff)仿冒原始变量的数据依赖结构、构造与目标变量无关的属性特征, 提出了针对网络连接数据进行变量选择的仿变量方法(NLKF). 从理论上证明了NLKF方法将变量选择的错误发现率(FDR)控制在目标水平. 对于原始数据协方差未知的情形, 使用估计的协方差矩阵仍具有上述良好的统计性质. 通过与传统变量选择方法Lasso对比, 说明了本文方法的可靠性. 最后结合因子投资领域2022年1–12月中国A股市场4000只股票的200个因子数据及每只股票所属申万一级行业构造的网络关系, 给出模型的应用实例.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009505
    摘要:
    脉冲神经网络作为人工智能发展的重要方向之一, 在神经形态工程和类脑计算领域得到了广泛的关注. 为解决脉冲神经网络泛化性差、内存和时间消耗较大等问题, 本文提出了一种基于脉冲神经网络的时空交互图像分类方法. 首先引入时间有效训练算法弥补梯度下降过程中的动能损失; 其次融合空间随时间学习算法, 提高网络对信息的高效处理能力; 最后添加空间注意力机制, 增强网络对空间维度上重要特征的捕捉能力. 实验结果表明, 改进后的方法在CIFAR10、DVS Gesture、CIFAR10-DVS这3个数据集上的训练内存占用分别减少了46.68%、48.52%、10.46%, 训练速度分别提升了2.80倍、1.31倍、2.76倍, 在保证精度的情况下, 网络性能得到有效提升.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009508
    摘要:
    抽象神经网络在文本摘要领域取得了长足进步, 展示了令人瞩目的成就. 然而, 由于抽象摘要的灵活性, 它很容易造成生成的摘要忠实性差的问题, 甚至偏离源文档的语义主旨. 针对这一问题, 本文提出了两种方法来提高摘要的保真度. (1)由于实体在摘要中起着重要作用, 而且通常来自于原始文档, 因此本文提出允许模型从源文档中复制实体, 确保生成的实体与源文档中的实体相匹配, 这有助于防止生成不一致的实体. (2)为了更好地防止生成的摘要与原文产生语义偏离, 本文在摘要生成过程中使用关键实体和关键token作为两种不同粒度的指导信息以指导摘要的生成. 本文使用 ROUGE指标在两个广泛使用的文本摘要数据集CNNDM和XSum上评估了本文方法的性能, 实验结果表明, 这两种方法在提高模型性能方面都取得了显著的效果. 此外, 实验还证明了实体复制机制可以在一定程度上借助指导信息以纠正引入的语义噪声.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009487
    摘要:
    针对现有孪生网络目标跟踪技术只对模板特征和搜索特征进行一次融合操作, 使得融合特征图上的目标特征相对粗糙, 不利于跟踪器精确跟踪定位的问题, 本文设计了一个串联互相关模块, 旨在利用现有的互相关方法, 对模板特征和搜索特征做多次的互相关操作增强融合特征图上的目标特征, 提升后续分类和回归结果的准确性, 以更少的参数实现速度和精度之间的平衡. 实验结果表明, 所提出的方法在4个主流跟踪数据集上都取得了很好的结果.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009488
    摘要:
    本研究致力于深入探讨社交网络中舆论形成的复杂过程, 尤其是关注去中心化环境下达成共识的机制. 研究提出了一种新的意见分类策略, 即第二置信区间. 该策略旨在对传统DeGroot共识模型进行改进, 从而发展出两种不同的意见动态模型: FAI模型和ORA模型. 这些模型综合考虑了个体对周围意见的接受程度和重视程度, 并通过对社交网络中邻域意见的深入分析, 对个体模型进行了全面设置, 涵盖私人意见、表达意见、固执度以及偏好等多重因素. 研究结果表明, 在特定参数设定下, FAI模型和ORA模型均能比原DeGroot模型更加迅速地达成共识. 具体来说, ORA模型的收敛速度在700步长左右, 而FAI模型的收敛速度随参数值的增加而逐步接近ORA模型. 相较于基准模型, ORA模型在收敛意见值上的差异较小, 不超过3.5%, 而FAI模型则显示出更大的波动性. 这些发现不仅加深了对于社交网络中公共意见形成机制的理解, 也强调了个体邻域内意见动力学在共识形成过程中的重要性, 为此领域的未来研究提供了新的视角和研究方向.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009489
    摘要:
    联邦学习系统中, 在资源受限的边缘端进行本地模型训练存在一定的挑战. 计算、存储、能耗等方面的限制时刻影响着模型规模及效果. 传统的联邦剪枝方法在联邦训练过程中对模型进行剪裁, 但仍存在无法根据模型所处环境自适应修剪以及移除一些重要参数导致模型性能下降的情况. 本文提出基于联邦强化学习的分布式模型剪枝方法以解决此问题. 首先, 将模型剪枝过程抽象化, 建立马尔可夫决策过程, 使用DQN算法构建通用强化剪枝模型, 动态调整剪枝率, 提高模型的泛化性能. 其次设计针对稀疏模型的聚合方法, 辅助强化泛化剪枝方法, 更好地优化模型结构, 降低模型的复杂度. 最后, 在多个公开数据集上将本方法与不同基线方法进行比较. 实验结果表明, 本文所提出的方法在保持模型效果的同时减少模型复杂度.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009493
    摘要:
    针对传统工业管道腐蚀率预测模型存在特征提取依赖人工经验和泛化能力不足的问题, 本文将卷积神经网络(convolutional neural network, CNN)和长短期记忆网络(long short-term memory, LSTM)相结合, 提出了基于布谷鸟优化算法(cuckoo search, CS)的CNN-LSTM-CS网络模型, 实现对工业管道腐蚀率预测. 首先, 对采集的管道腐蚀数据集进行归一化预处理; 然后, 利用CNN网络提取影响管道腐蚀率因素的深层次特征信息, 并通过训练LSTM网络构建CNN-LSTM预测模型; 最后, 采用CS算法对预测模型进行参数优化, 减少预测误差, 实现腐蚀率的精准预测. 实验结果表明, 对比几种典型的腐蚀率预测方法, 本文提出的方法具有更高的预测精度, 为工业管道腐蚀率检测提供新的思路.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009494
    摘要:
    在同伴互评过程中, 评估者会因为战略性评估而导致评估分数不准确. 本文考虑了评估者之间的社交利益关系, 提出了一种融合社交利益与图注意力网络的同伴互评分数预测方法GAT-SIROAN. 该方法由表示评估者与解决方案关系的加权网络SIROAN以及用来预测同伴互评分数的图注意力网络GAT构成. 在SIROAN中使用ITSA方法定义了评估者的两个特征: 自我评分能力和同伴评分能力, 并通过比较这两个特征来获取评估者之间的社交利益因子和关系. 在分数预测环节, 为了考虑每个节点的重要性, 使用自注意力机制来计算节点的注意力系数, 以此来提高预测能力. 采用最小化其均方根误差来学习网络的参数, 从而获取更准确的同伴互评预测分数. GAT-SIROAN在真实数据集上与平均值、中位数、PeerRank、RankwithTA以及GCN-SOAN这5个基线方法进行了对比实验, 结果表明GAT-SIROAN在RMSE指标上均优于基线方法.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009496
    摘要:
    MonteCloPi算法是一种基于蒙特卡洛树搜索(Monte Carlo tree search, MCTS)的任意时间子群发现算法, 旨在使用MCTS策略构建非对称的最佳优先搜索树来发现高质量的多样性模式集, 但是限制了目标为二值变量. 为此, 本文结合了数值目标的特点, 通过为置信度上界(upper confidence bound, UCB)公式选取合适的C值、动态调整各个样本的拓展权重并对搜索树进行剪枝、使用自适应top-k均值更新策略, 将MonteCloPi算法拓展到了数值目标. 最后, 在 UCI 数据集、全国健康与营养调查(national health and nutrition examination survey, NHANES)听力测试数据集上的实验结果表明本文的算法相比其他算法可以发现更高质量的多样性模式集, 并且最优子群的可解释性也更好.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009497
    摘要:
    在短文本意图识别领域, 卷积神经网络(CNN)因其在局部信息提取方面的优异性能而备受关注. 然而, 由于其难以捕捉短文本语料的全局特征, 因此存在一定局限性. 针对该问题, 本文结合TextCNN和BiGRU-att的优点提出一个双通道短文本意图识别模型, 利用局部特征和全局特征更好地识别短文本的意图, 弥补模型对文本整体特征的不足. AB-CNN-BGRU-att模型首先利用ALBERT多层双向Transformer结构对输入的文本向量化, 再将向量分别送入TextCNN和BiGRU网络模型以获取局部和全局特征. 将这两种特征进行融合, 并通过全连接层并输入Softmax函数得到意图标签. 实验结果表明, 在THUCNews_Title数据集上, 本文提出的AB-CNN-BGRU-att算法准确率(Acc)达到了96.68%, F1值达到了96.67%, 相较于其他常用意图识别模型表现出更佳的性能.
    优先出版日期:  2024-04-01 , DOI: 10.15888/j.cnki.csa.009498
    摘要:
    本文针对永磁同步电机(PMSM)在工业领域中的多变量、非线性和强耦合特性以及传统PID控制在应对其变化时可能导致参数调整困难、响应延迟、鲁棒性差以及适应性问题, 提出一种结合双延迟深度确定性策略梯度(TD3)算法和PID控制的创新方案, 以优化PID参数调整, 实现更精确的电机速度控制. 在本文的方法中, 融合双向长短期记忆网络(BiLSTM)到Actor和Critic网络中, 极大增强了对PMSM动态行为的时间序列数据处理能力, 使得系统不仅能够准确捕捉当前状态, 还能预测未来趋势, 从而实现对PID参数更精确和适应性强的自整定. 此外, 通过整合熵正则化和好奇心驱动的探索方法进一步增强策略的多样性, 避免过早收敛到次优策略, 并鼓励模型对未知环境进行深入探索. 为验证方法的有效性, 设计了一个永磁同步电机的仿真模型, 并将本文提出的方法BiLSTM-TD3-ICE与传统的TD3以及经典的Ziegler-Nichols (Z-N)方法进行对比. 实验结果充分证明了本文提出的策略在控制性能上具有显著的优势.
    优先出版日期:  2024-03-22 , DOI: 10.15888/j.cnki.csa.009482
    摘要:
    光学相干断层成像(optical coherence tomography, OCT)是一种具有无接触、高分辨率等特点的新型眼科医学诊断方法, 现在已经作为医生临床诊断眼科疾病的重要参考物, 但人工分类疾病费时费力, 视网膜病变的早期发现和临床诊断至关重要. 为了解决该类问题, 本文提出了一种基于改进MobileNetV2神经网络对视网膜OCT图像多分类识别方法. 此方法利用特征融合技术处理图像并设计增加注意力机制改进网络模型, 二者在极大程度上提高OCT图像的分类准确率. 与原有算法相比, 分类效果具有明显提升, 本文模型的分类准确率、召回值、精确度、F1值分别达到98.3%、98.44%、98.94%、98.69%, 已经超越人工分类的准确率. 此类方法不仅在实际诊断中加快诊断流程、降低医生负担、提高诊断质量, 同时也为眼科医疗研究提供新的方向.
    优先出版日期:  2024-03-22 , DOI: 10.15888/j.cnki.csa.009483
    摘要:
    为了解决会话推荐系统中数据稀疏性问题, 提出了一种基于注意力机制的自监督图卷积会话推荐模型(self-supervised graph convolution session recommendation based on attention mechanism, ATSGCN). 该模型将会话序列构建成3个不同的视图: 超图视图、项目视图和会话视图, 显示会话的高阶和低阶连接关系; 其次, 超图视图使用超图卷积网络来捕获会话中项目之间的高阶成对关系, 项目视图和会话视图分别使用图卷积网络和注意力机制来捕获项目和会话级别局部数据中的低阶连接信息; 最后, 通过自监督学习使两个编码器学习到的会话表示之间的互信息最大化, 从而有效提升推荐性能. 在Nowplaying和Diginetica两个公开数据集上进行对比实验, 实验结果表明, 所提模型性能优于基线模型.
    优先出版日期:  2024-03-22 , DOI: 10.15888/j.cnki.csa.009484
    摘要:
    时空预测任务在污染治理、交通、能源、气象等领域应用广泛. PM2.5浓度预测作为典型的时空预测任务, 需要对空气质量数据中的时空依赖关系进行分析和利用. 现有时空图神经网络(ST-GNNs)研究所使用的邻接矩阵使用启发式规则预定义, 无法准确表示站点之间的真实关系. 本文提出了一种自适应分层图卷积神经网络(AHGCNN)用于PM2.5预测. 首先, 引入了一种分层映射图卷积架构, 在不同层级上使用不同的自学习邻接矩阵, 以有效挖掘不同站点之间独特的时空依赖. 其次, 以基于注意力的聚合机制连接上下层邻接矩阵, 加速收敛过程. 最后, 将隐藏的空间状态与门控循环单元相结合, 形成一个统一的预测架构, 同时捕捉多层次的空间依赖关系和时间依赖关系, 提供最终的预测结果. 实验中, 我们与7种主流预测模型进行对比, 结果表明该模型可以有效获取空气监测站点之间的时空依赖, 提高预测精确度.
    优先出版日期:  2024-03-22 , DOI: 10.15888/j.cnki.csa.009506
    摘要:
    针对工业场景下带钢表面缺陷样本少、缺陷尺寸大小不一等问题, 提出一种适用于小样本条件下的带钢表面缺陷检测网络. 首先, 算法以YOLOv5s框架为基础, 设计一种融合注意力机制的多尺度路径聚合网络作为模型的颈部, 增强模型对缺陷目标的多尺度预测能力; 其次, 提出一种自适应解耦检测结构, 缓解小样本情况下分类和定位任务之间的矛盾; 最后, 提出一种融合Wasserstein距离的边界框回归损失函数, 提升模型对小目标缺陷的检测精度. 实验表明, 在构建的小样本带钢表面缺陷数据集上, 本文模型的检测性能优于其他小样本检测模型, 更适用于工业环境下的小样本缺陷检测任务.
    优先出版日期:  2024-03-22 , DOI: 10.15888/j.cnki.csa.009502
    摘要:
    先前基于深度学习进行临近降水预报的方法试图在统一架构中建模雷达回波的时空演变, 然而, 这些方法可能难以完全捕捉到这种复杂的时空关系. 本文提出了一种基于Halo注意力机制的双阶段临近降水预报网络, 该网络将降水预测的时空演变过程分为运动趋势预测和空间外观重建两个阶段. 首先, 可学习光流模块对雷达回波的运动趋势进行建模并生成粗略的预测结果. 其次, 特征重建模块对历史雷达回波序列的空间外观变化建模并对粗粒度预测结果的空间外观进行特征细化重建, 生成精细的雷达回波图. 通过在CIKM数据集上的实验表明, 本文所提出的方法与主流方法相比, 平均的海德克技能得分和关键成功指数分别提高了4.60%和3.63%, 达到了0.48和0.45; 结构相似性提高了4.84%, 达0.52; 均方误差降低了6.13%, 达70.23.
    优先出版日期:  2024-03-15 , DOI: 10.15888/j.cnki.csa.009485
    摘要:
    不同于基于外形的步态识别方法, 基于关键点的步态识别方法采取人体关键点作为模型的输入, 能够有效避免数据集带来的背景噪声干扰; 其次, 现有的基于关键点的步态识别方法忽略了人体结构先验知识的利用, 且更倾向于提取局部特征, 从而忽略了全局上的关联性. 本文提出了一个基于关键点的步态识别框架GaitBody, 能够从步态关键点序列中提取更有分辨性的特征. 首先, 我们设计了带有较大卷积核的多尺度卷积模块来提取多粒度的时序特征; 其次, 我们利用自注意力机制来提取空间特征, 并在此基础上引入了人体结构拓扑信息来进一步利用人体结构的先验知识; 最后, 为了更好使用时序信息, 我们生成最有代表性的时序特征, 并将其引入到自注意模块来融合时序和空间特征. 在CASIA-B和OUMVLP-Pose数据集上的实验结果表明, 我们的方法在基于关键点的步态识别方法上取得了最优结果, 消融实验也证明了各个模块的有效性.
    优先出版日期:  2024-03-15 , DOI: 10.15888/j.cnki.csa.009495
    摘要:
    本文针对多房间的移动机器人内墙作业的路径规划任务, 提出一种两阶段路径规划方法. 第1阶段针对沿墙作业过程中环境存在灰尘或雾气造成的传感器失效问题, 以及房间多出口时路径规划不完整问题, 我们提出起点自动选择沿墙路径规划方法, 基于栅格地图离线生成沿墙规划路径. 第2阶段, 针对点到点路径规划过程中的动态避障问题, 我们提出一种基于PSAC (prioritized experience replay soft actor critic)算法的点到点路径规划方法, 在软行动者-评论家(soft actor critic, SAC)的中引入优先级经验回放策略, 实现机器人的动态避障. 实验部分设计了沿墙路径规划对比实验和动态避障的对比实验, 验证本文所提出的方法在室内沿墙路径规划和点到点路径规划的有效性.
    优先出版日期:  2024-03-15 , DOI: 10.15888/j.cnki.csa.009490
    摘要:
    针对负荷数据复杂性、非平稳性以及负荷预测误差较大等问题, 提出一种综合特征构建和模型优化的短期电力负荷预测新方法. 首先采用最大信息系数(MIC)分析特征变量的相关性, 选取与电力负荷序列相关的特征变量, 同时, 考虑变分模态分解(VMD)方法容易受主观因素的影响, 采用霜冰优化算法(RIME)优化VMD, 完成原始电力负荷序列的分解. 然后改进长短期时间序列网络(LSTNet)作为预测模型, 将其递归层LSTM更新为BiLSTM, 并引入卷积块注意力机制(CBAM)进行预测. 通过对比实验和消融实验的结果表明: 经RIME-VMD优化后, LSTM、GRU、LSTNet模型预测的均方根误差(RMSE)均降低20%以上, 显著提高模型预测精度, 且能够适应于不同预测模型. 所提出的BLSTNet-CBAM模型与LSTM、GRU、LSTNet相比, RMSE分别降低了35.54%、6.78%、1.46%, 提高了短期电力负荷预测的准确性.
    优先出版日期:  2024-03-15 , DOI: 10.15888/j.cnki.csa.009492
    摘要:
    在当前视频多模态情感分析研究中, 存在着未充分考虑模态之间的动态独立性和模态融合缺乏信息流控制的问题. 为解决这些问题, 本文提出了一种结合模态表征学习的多模态情感分析模型. 首先, 通过使用BERT和LSTM分别挖掘文本、音频和视频的内在信息, 其次, 引入模态表征学习, 以获得更具信息丰富性的单模态特征. 在模态融合阶段, 融合了门控机制, 对传统的Transformer融合机制进行改进, 以更精确地控制信息流. 在公开数据集CMU-MOSI和CMU-MOSEI的实验结果表明, 与传统模型相比, 准确性和F1分数都有所提升, 验证了模型的有效性.
    优先出版日期:  2024-01-30 , DOI: 10.15888/j.cnki.csa.009471
    摘要:
    当前无人机图像中存在小目标数量众多、背景复杂的特点, 目标检测中易造成漏检误检率较高的问题, 针对这些问题, 提出一种高阶深度可分离无人机图像小目标检测算法. 首先, 结合CSPNet结构与ConvMixer网络, 深度可分离卷积核, 获取梯度结合信息, 并引入递归门控卷积C3模块, 提升模型的高阶空间交互能力, 增强网络对小目标的敏感度; 其次, 检测头采用两个头部进行解耦, 分别输出特征图分类和位置信息, 加快模型收敛速度; 最后, 使用边框损失函数EIoU, 提高检测框精准度. 在VisDrone2019数据集上的实验结果表明, 该模型检测精度达到了35.1%, 模型漏检率和误检率有明显下降, 能够有效地应用于无人机图像小目标检测任务. 在DOTA 1.0数据集和HRSID数据集上进行模型泛化能力测试, 实验结果表明, 该模型具有良好的鲁棒性.
    优先出版日期:  2023-11-28 , DOI: 10.15888/j.cnki.csa.009377
    摘要:
    随着计算机技术的不断发展, 过程模拟在各行各业中的应用越来越广泛. 过程模拟使用模拟模型来模仿业务流程行为, 它可以用于预测和优化系统的性能, 评估决策的影响并向管理者提供决策依据, 也可以用于减少实验成本和时间. 目前, 如何高效地去构建一个可以信任的仿真模型得到了广泛关注. 本文通过追踪、归纳和分析关于构建业务过程模拟模型方法的相关研究文献, 对基于过程模型、系统动力学和深度学习的3种仿真建模方法的流程、优缺点和研究进展进行了阐述, 并探讨了过程模拟面临的挑战和未来的发展方向, 以期为业务过程模拟未来的研究方向提供参考.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008603
    [摘要] (560) [HTML] (8) [PDF 1.10 M] (6888)
    摘要:
    电力能源的安全在国家安全中占有重要的地位. 随着电力5G通信技术的发展, 大量电力终端产生定位需求. 传统GPS定位方法存在易受欺骗的问题, 如何有效提升GPS定位的安全性成为一个亟待研究的问题. 本文提出了一种基于基站辅助的电力5G终端GPS欺骗检测算法, 利用安全性较高的基站定位来检验可能被欺骗的GPS定位, 并且引入了一致性因数用来描述GPS定位结果和基站定位结果的一致性. 通过计算一致性因数, 如果大于设定的阈值则判断发生欺骗, 反之则GPS工作正常. 实验表明, 在使用本论文模型情况下, 本算法的准确率为99.98%, 优于传统机器学习分类算法. 此外, 本方法在运行速度上相较于传统机器学习分类算法也有一定程度的提升.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12480) [HTML] (0) [PDF ] (19884)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9299) [HTML] (0) [PDF ] (29608)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9041) [HTML] (0) [PDF ] (11877)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (8391) [HTML] () [PDF 1167952] (35239)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (7467) [HTML] (0) [PDF ] (45515)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7462) [HTML] () [PDF 863160] (39900)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7057) [HTML] (0) [PDF ] (21533)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2007,16(9):22-25, DOI:
    [摘要] (6325) [HTML] (0) [PDF ] (4664)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2012,21(3):260-264, DOI:
    [摘要] (6245) [HTML] () [PDF 336300] (42493)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2011,20(7):184-187,120, DOI:
    [摘要] (6058) [HTML] () [PDF 731903] (30301)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2004,13(10):7-9, DOI:
    [摘要] (5822) [HTML] (0) [PDF ] (9534)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116, DOI:
    [摘要] (5732) [HTML] (0) [PDF ] (47340)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5672) [HTML] (0) [PDF ] (39307)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5597) [HTML] (0) [PDF ] (30233)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (5532) [HTML] (0) [PDF ] (25945)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(3):164-167, DOI:
    [摘要] (5465) [HTML] (0) [PDF ] (26850)
    摘要:
    介绍了一种基于DWGDirectX在不依赖于AutoCAD平台的情况下实现DWG文件的显示、操作、添加的简单的实体的方法,并对该方法进行了分析和实现。
    2009,18(5):182-185, DOI:
    [摘要] (5451) [HTML] (0) [PDF ] (31107)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (5430) [HTML] (15965) [PDF 672566] (12471)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2010,19(10):42-46, DOI:
    [摘要] (5391) [HTML] () [PDF 1301305] (20363)
    摘要:
    综合考虑基于构件组装技术的虚拟实验室的系统需求,分析了工作流驱动的动态虚拟实验室的业务处理模型,介绍了轻量级J2EE框架(SSH)与工作流系统(Shark和JaWE)的集成模型,提出了一种轻量级J2EE框架下工作流驱动的动态虚拟实验室的设计和实现方法,给出了虚拟实验项目的实现机制、数据流和控制流的管理方法,以及实验流程的动态组装方法,最后,以应用实例说明了本文方法的有效性。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4645) [HTML] (0) [PDF 0.00 Byte] (86032)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (3757) [HTML] (0) [PDF 0.00 Byte] (57401)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (5732) [HTML] (0) [PDF 0.00 Byte] (47338)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (7467) [HTML] (0) [PDF 0.00 Byte] (45512)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号