• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2022,31(5):1-20, DOI: 10.15888/j.cnki.csa.008463
    [摘要] (110) [HTML] (78) [PDF 2.46 M] (170)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2022,31(5):21-29, DOI: 10.15888/j.cnki.csa.008426
    [摘要] (205) [HTML] (75) [PDF 1.27 M] (175)
    摘要:
    操作系统在现代生活中具有举足轻重的地位. 为了服务于不同的硬件环境和多样的应用场景, 操作系统需要在保持性能的同时具备良好的扩展性和灵活性. 多内核操作系统, 作为一种分布式的操作系统, 是该问题的解决方案之一. 本文分析了多内核操作系统的设计原理, 调研了现有的多内核操作系统技术, 并对这些技术和一些相关技术进行了比较. 最后, 本文对多内核操作系统研究的现状与未来方向进行了总结.
    2022,31(5):30-39, DOI: 10.15888/j.cnki.csa.008467
    [摘要] (114) [HTML] (52) [PDF 2.44 M] (177)
    摘要:
    叶脉分割是叶片模式分析的一个重要步骤, 对大豆的品种识别、表型研究具有十分重要的意义. 由于大豆叶脉结构十分复杂, 叶脉所在叶片区域的低对比度, 只借助灰度信息分割叶脉一般无法取得理想的分割效果. 本文提出了一种结合多尺度灰度无约束击中或击不中变换 (UHMT) 算法和基于HSI颜色空间的色调信息处理方法的大豆叶脉分割方法. 该方法将RGB颜色空间中的灰度信息和HSI颜色空间中的色调信息, 分别用于大豆叶片图像的全局叶脉分割和局部一级、二级叶脉分割. 前者采用迭代阈值分割提取叶片区域, 通过膨胀腐蚀消除叶片外轮廓以及叶柄等干扰因素, 得到叶片区域图像, 然后, 运用多尺度灰度UHMT算法得到全局叶脉图像. 后者, 针对一级和二级叶脉分割效果差的问题, 使用色调信息扩大叶脉与其他像素点灰度值差异, 以实现局部一级、二级叶脉的分割. 将获得的全局叶脉和局部叶脉图像融合, 获得最终的大豆叶脉图像. 为验证算法的有效性, 本文使用了大豆品种叶片图像数据库SoyCultivar中的大豆叶片图像进行实验. 结果表明, 该方法比现有的叶脉分割方法好, 不仅能够完整地提取大豆叶脉, 而且能够很好地消除背景以及叶片外轮廓、叶柄等无关成分.
    2022,31(5):40-51, DOI: 10.15888/j.cnki.csa.008476
    [摘要] (137) [HTML] (67) [PDF 2.41 M] (222)
    摘要:
    单目标跟踪是计算机视觉领域中的研究热点. 传统算法如相关滤波的跟踪速度较快, 但由于提取到的颜色、灰度等手工特征较为粗糙, 跟踪精度往往不高. 近年来随着深度学习理论的发展, 使用深度特征的跟踪方法能够在跟踪的精度和速度方面达到很好的平衡. 本文首先介绍单目标跟踪的相关背景, 接着从相关滤波单目标跟踪、深度学习单目标跟踪两个阶段对单目标跟踪领域发展过程中涌现出的多个算法进行梳理, 并详细介绍目前主流的孪生网络算法. 最后通过大型数据集对近年来优秀算法进行对比分析, 针对其缺点与不足, 对该领域未来的发展前景做出展望.
    2022,31(5):52-64, DOI: 10.15888/j.cnki.csa.008459
    摘要:
    运动想象脑电信号(EEG)的模式识别方法, 一直是无创脑机接口领域的重要研究方向之一. 近年来, 深度学习进一步提升了运动想象EEG信号的识别准确率, 但面对EEG信号较强的时变性, 依然存在训练样本不足和特征维度太高等问题. 针对上述问题, 本文提出了一种新型的重叠时间切片训练策略, 在现有的时间切片策略基础上(cropped), 采用重叠的时间切片策略(overlapped), 并基于重叠时间切片集合构建了全新的损失函数计算和标签预测方法. 采用重叠时间切片策略, 不但能够进一步提升训练样本数量, 还可以降低单个样本特征空间, 从而提升深度神经网络在EEG信号识别中的性能. 为了验证overlapped策略的可行性与有效性, 本文选择了BCI Competition IV dataset 1, 2a和2b三个开源EEG信号数据集, 在数据集上分别建立5种深度神经网络模型, 并对比cropped策略与overlapped策略的运动想象识别性能与效率. 实验结果表明, overlapped策略较cropped策略拥有更好的识别性能. 最后, 通过调整重叠时间切片策略的参数值, 设计了9组不同参数组合的对比实验, 实验结果表明不同的参数组合会影响最终的分类性能, 且分类性能的好坏并不与效率的高低呈线性关系. 本文提出的overlapped策略在Competition IV dataset 1, 2a和2b数据集上的识别准确率分别达到了92.3%、77.8%和86.3%, 较传统策略有明显的性能提升, 效率却不一定降低.
    2022,31(5):65-74, DOI: 10.15888/j.cnki.csa.008550
    [摘要] (87) [HTML] (27) [PDF 1.32 M] (111)
    摘要:
    随着科技的发展, 量子计算机大规模部署逐渐变为可能, 基于部分计算困难问题的公钥密码算法将被量子算法有效求解. 传统的可信硬件芯片如TCM/TPM等由于广泛使用了RSA、SM3、ECC等公钥密码体制, 其安全性将受到严重影响; 而绝大部分具有抗量子能力的密码算法并不适配现有TCM/TPM芯片有限的计算能力, 因此需要对抗量子可信计算平台进行重新设计. 本文针对可信计算在量子计算模型下面临的安全挑战, 分析总结了抗量子可信计算的研究现状, 改进并提出了抗量子可信计算技术体系, 并结合现有的后量子密码算法协议和可信计算软硬件技术框架, 通过在可信计算平台上移植抗量子密码算法和协议, 实现了基于TCM的抗量子可信计算安全支撑平台, 包括可信密码模块本原根设计, TCM密码库、远程证明、LDAA等抗量子可信计算扩展功能改进. 最后在可信计算仿真平台上对信任根、软件库、远程证明等抗量子TCM模块的功能和性能进行了全面测试, 结果表明平台既具有抵抗量子算法攻击的安全性, 且具有可以接受的应用性能开销.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2022-05-17 , DOI: 10.15888/j.cnki.csa.008544
    摘要:
    文本匹配是自然语言处理的一个核心研究领域, 深度文本匹配模型大致可以分为表示型和交互型两种类型, 表示型模型容易失去语义焦点难以衡量词上下文重要性, 交互型模型缺少句型、句间等全局性信息. 针对以上问题提出一种融合多角度特征的文本匹配模型, 该模型以孪生网络为基本架构, 利用BERT模型生成词向量进行词相似度融合加强语义特征, 利用Bi-LSTM对文本的句型结构特征进行编码, 即融合文本词性序列的句型结构信息, 使用Transformer编码器对文本句型结构特征和文本特征进行多层次交互, 最后拼接向量推理计算出两个文本之间的相似度. 在Quora部分数据集上的实验表明, 本模型相比于经典深度匹配模型有更好的表现.
    优先出版日期:  2022-05-17 , DOI: 10.15888/j.cnki.csa.008549
    摘要:
    农作物叶片病害的自动识别是计算机视觉技术在农业领域的一个重要应用. 近年来, 深度学习在农作物叶片病害识别上取得了一些进展, 但这些方法都是采用基于单一深度卷积神经网络模型的深度特征表示. 而不同的深度卷积神经网络模型对图像的表征能力的互补性这一有用的特性, 还没有得到关注和研究. 本文提出一种用于融合不同深度特征的网络模型MDFF-Net. MDFF-Net将两个预训练的深度卷积神经网络模型进行并联, 再为各个模型分别设置一个具有相同神经元个数的全连接层, 以将不同模型输出的深度特征变换成相同维度的特征, 再通过2个全连接层的非线性变换, 进一步提升特征融合的效果. 我们选取VGG-16和ResNet-50作为MDFF-Net网络的并联骨干网络, 在一个包含5种苹果叶片病害的公开数据集上进行实验. 实验结果显示, MDFF-Net网络的识别精度为96.59%, 取得了比VGG-16和ResNet-50单一网络更好的识别效果, 证明了该深度特征融合方法的有效性.
    优先出版日期:  2022-05-17 , DOI: 10.15888/j.cnki.csa.008559
    摘要:
    在烧结矿生产过程中, 烧结矿形成的气孔是烧结矿的质量评估的重要参数. 由于烧结矿的气孔形状不一、气孔边缘模糊等问题, 导致分割出的气孔误差率较大. 为了能更准确地分割出气孔, 先对烧结矿图像进行OpenCV图像预处理. 对比传统的图像分割算法, 本文提出一种基于改进UNet网络对预处理后的烧结矿气孔图像进行分割的算法. 在UNet网络编码中引入残差和拼接连接结合思想的改进模块, 以获得更多的气孔特征信息. 实验结果表明, 改进的算法在MIoU和Dice指标均优于传统UNet网络和传统图像分割.
    优先出版日期:  2022-04-18 , DOI: 10.15888/j.cnki.csa.008607
    摘要:
    对于一些可以从视网膜血管观测到的眼科疾病, 眼底图像起着关键的作用, 能够为专业的医科人员提供有效的参考, 然而手工标注血管费时费力, 且工作量较大, 所以实现自动智能的血管分割方法对相关人员大有裨益. 本文将Attention机制与RU-Net结构融合应用到生成对抗网络(generating adversarial network, GAN)的生成器中, 形成了一种新的结构——Retina-GAN. 同时在对眼底图像的预处理步骤上选择了自动色彩均衡 (ACE), 提高图像对比度, 使血管更加清晰. 为了验证所提出的方法, 选用DRIVE数据集, 并把Retina-GAN与其他研究比照, 测量分析了算法准确性、灵敏度和特异度. 实验数据显示Retina-GAN比其他模型具有更好的性能.
    优先出版日期:  2022-04-18 , DOI: 10.15888/j.cnki.csa.008608
    [摘要] (21) [HTML] (0) [PDF 1.30 M] (1943)
    摘要:
    视频放大技术给予了人们观察并研究事物微小变化的机会. 利用复可控金字塔分解视频, 通过分析不同尺度不同方向的相位差来操纵视频中的运动. 复可控金字塔中某些尺度的信号放大后超出了其相移极限, 产生伪影及模糊. 调整各尺度的放大因子能够解决这一问题. 本文提出一种基于多尺度滤波的视频放大算法, 通过建立视频帧图像空间波长与振动位移的联系, 确定各尺度的放大因子的上限, 无需人工设定截止波长, 自行调整复可控金字塔各尺度的放大因子, 使得放大后的信号能够适应其相移极限. 通过对附加在大运动上的振动进行放大, 验证了本算法的性能, 相比现有的视频放大算法具有明显优势.
    优先出版日期:  2022-04-18 , DOI: 10.15888/j.cnki.csa.008609
    摘要:
    野生蛇的分类相较于其它细粒度图像分类更加困难和复杂, 这是因为蛇姿势各异、变化急促、常处于运动或盘曲状态, 很难根据蛇的的局部特征去判断并分类. 为了解决这个问题, 本文将自注意力机制应用野生蛇细粒度图像分类, 从而解决卷积神经网络因层数加深造成的过于专注局部而忽略全局信息问题. 通过Swin Transformer (Swin-T)进行迁移学习获得细粒度特征提取模型. 为了进一步研究自注意力机制在元学习领域的性能, 本文改进特征提取模型搭建孪生网络并构造元学习器对少量样本进行学习和分类. 相较于其他方法, 本方法减少了元学习在特征提取时所造成的时间和空间开销, 提高了元学习分类的准确率和效率并增加了元学习的自主学习性.
    优先出版日期:  2022-04-18 , DOI: 10.15888/j.cnki.csa.008610
    摘要:
    为了解决推荐系统的冷启动和稀疏性问题, 本文提出了一种基于异质信息网络的推荐模型. 传统的推荐方法无法在知识图谱表示学习中融入隐含的路径信息, 这样使得知识推荐系统性能较为一般. 本文提出的模型在异质信息网络中设置元路径, 通过图神经网络融入到知识图谱表示学习中. 再利用注意力网络连接推荐任务和知识图谱表示任务, 其可以学习两个任务之中潜在的特征, 并且能够增强推荐系统中被推荐项和知识图谱中实体的相互作用. 最后在推荐任务中进行用户点击率预测. 模型在公开数据集Book-Crossing和通过DBLP数据集构建的图谱上进行了实验. 最后结果表明, 模型在AUC, 召回率和F1值3个指标上均比其他算法有更好的表现.
    优先出版日期:  2022-04-18 , DOI: 10.15888/j.cnki.csa.008612
    摘要:
    YOLOx-Darknet53是以YOLOv3为基准增加各种技巧(trick)升级改进的检测网络, 但其仍然是以Darknet53为特征提取骨干网络(backbone), 因此网络的特征提取能力仍有欠缺. 本文依据CoTNet中的注意力机制改进得到CoA (contextual attention)模块, 并将其替代YOLOx骨干网络残差块里的3×3卷积, 得到融合注意力后的新残差块, 加强了骨干网络的特征提取能力, 并在Pascal VOC2007数据集上进行对比实验, 融合CoA模块的网络比原网络的平均精度均值AP@[.5:.95]高1.4, AP@0.5高1.4; 在改进骨干网络后的YOLOx检测头前加入无参3D注意力模块, 得到最终改进的检测网络, 进行上述对比实验, 结果表明比原网络的AP@[.5:.95]高1.6, AP@0.5高1.5. 因此, 改进后的网络比原网络检测更加精准, 在工业应用中能达到更好的检测效果.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008601
    [摘要] (36) [HTML] (0) [PDF 1.20 M] (7485)
    摘要:
    设计和实现了一种动态数据关联网络的表示及搜索方法和系统, 能够在数据实体较多、关联关系较复杂时, 帮助用户获得实体周边关联关系, 并通过引导式交互不断动态扩展; 在已知可能有关联的多个实体时, 采用分布式计算最小连通图算法, 搜索出其关联网络. 应用实例表明, 本方法和系统能够取得很好的实际效果, 采用本方法的应用系统已经在智慧城市、平安城市、城域物联网等多个工程项目中获得落地应用.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008602
    摘要:
    针对新浪微博评论信息准确分类问题, 本文基于遗传算法(genetic algorithm, GA)、粒子群算法(particle swarm optimization, PSO)和支持向量机(support vector machine, SVM)算法, 提出一种改进GA-IPSO-BSVM (genetic algorithm-improved particle swarm optimization-balanced support vector machine)的分类模型, 以实现提升新浪微博评论信息分类的准确性和收敛性. 首先, 为了有效提升算法的收敛速度, 并高效节省计算资源, 该模型在迭代前期引入GA的淘汰机制, 删除大量低速粒子. 其次, 在迭代中期, 为了避免算法陷入局部最优解, 改进PSO中粒子关系的拓扑结构, 采用K均值聚类(K-means)算法对粒子群进行聚类分区, 将各粒子群体在所属社区中进行粒子群迭代, 选出各个区域中优秀粒子. 再次, 在迭代后期, 将所有区域优秀粒子组合成优秀粒子群体, 并将该群体进行迭代, 得出全局最优解. 从次, 结合GA和IPSO对BSVM进行超参数优化, 提升分类准确率. 最后, 利用所提出的GA-IPSO-BSVM模型对于新浪微博评论信息进行分类预测验证. 经实验结果表明, 该分类模型应用于新浪微博信息分类的准确度优于其他基准模型.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008603
    [摘要] (29) [HTML] (7) [PDF 1.10 M] (5724)
    摘要:
    电力能源的安全在国家安全中占有重要的地位. 随着电力5G通信技术的发展, 大量电力终端产生定位需求. 传统GPS定位方法存在易受欺骗的问题, 如何有效提升GPS定位的安全性成为一个亟待研究的问题. 本文提出了一种基于基站辅助的电力5G终端GPS欺骗检测算法, 利用安全性较高的基站定位来检验可能被欺骗的GPS定位, 并且引入了一致性因数用来描述GPS定位结果和基站定位结果的一致性. 通过计算一致性因数, 如果大于设定的阈值则判断发生欺骗, 反之则GPS工作正常. 实验表明, 在使用本论文模型情况下, 本算法的准确率为99.98%, 优于传统机器学习分类算法. 此外, 本方法在运行速度上相较于传统机器学习分类算法也有一定程度的提升.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008604
    摘要:
    人眼瞳距在视光学研究中和配置眼镜时都是需要精确测量的基础性参数, 实现瞳距自动检测具有重要的应用价值, 结合高斯肤色模型, 提出一种基于灰度积分投影与霍夫圆变换算法的人眼瞳孔定位和瞳距计算方法. 首先, 通过二维伽马函数的自适应亮度校正方法对图像进行光照补偿预处理, 在此基础上, 利用肤色概率模型检测人脸并提取出面部区域. 再运用灰度积分投影法, 选取合适的阈值对眼部区域进行提取, 经过一系列形态学图像处理, 采用Canny边缘检测算子实现瞳孔边缘检测, 最后通过Hough圆变换算法进行瞳孔定位, 并对其中心距离进行计算. 研究结果表明, 该算法具有较快的瞳孔定位速度, 能够较精确地实现瞳距自动测量, 为瞳孔测距的智能化技术研究奠定了基础.
    优先出版日期:  2022-03-31 , DOI: 10.15888/j.cnki.csa.008605
    摘要:
    集成学习被广泛用于提高分类精度, 近年来的研究表明, 通过多模态扰乱策略来构建集成分类器可以进一步提高分类性能. 本文提出了一种基于近似约简与最优采样的集成剪枝算法(EPA_AO). 在EPA_AO中, 我们设计了一种多模态扰乱策略来构建不同的个体分类器. 该扰乱策略可以同时扰乱属性空间和训练集, 从而增加了个体分类器的多样性. 我们利用证据KNN (K-近邻)算法来训练个体分类器, 并在多个UCI数据集上比较了EPA_AO与现有同类型算法的性能. 实验结果表明, EPA_AO是一种有效的集成学习方法.
    优先出版日期:  2022-03-24 , DOI: 10.15888/j.cnki.csa.008561
    摘要:
    在施工现场中, 安全帽能够减轻对头部的伤害, 且不同颜色的安全帽代表不同的身份, 基于当前施工现场通过视频监控来对工人安全帽的佩戴以及工种身份识别存在一定的耗时性, 不完全性, 监督效率低等问题, 本文提出了一种基于YOLOv4改进的安全帽佩戴检测以及身份识别的方法, 在原始的YOLOv4的基础之上, 使用K-means算法对先验框的大小重新进行聚类分析处理, 增加多尺度预测输出, 实验DIoU NMS进行非极大值抑制, 从而使工人安全帽佩戴及身份识别达到高效性, 全面性. 结果表明, 佩戴红、蓝、黄、白安全帽和未佩戴安全帽工人平均检测准确率达到92.1%, 从而保证能够实现对施工现场工人安全帽的佩戴达到一种实时监控.
    优先出版日期:  2022-03-18 , DOI: 10.15888/j.cnki.csa.008575
    [摘要] (42) [HTML] (0) [PDF 1.13 M] (19003)
    摘要:
    为了提高数字水印算法的鲁棒性, 提出了一种基于矢量长度比的三维网格零水印算法. 首先, 将三维网格模型由直角坐标系转化为球坐标系. 其次, 对网格模型的顶点进行分块并计算每个块质心. 然后, 计算每个顶点到块质心的距离以及邻域顶点到块质心的平均距离的比值, 并将比值序列与比值的平均值进行比较, 根据比较的大小记为0和1; 统计每个分块0、1数量的多数, 以此构成模型的特征序列. 最后, 将版权信息的二值序列与特征序列进行异或, 得到最终的零水印序列. 实验结果表明, 本文算法能够抵抗平移、旋转、均匀缩放、噪声、平滑、简化和剪切等常见的攻击, 也能够对三维网格模型进行版权保护.
    优先出版日期:  2022-03-18 , DOI: 10.15888/j.cnki.csa.008576
    [摘要] (58) [HTML] (0) [PDF 1.73 M] (5560)
    摘要:
    近年来, 人工智能在各个领域有着广泛的应用. 针对超市及菜市场人工称重操作耗时、计价流程繁杂的问题, 本文提出一种基于注意力YOLOv5模型的水果自动识别算法. 首先, 为了提升仅有局部特征不同, 全局特征相似水果的识别准确率, 本文在YOLOv5的SPP (spatial pyramid pooling)层后增加SENet (squeeze-and-excitation networks), 采用注意力机制自动学习每个特征通道的重要程度, 进而按照重要程度强化对水果识别任务有用的特征并抑制没有用的特征; 其次, 针对水果识别预测框与目标框重叠时, GIOU不能准确表达边框重合关系问题, 本文将原有的边框回归损失函数GIOU替换为CIOU, 同时考虑目标框与预测框的高宽比和中心点之间的关系, 从而使水果预测框更加接近真实框, 提升预测精度. 实验结果表明, 改进后的模型在常见场景下水果识别能力有明显提升, 平均精度mAP达99.10%, 识别速度FPS达到82, 能够满足实际应用需要.
    优先出版日期:  2022-03-18 , DOI: 10.15888/j.cnki.csa.008592
    [摘要] (124) [HTML] (0) [PDF 830.42 K] (4793)
    摘要:
    发动机生产故障和售后维修报告中有大量动力总成和零部件故障信息. 本文将知识图谱引入柴油发动机故障领域, 设计发动机故障领域知识图谱构建的系统流程, 针对多源故障数据进行本体建模. 使用BERT和BiLSTM-CRF结合的实体识别框架, 挖掘故障数据中的专家知识. 提出实体相关性评价指标FF-IEF, 并基于知识图谱和贝叶斯网络进行故障诊断. 设计并开发EFKG原型系统, 共包含12534个实体和408972条三元组, 该系统提供知识抽取、可视化检索、辅助决策等功能, 有效提高信息检索和维修效率, 对知识图谱在发动机故障领域的应用具有一定指导意义.
    优先出版日期:  2022-03-09 , DOI: 10.15888/j.cnki.csa.008593
    [摘要] (62) [HTML] (0) [PDF 948.75 K] (24337)
    摘要:
    近年来在图像描述领域对于应用场景图生成描述的研究越来越广泛. 然而, 当前基于场景图的图像描述模型并未考虑到长短期记忆神经网络(LSTM)对于先前输入的细节信息的保留, 这可能会导致细节信息的丢失. 针对这个问题, 本文提出基于原始信息注入的图像描述网络, 该网络对基线模型中语言LSTM的输入变量做了改进, 目的是尽可能多地保留原始输入信息, 减少输入信息在计算过程中的损失. 另外, 本文还认为当前的场景图更新机制中存在结点更新程度过大的问题, 因此本文设计了一个访问控制模块更新已访问过的结点权重, 避免引起结点信息丢失的问题. 同时, 本文设计一个图更新系数(GUF)来指导图更新, 以确定更新程度的大小. 本文在官方数据集MSCOCO上进行了实验, 各种评估机制的实验结果表明, 基于访问控制模块与原始信息注入的图像描述模型与基线模型对比, 取得了更有竞争力的结果, 表现出明显的优越性.
    优先出版日期:  2022-03-09 , DOI: 10.15888/j.cnki.csa.008594
    [摘要] (90) [HTML] (0) [PDF 1.69 M] (23202)
    摘要:
    针对目前沥青路面裂缝检测存在的识别率低和细微裂缝在复杂背景下难以检测的问题, 提出了基于改进Faster-RCNN的裂缝检测方法. 首先, 通过多功能路面检测车采集路面图像, 将13 000张图片按8:2的比例分为训练集和测试集来建成路面裂缝检测数据集; 然后分别采用VGG16、MobileNet-V2和ResNet50网络替换Faster-RCNN模型中的特征提取网络对裂缝进行识别, 结果表明, ResNet50与Faster-RCNN结合对裂缝的检测准确率达到0.805 8, 效果最好; 裂缝都分布在同一水平面上, 不存在层次信息, 因此将ResNet系列其它网络与Faster-RCNN模型结合, 以期得到更好的检测效果, 结果表明, 相比于ResNet18和ResNet101, 还是ResNet50检测性能最好; 由于还存在细微裂缝漏检的问题, 将CBAM模块引入ResNet50, 并且比较不同插入位置对检测准确率的影响. 实验表明, 改进的Faster-RCNN模型检测精准度达到85.64%, 能有效检测出复杂背景下的细微裂缝.
    优先出版日期:  2022-03-09 , DOI: 10.15888/j.cnki.csa.008578
    [摘要] (111) [HTML] (0) [PDF 768.36 K] (18116)
    摘要:
    针对红外图像信噪比低, 易受背景环境影响的问题, 提出一种基于不可分离小波的多尺度方向分析(NSWMDA)和连接突触计算网络(LSCN)的图像增强算法. 该算法首先将原始图像进行冗余提升的不可分离小波变换(NSWT), 得到高频细节子带和低频近似子带, 然后对高频细节子带进行多方向滤波后LSCN算法进行增强, 对低频近似子带直接采用LSCN算法增强, 最后对处理后的子图进行融合重构得到增强后的红外图像. 在电力变压器红外图像中, 该算法相比其他算法在边缘强度、信息熵、峰值信噪比、结构相似度、平局梯度5种指标中分别至少提升了10.86%、14.39%、19.95%、7.06%、6.70%. 实验结果表明, 该算法不仅提升了红外图像整体清晰度, 同时也使得图像的细节纹理和对比度得到加强, 具有很好的红外图像增强效果.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (11559) [HTML] (0) [PDF ] (17588)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (8411) [HTML] (0) [PDF ] (27430)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (8054) [HTML] (0) [PDF ] (9577)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2011,20(11):80-85, DOI:
    [摘要] (6838) [HTML] () [PDF 863160] (35854)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    2008,17(5):122-126, DOI:
    [摘要] (6679) [HTML] (0) [PDF ] (40602)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (6510) [HTML] () [PDF 1167952] (29506)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    1999,8(7):43-46, DOI:
    [摘要] (6259) [HTML] (0) [PDF ] (18901)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2007,16(9):22-25, DOI:
    [摘要] (5899) [HTML] (0) [PDF ] (3062)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2011,20(7):184-187,120, DOI:
    [摘要] (5204) [HTML] () [PDF 731903] (25236)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2012,21(3):260-264, DOI:
    [摘要] (5184) [HTML] () [PDF 336300] (38777)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2004,13(10):7-9, DOI:
    [摘要] (5133) [HTML] (0) [PDF ] (7193)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(8):87-89, DOI:
    [摘要] (5080) [HTML] (0) [PDF ] (35956)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(1):113-116, DOI:
    [摘要] (5070) [HTML] (0) [PDF ] (43821)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):2-5, DOI:
    [摘要] (5042) [HTML] (0) [PDF ] (27316)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (4975) [HTML] (0) [PDF ] (23582)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2010,19(10):42-46, DOI:
    [摘要] (4945) [HTML] () [PDF 1301305] (17353)
    摘要:
    综合考虑基于构件组装技术的虚拟实验室的系统需求,分析了工作流驱动的动态虚拟实验室的业务处理模型,介绍了轻量级J2EE框架(SSH)与工作流系统(Shark和JaWE)的集成模型,提出了一种轻量级J2EE框架下工作流驱动的动态虚拟实验室的设计和实现方法,给出了虚拟实验项目的实现机制、数据流和控制流的管理方法,以及实验流程的动态组装方法,最后,以应用实例说明了本文方法的有效性。
    2009,18(3):164-167, DOI:
    [摘要] (4897) [HTML] (0) [PDF ] (22703)
    摘要:
    介绍了一种基于DWGDirectX在不依赖于AutoCAD平台的情况下实现DWG文件的显示、操作、添加的简单的实体的方法,并对该方法进行了分析和实现。
    2009,18(5):182-185, DOI:
    [摘要] (4868) [HTML] (0) [PDF ] (26747)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
    2003,12(1):62-65, DOI:
    [摘要] (4755) [HTML] (0) [PDF ] (11569)
    摘要:
    本文介绍了一种将DTD转换成ER图,并用XMLApplication将ER图描述成转换标准,然后根据该转换标准将XML文档转换为关系模型的方法.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4041) [HTML] (0) [PDF 0.00 Byte] (83521)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (2696) [HTML] (0) [PDF 0.00 Byte] (55104)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (5069) [HTML] (0) [PDF 0.00 Byte] (43813)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (6679) [HTML] (0) [PDF 0.00 Byte] (40596)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号