摘要:在当前互联网信息多元分布的背景下, 单文档信息抽取的传统范式已难以满足用户对事件全局认知的需求. 针对多源文本数据中信息冗余与观点碎片化的问题, 本文提出基于过滤机制的多维度文本摘要生成模型(FM-MDSG), 该框架通过3阶段创新架构实现跨源信息的结构化融合, 首先采用微调RoBERTa模型构建层次化语义表征, 捕获输入文本的上下文依赖. 其次, 设计双层过滤机制, 同步执行基于注意力权重的显著性检测与领域自适应的冗余抑制, 筛选出信息密度优化的语义单元. 最后, 构建知识增强的ERNIE解码器, 通过动态门控策略实现多层级语义特征的协同生成. 在CSL数据集上的实验表明, 该模型ROUGE-1/2/L的F值分别达到55.37%、47.28%和49.56%, ROUGE-L较经典基线模型提升6.8个百分点. 消融实验进一步验证, 过滤机制通过噪声抑制带来9.22%的ROUGE-1性能增益. 该模型实现了对异构来源证据的系统性整合, 能够在开放域场景下重构多视角观测的完整事件范式.