发布时间:2025-09-07 来源:侯门似海网作者:bbbbboooooo
长期以来,瓦斯浓度超限是导致煤矿发生爆炸和其他突出事故的主要原因。作为全球最大的煤炭生产国,中国一直以来都十分重视煤矿安全。数据显示,中国煤矿瓦斯事故已从 2005 年的 414 起(死亡 2171 人)降至 2021 年的 7 起(死亡 30 人),但为了实现零事故零死亡,安全预警系统仍需进一步完善。虽然大多数煤矿已部署瓦斯监测系统,但这些系统主要关注实时监测数据是否超过阈值限制值(TLV, Threshold Limit Value),缺乏对多种监测数据间潜在关联的挖掘和分析。
为了解决这一问题,一个由澳大利亚悉尼科技大学 (University of Technology Sydney) 罗伯特·吴博士(Dr.Robert M.X. Wu)和 鲁海燕教授 (Associate Professor Haiyan(Helen) Lu) 领导的跨国研究团队历经数年攻关,成功在数据分析、可视化及预警系统领域取得了一系列重大突破。针对煤矿瓦斯防治的实际需求,他们开发了包括“气泡壁图”可视化工具、“三联相关分析”理论框架以及一套完整的瓦斯预警系统,为煤矿安全生产提供了一套新的解决方案。
图丨 Robert M.X. Wu(来源:University of Technology Sydney)
图丨 Hai Yan(Hellen)Lu(来源:University of Technology Sy)
这一系列研究源自 2017 年某世界 500 强企业委托的重大技术攻关项目——矿井瓦斯防治大数据预警及可视化交互系统。该项目旨在解决矿井瓦斯防治面临的三大关键挑战:缺乏高质量的历史数据(特别是瓦斯超限数据)、基于机器学习的预测结果难以准确解释、以及提高模型效率所需的高昂硬件成本。
面对这些挑战,该课题组并未局限于对现有机器学习算法进行修补或优化,而是从更基础的层面出发,探索出了一系列理论思路、可视化工具和系统性方法论。
数据重塑:气泡壁图与三联相关理论
首先是数据可视化方面的创新。在实时监控预警系统中,如何将复杂、动态、多维度的数据以直观、易懂的方式呈现给操作人员和决策者,是至关重要的环节。传统的可视化方法,如折线图(Line Charts)、平行坐标图(Parallel Coordinates Plot)、散点图(Scatter Plots)、树状图(TreeMap)等,虽然各有优势,但在处理实时流数据、尤其是需要同时展现多个系统、多个维度信息的动态变化时,往往显得力不从心。针对这一痛点,研究团队在 2021 年澳大利亚信息系统会议(ACIS,Australasian Conference on Information Systems)上首次提出了一种名为“气泡壁图”(Bubble-Wall Plot)的新型数据可视化工具。
近日,这项成果的扩展研究也于 2025 年 7 月 1 日发表在PLoS ONE(h-index 467 SJR Q1 期刊,)。第一作者和通讯作者为罗伯特·吴博士(Dr.Robert M.X. Wu),鲁海燕教授 (Associate Professor Haiyan(Helen) Lu 为合作作者之一,第一作者和通讯作者单位是澳大利亚悉尼科技大学工程与计算机技术学院。相关论文题目为《气泡壁图作为一种动态分析处理可视化工具,用于开发视觉预警系统:一个案例研究》(Bubble-Wall Plot as a Dynamic Analytical Processing Visualization tool for developing Visual Warning Systems: a case study)。
(来源:资料图)
(来源:资料图)
“气泡壁图”(Bubble-Wall Plot)采用单一维度设计理念,包含一个气泡和两条水平线的极简结构。在这一设计中,气泡代表状态,上线表示上限值(ULV, Upper Limit Value),下线表示下限值(LLV, Lower Limit Value),实时值在这两条线之间变动。当实时值超过上限值或低于下限值时,气泡颜色会从蓝色变为黄色,直观地表示异常状态。
图丨气泡壁图的图示(来源:ACIS 2021 Proceedings)
气泡壁图基于 Bertin 的制图符号化原理,遵循“保持最简策略”(KISS, Keep It Simple Strategy)和“保持最小策略”(Keep It the Smallest Strategy),实现了复杂数据的简化表达。该课题组通过对 25 种可视化方法的分析,发现气泡壁图在异常识别方面具有显著优势。与传统可视化方法相比,气泡壁图具有三个关键特性:符号简单性(相比散点图和折线图更简洁)、维度简化(仅使用一个维度而非多维)和异常直观性(通过颜色变化立即识别异常)。
审稿人评价称:“它的主要优势之一是它专注于实时流数据而不是静态数据,使其非常适合实时监控场景。此外,该工具设计为用户友好型,允许技能水平较低和经验不足的用户无需大量培训即可轻松解释复杂数据。”该工具于 2021 年 5 月在案例研究矿部署用户验收测试,并被成功应用于实时预警系统开发。
在建立了高效直观的可视化工具后,研究人员接着深入探究了预警信号产生的根本依据。他们质疑了传统预警过度依赖外部地质因素分析或仅仅追求复杂模型预测精度的做法,转而提出一种新的理论思路——“闭环系统下非相关因素的内隐关联要素相关性”(Implicit Correlation of Unrelated Factors in a Closed-Loop System)。他们认为,在一个相对封闭的监测系统内部,各监测参数的变化即使没有直接的物理或化学联系,也可能因共同受到系统整体运行状态的影响而呈现出有价值的统计相关性。
基于这一“向内求索”的思路,该团队在开发“创新综合瓦斯预警系统”的过程中,并没有将重心完全放在应用复杂的机器学习模型来直接预测瓦斯浓度,而是采用了相关性研究的方法,深入挖掘瓦斯监测系统内部各监测参数之间的潜在关系。具体而言,他们着重分析了三种类型的相关性,构成了所谓的“三联相关分析”理论框架。
这三种相关性分别是:不同监测点或时间点的瓦斯浓度之间的“瓦斯与瓦斯”(Gas and Gas)相关性,这有助于理解瓦斯在矿井环境中的扩散规律;瓦斯浓度与相应监测点温度之间的“瓦斯与温度”(Gas and Temperature)相关性,揭示了温度变化可能对瓦斯逸出或相关化学反应的影响;以及瓦斯浓度与相应测点风速或风量之间的“瓦斯与风速”(Gas and Wind)相关性,反映了通风条件对瓦斯稀释的关键作用。
图丨三重相关分析理论框架(来源:Scientific Reports)
这些相关性分析结果为预警系统提供了重要的理论基础,实现了从单一因素监测向多因素关联预警的转变。实际应用表明,该框架能够在危险浓度达到阈值前 10-15 分钟识别潜在风险,大大提高了预警时间窗口。
为验证三联相关分析理论框架的可靠性,团队开发了“FSV 分析方法”(First-round-Second-round-Verification round analysis approach,首轮-次轮-验证轮分析方法)。这一方法包含五个严格的技术步骤:数据获取、数据预处理、两轮数据分析、验证分析以及相关性分析。
在数据获取阶段,研究人员从案例研究矿采集数据,包括瓦斯、温度、风速和粉尘传感器数据,采样间隔为 15 秒。数据预处理阶段包括消除极端值、去除异常值和数据标准化。研究采用箱线图(Box-plot)技术识别异常值,并使用 Z 分数归一化方法进行数据标准化,将原始数据转换为基于数据集平均值和标准差的标准分数。
两轮数据分析分别使用不同时间段的数据集进行独立分析。第一轮使用 2022 年 2 月 5 日的数据,第二轮使用 2022 年 2 月 6 日的数据,每组数据包含每个传感器 5760 个数据点。验证分析阶段比较两轮分析结果,确认稳定存在的相关性。具体技术措施包括克朗巴赫系数α检验(值大于 0.6 视为可接受)、KMO 测度(Kaiser-Meyer-Olkin Measure,值大于 0.5 视为可接受)和巴特利特球形度检验(Bartlett's Test of Sphericity,p < 0.001)等。
研究结果显示,FSV 方法成功验证了四组瓦斯与瓦斯间相关性,三组瓦斯与温度间相关性、以及三组瓦斯与风速间相关性。
(来源:Scientific Reports)
此外,团队进行了四项额外实验,在不同工作面(1217 号和 3209 号)和不同季节(夏季和冬季)验证了相关性模式的稳定性,进一步证实了该框架的稳健性。
算法优化与用户需求驱动
在建立并验证了三联相关分析理论框架的基础上,研究团队面临的下一个关键问题是:如何选择最适合实现这一框架的机器学习算法,以实现精准的短期预测?为解决这一问题,该课题组对十种广泛使用的机器学习算法进行了系统比较,以确定在瓦斯预警系统中的最佳算法选择。
这一研究使用 28,697 个数据集,按 60%:40% 的比例分为训练集和测试集。评估采用了四项预测误差指标:平均绝对误差、均方误差、均方根误差和绝对误差和。这些指标分别从不同角度评估算法的预测准确性,比如平均绝对误差衡量预测值与实际值之间的平均绝对差异,均方根误差则对较大误差给予更高的权重,有助于识别显著偏差。
图丨研究流程图(来源:Scientific Reports)
研究结果显示,自回归积分移动平均模型(ARIMA,Autoregressive Integrated Moving Average)和线性回归(LR,Linear Regression)在测试数据集中具有最低误差指标,随机森林(RF,Random Forest)和支持向量机(SVM,Support Vector Machine)虽表现优异,但误差稍高。在计算时间方面,K 近邻算法(KNN,K-Nearest Neighbor)表现最佳,其次是 RF、LR 和 SVM。长短期记忆网络(LSTM,Long Short-Term Memory)计算时间最长,显著高于其他算法。
基于综合性能评估,研究人员提出了“2D 空间四象限图”作为评估可视化工具,将算法映射到四个象限:第一象限(最优)包括 LR、RF 和 SVM,预测误差低且计算效率高;第二象限(高效)包括 ARIMA,预测误差低但计算效率较低;第三象限(次优)包括基于自组织图的反向传播神经网络(BP-SOG,Back-Propagation with Self-Organizing Graph)、KNN 和 Perceptron(感知器),预测误差高但计算效率高;第四象限(低效)包括循环神经网络(RNN,Recurrent Neural Networks)、弹性反向传播神经网络(BP_Resilient,Resilient Back-Propagation)和 LSTM,预测误差高且计算效率低。这一评估方法为不同应用场景下的算法选择提供了清晰指导,实现了预测性能和计算效率的平衡优化。
(来源:Scientific Reports)
算法优化选择的结果直接影响了预警系统的实际性能,确保了系统能够在有限的硬件资源下实现高效精确的预测。这种基于实证的算法选择方法,与前述的三联相关分析理论框架和 FSV 验证方法相结合,构成了预警系统的核心技术支撑。
为确保系统开发过程中充分考虑用户需求,团队创新性地采用了“多重焦点小组”研究方法。该方法在五个阶段进行了 11 次焦点小组会议,涉及 73 名参与者,包括 35 名领域专家、16 名行业专家、10 名研究学者和 12 名系统开发人员。
研究方法实施的具体步骤包括识别需求阶段、项目规划阶段、发现项目需求阶段、系统开发阶段和测试与集成阶段。每个阶段都有特定的焦点小组会议和参与人员配置。通过这一系统化的过程,研究团队识别了 28 个关键问题和建议,分为四个类别:数据获取(DA1-DA6)、数据隔离(DI1-DI8)、报警和早期预警(AEW1-AEW8)和系统界面设计(SID1-SID6)。
基于这些问题,该团队开发了七个解决方案:数据仓库管理系统整合八种煤矿监测系统的数据库;数据预处理模块消除异常数据和极端值;数据分析系统检测传感器变化的可靠性和有效性;相关性分析系统探索瓦斯、温度和风速之间的隐藏模式;激活决策规则系统集成预警子系统;界面视图子系统实现数据可视化;紧急警报移动预警系统发送移动文本消息。
图丨演示所提议系统的三层架构(来源:PLoS ONE)
最终,团队构建了一个三层架构系统:数据访问层整合八种煤矿监测系统;领域层包括提取系统、数据仓库、异常值消除、可靠性分析、相关性分析和激活决策规则;视图层包括报警、预警和监测三个子系统。该架构设计通过统一建模语言(UML, Unified Modeling Language)进行了系统化表示。
系统实现与未来展望
基于上述理论创新和方法论突破,研究团队开发并实施了一个创新的综合瓦斯预警系统。该系统采用三层架构,整合了三联相关分析框架和三个激活决策规则:第一,如果数据输出超过阈值限制值,报警系统将立即提醒安全响应团队;第二,如果实时相关分析值超过相关分析限制值,预警系统将通知安全响应团队;第三,如果相关分析值不超过相关分析限制值,原始数据将转发到监控系统。
在技术实现层面,系统使用熵算法(Entropy Algorithm)计算实时相关分析值和相关分析限制值。熵算法的计算过程首先计算每个标准的属性的替代方案的强度,然后计算每个标准的熵和关键指标,最后计算每个标准的权重。这种基于信息熵的权重计算方法能够客观评估不同指标的重要性,避免了主观赋权可能带来的偏差。
该系统于 2021 年 12 月在案例研究矿成功部署,其对 3,211,215 个收集的数据进行了分析,涉及 49 个传感器,包括瓦斯传感器(21 个)、温度传感器(16 个)、风速传感器(10 个)和粉尘传感器(2 个)。数据分析结果显示,在此案例矿中,研究团队发现了 328 个显著相关关系,其中瓦斯与瓦斯之间 163 个相关关系、瓦斯与温度之间 130 个相关关系,以及瓦斯与风速之间 35 个相关关系。同时建立了三个激活决策规则。系统的运行表明,该预警机制能够在传统阈值警报之前 10-15 分钟发出警报,大大提高了预警时间窗口,为安全人员的响应提供了宝贵时间。
(来源:Scientific Reports)
研究团队表示,这些研究成果构成了一个可用于多领域实时预警的完整的工具包,可用于任何需要实时异动事件短期预测的系统。对于一个具体应用,工程团队需要以三层架构系统(数据访问层,领域层和视图层)为模板,确定所需的数据系列(实时传感器数据),通过三重关联相关分析理论框架确定相关的预测数据系列,利用所提出的系统方法确定最佳预测算法,实现所选的预测算法得出预测结果,最后用气泡壁图显示结果。该课题组计划继续完善基于“三联相关分析”的瓦斯预警系统,同时协助领域专家利用扎根理论等方法深入探索瓦斯灾害发生的因果机制,并进一步研究机器学习与“三联相关分析”理论框架的结合应用,探索基于人工智能体(AI Agent)的工程创新实践。
这一集成方法特别适合需要强化早期预报和预警的领域,如医疗疾控(监测疫情异常变化和预警)、公共应急(自然灾害或突发事件的早期预警)、气候变化(极端天气事件的预测和预警)、地震监测(前兆信号的识别与预警)以及金融市场(异常波动的早期识别)等。另外,这一集成方法和其组成部分在社会科学领域也有很强的适用性。例如,基于气泡壁图的可视化技术,团队已开始在澳大利亚 UNSW-UTS Trustworthy Digital Society (TDS)“数字诚信”专家委员会专项基金支持下,正在开展“消费者数字诚信测评可视化技术”的创新项目研究。研究成果初步显示前述研究成果在社会科学领域的适用性。
参考资料:
1.http://aisel.aisnet.org/cgi/viewcontent.cgi?article=1011&context=acis2021
2.http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0281603#sec016
3.http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0321077
4.http://www.nature.com/articles/s41598-023-35900-3#Sec22
5.http://www.nature.com/articles/s41598-024-67283-4#Sec15
http://www.tandfonline.com/doi/full/10.1080/19475705.2021.2002953#abstract
运营/排版:何晨龙