從零到卓越:規(guī)劃構(gòu)建高效告警平臺(tái)的實(shí)戰(zhàn)路徑
在現(xiàn)代社會(huì)中,告警系統(tǒng)的重要性日益凸顯,它通過(guò)實(shí)時(shí)監(jiān)控和及時(shí)通知,幫助各個(gè)領(lǐng)域預(yù)防風(fēng)險(xiǎn)和應(yīng)對(duì)異常情況,確保安全和穩(wěn)定運(yùn)行。
告警系統(tǒng)在現(xiàn)代社會(huì)中扮演著越來(lái)越重要的角色。
告警系統(tǒng)是一個(gè)復(fù)雜而關(guān)鍵的系統(tǒng),它主要用于監(jiān)控、發(fā)現(xiàn)和通告潛在的風(fēng)險(xiǎn)或異常情況,以便及時(shí)采取措施進(jìn)行應(yīng)對(duì)。
通過(guò)不斷優(yōu)化和提升告警系統(tǒng)的功能、性能、穩(wěn)定、精準(zhǔn)性,可以更好地保障各個(gè)領(lǐng)域的安全和穩(wěn)定運(yùn)行。
01 告警平臺(tái)價(jià)值
提高生產(chǎn)效率,降低維護(hù)成本
告警平臺(tái)能夠?qū)崟r(shí)監(jiān)控生產(chǎn)設(shè)備的運(yùn)行狀態(tài),包括溫度、壓力、振動(dòng)、電流、電壓等關(guān)鍵參數(shù)。
一旦這些參數(shù)超出預(yù)設(shè)的安全范圍或達(dá)到故障閾值,系統(tǒng)能立即發(fā)出告警,通知相關(guān)人員及時(shí)處理,從而避免設(shè)備損壞或生產(chǎn)中斷,確保生產(chǎn)線的高效運(yùn)行。
告警平臺(tái)能夠及時(shí)發(fā)現(xiàn)設(shè)備故障,從而減少因設(shè)備停機(jī)導(dǎo)致的生產(chǎn)延誤和損失。這有助于降低因停機(jī)造成的直接和間接成本。
提升安全管理水平,優(yōu)化資源配置
在涉及高溫、高壓、易燃易爆等危險(xiǎn)因素的生產(chǎn)環(huán)境中,告警平臺(tái)對(duì)于保障人員和設(shè)備安全至關(guān)重要。通過(guò)實(shí)時(shí)監(jiān)控和及時(shí)告警,系統(tǒng)能迅速識(shí)別并處理潛在的安全隱患,防止事故的發(fā)生。
告警平臺(tái)能夠根據(jù)告警信息的緊急程度和重要性,智能調(diào)度維護(hù)人員,確保資源得到最優(yōu)配置。這有助于提高維護(hù)工作的效率和質(zhì)量。
推動(dòng)技術(shù)進(jìn)步,帶動(dòng)產(chǎn)業(yè)升級(jí)
告警平臺(tái)的建設(shè)和發(fā)展,促進(jìn)了傳感器技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析、人工智能算法等技術(shù)的不斷創(chuàng)新和應(yīng)用。這些技術(shù)的融合和應(yīng)用,為預(yù)警系統(tǒng)的智能化、精準(zhǔn)化提供了有力支持。
隨著預(yù)警系統(tǒng)在各個(gè)領(lǐng)域的廣泛應(yīng)用,相關(guān)產(chǎn)業(yè)鏈也得到了快速發(fā)展。從傳感器制造、數(shù)據(jù)分析軟件開(kāi)發(fā)到系統(tǒng)集成服務(wù)等領(lǐng)域,都迎來(lái)了新的發(fā)展機(jī)遇。
提升企業(yè)競(jìng)爭(zhēng)力
通過(guò)實(shí)時(shí)監(jiān)控和數(shù)據(jù)分析,企業(yè)可以及時(shí)發(fā)現(xiàn)生產(chǎn)過(guò)程中的問(wèn)題并進(jìn)行改進(jìn),從而提高產(chǎn)品質(zhì)量。
告警平臺(tái)能夠縮短故障處理時(shí)間,提高生產(chǎn)線的穩(wěn)定性和靈活性,使企業(yè)能夠更快地響應(yīng)市場(chǎng)需求變化。
02 告警平臺(tái)產(chǎn)品設(shè)計(jì)
1、角色用例
▲ 用例圖
告警平臺(tái)要正常運(yùn)轉(zhuǎn),服務(wù)于實(shí)際業(yè)務(wù),需要四類角色,設(shè)備管理員、系統(tǒng)管理員、告警處理員、領(lǐng)導(dǎo)。
設(shè)備管理員:負(fù)責(zé)設(shè)備接入,提供設(shè)備信息采集,獲取告警的數(shù)據(jù)源;
系統(tǒng)管理員:負(fù)責(zé)系統(tǒng)的配置,尤其是告警規(guī)則、通知規(guī)則等基礎(chǔ)數(shù)據(jù)的配置;
告警處理員:負(fù)責(zé)告警的全生命周期管理,包含處理、驗(yàn)證、關(guān)閉;當(dāng)部分告警不能直接處理是,需要上報(bào)領(lǐng)導(dǎo)知曉;
領(lǐng)導(dǎo):負(fù)責(zé)升級(jí)告警管理,包含處理、驗(yàn)證、關(guān)閉;同時(shí),也需要肩負(fù)起監(jiān)督告警處理員對(duì)告警的及時(shí)處理;
角色用例的分析,是明白有哪些人員角色參與系統(tǒng)操作、業(yè)務(wù)執(zhí)行,為深度業(yè)務(wù)分析提供突破口。
2、用戶故事
▲ 用戶故事
講清楚用戶故事,可以串聯(lián)完完整的業(yè)務(wù)流程,梳理清楚所有的分支流程,也為后續(xù)測(cè)試時(shí)提供全部檢驗(yàn)條件。
什么事物 在什么時(shí)間 在什么環(huán)境 下觸發(fā)了哪些告警條件,以怎樣的值來(lái)報(bào)警。
- 實(shí)驗(yàn)室3樓 – 302實(shí)驗(yàn)室 – 溫度超過(guò)37度 – 橙色告警 – 通知實(shí)驗(yàn)室管理員
- 豬舍3棟 氨氣濃度超過(guò)36 / m3 且 二氧化碳濃度超過(guò) 83 /m3 – 紅色告警 – 通知養(yǎng)殖場(chǎng)廠長(zhǎng)
- 2樓206小會(huì)議室 – 火警 – 紅色告警誤報(bào)
- 實(shí)驗(yàn)室3樓 – 302實(shí)驗(yàn)室 – 溫度超過(guò)43度 – 紅色告警 – 通知樓長(zhǎng)【告警級(jí)別升級(jí)】
- 實(shí)驗(yàn)室3樓 – 302實(shí)驗(yàn)室 – 溫度超過(guò)43度 – 紅色告警 – 通知樓長(zhǎng)【之前還未處理,又有告警,告警升級(jí)】
- 綜合樓4樓 – 過(guò)道 – 風(fēng)速偏大 – 藍(lán)色告警 – 通知保安室 – 忽略告警
在告警用戶故事這一塊,用戶故事1和5,梳理清楚同一個(gè)規(guī)則生成告警,前告警已處理、未處理的兩個(gè)不同流程。當(dāng)前告警還未處理時(shí),再次生成更高級(jí)別的告警,就是告警的升級(jí)。
在實(shí)際處理時(shí),高級(jí)別告警處理后,前置的告警將再無(wú)處理必要。
3、告警業(yè)務(wù)流程
▲ 業(yè)務(wù)流程
設(shè)備接入為前置性條件,設(shè)備數(shù)據(jù)采集為告警提供數(shù)據(jù)源。告警業(yè)務(wù)擴(kuò)寬,需要支持統(tǒng)計(jì)數(shù)據(jù)等作為數(shù)據(jù)源。
告警平臺(tái)系統(tǒng)管理員進(jìn)行告警配置,包含告警規(guī)則、通知規(guī)則配置。告警規(guī)則主要配置哪個(gè)設(shè)備的哪個(gè)屬性值,在什么情況下生成告警;通知規(guī)則主要配置告警生成后通過(guò)哪些途徑通知哪些人。
告警處理流程包含處理、驗(yàn)證、關(guān)閉;處理是針對(duì)出現(xiàn)的這個(gè)情況,有什么解決方案,可以確定誤報(bào)、忽略;
驗(yàn)證是確認(rèn)該告警的處理方案實(shí)際落地,比如溫度過(guò)高報(bào)警,通過(guò)打開(kāi)空調(diào)的方式處理,驗(yàn)證空調(diào)已打開(kāi),且溫度設(shè)置23度,是有效的處理方式。然后可以關(guān)閉報(bào)警,當(dāng)前事項(xiàng)處理完成。
告警處理需要考慮,當(dāng)前告警處理員處理不了這個(gè)告警的情況,支持告警升級(jí)。
業(yè)務(wù)流程中,為了提升便捷度,特別增加當(dāng)告警被處理時(shí),直接修改對(duì)應(yīng)消息的狀態(tài),減少信息干擾。
4、ER圖設(shè)計(jì)
▲ ER圖
基于以上業(yè)務(wù)流程分析,拆解出來(lái):告警規(guī)則、告警、告警消息規(guī)則、告警消息信息實(shí)體,也是告警平臺(tái)的主要庫(kù)表。告警的處理、升級(jí)、驗(yàn)證、關(guān)閉都作為告警子表來(lái)進(jìn)行設(shè)計(jì)。
拆解到ER圖的層級(jí),是為了很好的跟前后端開(kāi)發(fā)溝通。也便于從數(shù)據(jù)的角度理解系統(tǒng)中數(shù)據(jù)的存儲(chǔ)、查詢、更新。同時(shí)也明確主要信息,產(chǎn)品心中做到有數(shù)。
5、狀態(tài)機(jī)管理
▲ 狀態(tài)機(jī)
基于ER圖拆解,告警、告警消息的狀態(tài)進(jìn)行詳細(xì)的拆分。
狀態(tài)機(jī)明確了告警、告警信息有哪些狀態(tài),各狀態(tài)下可執(zhí)行哪些操作,各狀態(tài)對(duì)應(yīng)通過(guò)哪些操作進(jìn)行狀態(tài)切換。
其中,告警消息有一個(gè)“待下發(fā)”狀態(tài),這個(gè)在業(yè)務(wù)上實(shí)際是不需要,只是為便捷信息溯源,確保數(shù)據(jù)生成到數(shù)據(jù)消失,全部都在可控范圍內(nèi)。
03 升級(jí)告警平臺(tái)
系統(tǒng)建設(shè)、方案設(shè)計(jì)、產(chǎn)品設(shè)計(jì),都可以遵循:路走通,路好走,路擴(kuò)寬。
大道至簡(jiǎn),但中間的路途并非一馬平川的。
▲ 大道至簡(jiǎn)
功能完善優(yōu)化
基于以上,完成了告警平臺(tái)核心功能的梳理和搭建。要提高一個(gè)產(chǎn)品的易用性,擴(kuò)展產(chǎn)品的影響面,在交互細(xì)節(jié)上還需要更細(xì)致、更強(qiáng)化,需要盡可能補(bǔ)全所有的業(yè)務(wù)流程。
也可以預(yù)留一部分運(yùn)維功能(如強(qiáng)制修改狀態(tài),可以讓業(yè)務(wù)流重新流轉(zhuǎn))。
在告警平臺(tái)上,優(yōu)先補(bǔ)充“支持多條件組合告警”,實(shí)現(xiàn)更復(fù)雜、更有效的、更符合業(yè)務(wù)現(xiàn)狀的配置條件。
其次是補(bǔ)充“人工告警”,支持異常情況的手動(dòng)告警路徑,確保在數(shù)據(jù)同步、規(guī)則判斷出現(xiàn)異常時(shí),能夠有快速業(yè)務(wù)執(zhí)行的通道。
消息系統(tǒng)是個(gè)很好的輔助,通過(guò)消息來(lái)告知用戶是否需要關(guān)注。但若是消息過(guò)多、準(zhǔn)確性不高,消息系統(tǒng)就容易成為雞肋。
在實(shí)際執(zhí)行中,要支持設(shè)置消息的忽略與靜默,在不恰當(dāng)、不關(guān)鍵的場(chǎng)景中,不提示消息。另外,當(dāng)業(yè)務(wù)已經(jīng)處理,最好將相關(guān)的消息置為已讀,不再吸引用戶的注意力,從而減少用戶的處理,減少系統(tǒng)對(duì)用戶的干擾。
擴(kuò)展告警業(yè)務(wù)范圍、擴(kuò)展告警信息源
當(dāng)庫(kù)存低于安全閾值時(shí),預(yù)警平臺(tái)可以自動(dòng)提醒庫(kù)管進(jìn)行補(bǔ)貨;當(dāng)應(yīng)收賬款逾期時(shí),可以提醒財(cái)務(wù)人員關(guān)注并跟進(jìn)。
在安全領(lǐng)域,預(yù)警告警平臺(tái)可以實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)流量、系統(tǒng)日志等關(guān)鍵信息,一旦發(fā)現(xiàn)異常行為或潛在威脅,立即發(fā)出警報(bào),有助于企業(yè)迅速響應(yīng)并采取措施,保障系統(tǒng)安全穩(wěn)定運(yùn)行。
告警對(duì)象分級(jí)分組管理
將告警信息按照重要性、緊急程度或影響范圍進(jìn)行分層分類。例如,將告警分為事故類(1級(jí))、異常類(2級(jí))、越限類(3級(jí))、變位類(4級(jí))和告知類(5級(jí))等不同級(jí)別。
對(duì)于不同級(jí)別的告警,制定相應(yīng)的管理要求和處理流程。高級(jí)別的告警需要由專門(mén)的團(tuán)隊(duì)或人員立即處理,而低級(jí)別的告警則可以由相對(duì)寬松的團(tuán)隊(duì)或人員在規(guī)定時(shí)間內(nèi)處理。
根據(jù)響應(yīng)人員的專業(yè)技能、經(jīng)驗(yàn)和職責(zé)范圍,將其分為不同的響應(yīng)小組。每個(gè)小組負(fù)責(zé)處理特定類型或級(jí)別的告警。
例如,設(shè)立專門(mén)的網(wǎng)絡(luò)安全小組負(fù)責(zé)處理網(wǎng)絡(luò)安全相關(guān)的告警,而數(shù)據(jù)中心運(yùn)維小組則負(fù)責(zé)處理服務(wù)器和存儲(chǔ)設(shè)備的告警。
告警系統(tǒng)通過(guò)實(shí)時(shí)監(jiān)控與分析、智能化告警處理、合理的資源分配算法以及響應(yīng)人員的分組分級(jí)等策略,可以優(yōu)化資源配置并提高響應(yīng)效率。
這些措施有助于企業(yè)更好地應(yīng)對(duì)各種潛在風(fēng)險(xiǎn)和挑戰(zhàn),保障業(yè)務(wù)的連續(xù)性和高效性。
AI告警
隨著大數(shù)據(jù)、區(qū)塊鏈、虛擬幣等新技術(shù)新業(yè)態(tài)的不斷發(fā)展,新型電信網(wǎng)絡(luò)詐騙案件日益增加,嚴(yán)重影響網(wǎng)絡(luò)空間穩(wěn)定和人民群眾財(cái)產(chǎn)安全?;ヂ?lián)網(wǎng)預(yù)警勸阻平臺(tái)通過(guò)精準(zhǔn)識(shí)別詐騙信息并提示潛在受害人,有效遏制了詐騙行為的蔓延。
利用人工智能和機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)告警的智能化處理。例如,采用動(dòng)態(tài)閾值(區(qū)間檢測(cè)功能),根據(jù)歷史數(shù)據(jù)預(yù)測(cè)指標(biāo)上下邊界,自動(dòng)調(diào)整閾值,從而避免資源在靜態(tài)閾值下的浪費(fèi)或不足。
引入趨勢(shì)性預(yù)測(cè)功能,根據(jù)歷史數(shù)據(jù)預(yù)測(cè)未來(lái)告警數(shù)量,以便企業(yè)提前準(zhǔn)備資源,應(yīng)對(duì)可能的問(wèn)題。
告警平臺(tái)對(duì)于提高生產(chǎn)效率、降低維護(hù)成本、優(yōu)化資源配置、提升安全管理水平和提升企業(yè)競(jìng)爭(zhēng)力等方面都具有重要意義。
新技術(shù)不斷發(fā)展,新業(yè)務(wù)需求不斷擴(kuò)展,告警平臺(tái)也將在實(shí)際應(yīng)用中完善、優(yōu)化、升級(jí)、進(jìn)化。
本文由人人都是產(chǎn)品經(jīng)理作者【壹叁零壹】,微信公眾號(hào):【壹叁零壹】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!