有效的故障排除是技術人員的核心能力。有些人聲稱這是一種與生俱來的技能,可以用來識別問題並進行維修。對其他人來說,這是一種超能力;有些人天生就擁有修理複雜系統(例如圖 1 所示的基於可程式邏輯控制器(PLC)的系統)的訣竅。
這倒也說得過去。
根據我的經驗,電氣與電子系統的故障排除是一項可以系統性傳授的技能。在軍事領域,這項技能已經歷代傳承,並逐步發展出一套成熟的訓練方法。隨著技術的轉移與應用,一些軍事訓練模式也被引入商業領域。無論是軍隊還是企業,都迫切需要能夠迅速恢復設備運作的高技能技術人員。
圖 1:部分完成的 PLC 培訓器圖片,其中包含 Schneider Modicon PLC 和 HMI。
安全
安全十分重要,因為看似無害的系統也可能危及生命和肢體。技術人員可能會觸電、窒息、溺水、被擠壓、手套被扯脫、被纏繞、失明、感染霍亂、肺塌陷、電弧和爆炸燒傷,以及其他數百種不幸事件。
本文無法全面探討安全性問題。我們只想提出一些總體思路:
-
遵循上鎖掛牌(Lock Out Tag Out,LOTO)程序,確保設備在電氣、機械、氣動和液壓方面的安全。
-
了解並遵守地區法規,包括當地職業安全與健康標準。
-
遵守雇主的安全規定。積極參與培訓計劃也是一個好主意。如果您的雇主沒有針對技術人員的書面安全規定,請花時間研究並制定您自己的規定。
-
根據任務要求使用個人防護裝備(PPE)。
-
與工作夥伴一起工作。
-
取下所有手錶、戒指和其他導電金屬。防止長髮以及脖子上掛著的領帶或員工徽章等物品在工作時被纏繞。
-
尤其要警惕自滿情緒。當你愚蠢地將自己的人身安全委託給他人時,即使是安全文化也會變得危險。沒有人比您更關心您的人身安全。此外,您很可能是工廠中少數能夠識別和理解相關安全風險的人之一。
身為技術人員,您有責任保障自身和他人的安全。
技術提示:在維修配電盤上工作時務必小心,尤其是在電氣安全聯鎖裝置失效的情況下。一旦聯鎖裝置啟動,您將面臨致命的高壓電。一時疏忽大意,就可能釀成災難。清晰明了的安全政策和嚴格執行,對於技術人員和操作員的安全十分重要。
海軍六步故障排除
以下是一位在美國海岸防衛隊服役27年、擔任技術員的軍官,分享其服役期間的經歷與獨特見解。
海軍六步驟故障排除程序是一種有效的故障排除技術。程式概述於海軍電氣和電子訓練系列(Navy Electricity and Electronics Training Series,NEETS)第19模組《技術手冊》(NAVEDTRA 14191)。這種方法不僅適用於基於現代可程式邏輯控制器(PLC)的工業設備,也適用於本材料最初編寫時正在使用的真空管機電調諧無線電發射器和接收器。
文件指出:
您的工作可能是維護或協助維護某些電氣或電子單元、子系統或系統。其中一些工作可能很複雜,但即使是複雜的工作也可以分解成簡單的步驟。基本上,任何電氣或電子設備的維修都應按以下順序進行:
症狀識別。這是識別電子設備中某些異常或故障的操作。
症狀詳解。此步驟的目的是取得故障症狀的更詳細描述。
列出可能的故障功能。此步驟適用於包含多個功能區域或單元的裝置。根據您收集的信息,故障在邏輯上可能位於何處?
定位故障功能。在此步驟中,您將確定多單元設備中哪個功能單元實際故障。
將故障定位到電路。在此步驟中,您將進行廣泛的測試,以將故障隔離到特定電路。
故障分析。此步驟包含多個部分。在這裡,您可以確定哪個部件有故障,修理/更換該部件,確定故障的原因,使設備恢復到正常運作狀態,並將必要的資訊記錄在記錄簿中以供其他維護人員使用。
步驟 1:症狀識別
要識別故障,您需要了解您的設備。這包括對設備操作(包括循環時間和順序)建立直覺的感知。積極主動,快速學習設備操作。畢竟,如果您不懂操作,又如何有效地維修設備呢?
安全也是一個重要的考慮因素,因為您必須知道如何保護自己和他人免受危險情況的困擾。熟悉設備操作所需的時間和精力是無可取代的。
如果未能完成此關鍵步驟,您將在操作員和生產經理眼中損害您的專業聲譽。您將感受到痛苦,因為設備停機每分鐘將給公司造成數百甚至數千美元的損失。
步驟 2:症狀詳解
接聽服務電話時,請務必暫停片刻,仔細辨別設備的所有故障點。我們常常會陷入狹隘的思維,只專注在第一個症狀。雖然這或許可以修復問題,但可能無法修復問題本身。更糟的是,技術人員在修復問題後離開,而設備仍然處於失修狀態。這會導致再次上門維修,可能造成設備損壞、收入損失,當然還有聲譽受損。
對於許多系統來說,運行或嘗試運行設備完成一個完整的週期就足夠了。顯然,在故障點之後繼續運行是沒有意義的。
我們必須認識到,使用標準操作程序(Standard Operating Procedures,SOP)可以增強系統詳解。這可以防止操作員和技術人員犯下常見的錯誤。請記住,SOP 是一個清單,其中包含針對特定場地和設備的初步設定、操作說明、正常關機和緊急說明。一個嚴格且密切相關的例子是飛行員和地勤人員用來驗證飛機是否準備就緒的特定飛機飛行前檢查清單。
技術提示 :熟悉 SOP 是先前症狀識別和系統闡述的重要面向。如果您沒有書面的 SOP,請立即建立一份正確書寫的 SOP 作為首要任務。這非常值得您投入時間,因為 SOP 是培訓新員工和減少設備停機時間的基礎。
另外,進行系統性闡述時,切勿依賴記憶。要將所有內容記錄下來。最佳實務是為每台設備維護服務日誌。這可以是與機器一起保存的紙本日誌,也可以是公司係統中保存的電子副本。
使用日誌記錄症狀、故障排除步驟和維修說明。這些操作將節省大量時間,尤其是在設備由多名不同人員維護的情況下。此外,請務必記錄服務請求的初始原因以及操作員觀察到的症狀。這有助於解決間歇性故障或溫度相關故障,這些故障通常難以排除。
在哪裡可以發現故障症狀
工業機械中使用的組件在設計時就考慮到了故障排除。一些基本但重要的範例包括:
-
前面板指示燈
-
PLC 表面的 LED 指示燈,例如圖 2 所示的 Siemens S7-1200 PLC。這也適用於插入式模組和擴充模組。
-
現場設備(例如感測器和執行器)主體上的 LED 指示燈。一個典型的例子是氣動或液壓系統,其方向控制閥(Directional Control Valve,DCV)上有 LED,氣缸位置感知器上也帶有 LED 指示燈。
-
與控制繼電器相關的 LED 指示燈。
-
繼電器電樞的物理位置。
-
插入式繼電器的操作。
-
現場設備(例如電機、氣缸或電動閥(Motor Operated Valve,MOV)的物理動作。
再次強調,了解機器的運作和正常運作週期十分重要。如果沒有這些關鍵訊息,您將不知道何時或在哪裡需要特別留意。
安全須知:切勿用手尋找漏氣或液壓洩漏,因為這可能造成一種毀滅性的損傷,需要進行大規模手術才能挽救受影響的肢體。
先進的機器可能包含以下附加資訊:
-
儲存在雲端或本機資料庫中的帶時間戳記的錯誤日誌
-
人機介面(Human Machine Interface,HMI)
這些日誌的適用性與系統程式設計師的技能和想像力直接相關。汽車就是一個很好的例子。工程師設計了一個系統,可以根據汽車感測器的回授來檢測、記錄和報告各種錯誤。雖然許多故障可以直接從數據中確定,但仍需要熟練的技術人員來正確解讀數據。盲目依賴內建診斷功能可能會導致昂貴的維修費用,因為很難預測設備可能故障的所有因素的組合和排列。技術人員對設備在工廠中運作的熟悉程度是無可取代的。
圖 2:Siemens S7-1200 PLC 的圖片。
此 PLC 配有 LED 指示燈,用於顯示所有數位輸入和輸出的狀態。
技術提示:請謹慎解讀輸入和輸出 LED 指示燈。雖然它們對於開關或電磁閥驅動訊號等慢速訊號非常有效,但對於快速訊號或脈衝則效果不佳。錯誤解讀 LED 指示燈會為故障排除過程帶來相當大的混亂和延遲。
步驟 3:列出可能的故障功能
到目前為止,所有數據均透過視覺、觸覺和聽覺收集。您會注意到,我們並未使用任何測試設備。相反,我們仔細檢查了設備,並記錄了操作員的描述和所有觀察到的症狀。
此時,技術人員需要回顧並思考所有收集到的數據。目標是找出故障的根本原因,並找出可能在邏輯上導致問題的部分。以圖 3 所示的雷射控制器為例,這是一個典型範例。該設備包含雷射(圖中未顯示)、邏輯卡、定時器和安全繼電器。作為技術人員,我們需要深入調查故障設備,有時甚至是故障組件。
邏輯識別故障功能單元是一個特別具有挑戰性的步驟,因為我們必須抵制只專注於最初症狀的衝動。這可能頗具挑戰性,因為:
-
可能有相互矛盾的症狀
-
也可能存在多個問題
-
問題可能是間歇性的
-
問題可能與溫度有關
-
問題可能並非出在機器本身
-
問題可能是機械性的
-
問題可能是由操作員或技術人員的失誤引起的
-
甚至可能沒有問題,因為設備操作不當
圖3:雷射控制器內部,採用混合系統,包含DIN導軌、開關等工業組件以及客製化PCB。
需要仔細的系統識別,才能從邏輯上識別出故障功能。
步驟 4:將故障定位到電路
至此,我們已經將問題範圍縮小到幾個功能塊。在此故障排除步驟中,我們將進行測試,將問題隔離到電路的特定部分。如果此時我們已經找到問題所在,則應跳至步驟 5,進行全面的故障分析,以確保已確定根本原因。
透過前面的步驟,我們已經有了一個可行的假設,將故障限制在幾個功能塊內。我們的主要目標是系統地進行測試,將問題隔離到單一功能塊,然後再隔離到故障組件。
請注意,這是我們第一次使用線路圖和測試設備。
範例 1
假設您打開控制面板,發現 PLC 的電源指示燈 LED 熄滅。透過故障排除步驟 3,我們已經將故障定位到幾個模組,包括 PLC、交流電轉 24VDC 電源、斷路器、隔離變壓器或主電源本身。 24VDC 電源線也可能有短路。
某些模組可以根據其他症狀排除。例如,請查看與 PLC 共用 24VDC 電源的現場設備。如果感測器對刺激做出反應(亮起),則可以排除許多模組。例如,如果接近指示燈正常,則表示主電源和隔離變壓器正常運作。如果 24VDC 電源輸出讀數有效,則可以確定所有上游模組均已排除。其餘組件包括斷路器、鬆動/斷裂的線路以及 PLC 本身。
繼續使用三用電表,我們可以進行一系列電壓測量,以「半步」(即分而治之)的方式隔離剩餘的模組。我們可以檢查 PLC 端子的電源。如果存在 24VDC,則 PLC 可能有故障。如果不存在,則跳至 PLC 和 24VDC 電源之間的某個位置。
範例 2
一個由風帆開關監控的大型鼓風機系統因 HMI 指示的「空氣損失」故障而關閉。這是一週內針對該故障的第三次回應。設備似乎運作正常。從步驟 3 開始,我們懷疑 PLC、鼓風機或風帆開關故障。然而,在查看日誌後發現,上週第二班的技術員更換了一個故障且缺少風帆的風帆開關。這表示風帆開關安裝不當、風帆太小或開關張力不正確。
我們按照下一步的描述進行故障分析。此外,在風帆開關接點上安裝了一個數據記錄器,用於監測顫動情況。我們讓數據記錄器運行至少一週,直到發現故障模式。
範例 3
假設您到達現場後發現一個系統,兩個獨立馬達啟動器的熱跳脫裝置跳閘了。按下過載阻隔重置按鈕後,看似正常運作的幫浦立即啟動。
這時,一些技術人員會聲稱成功了,關上面板,然後繼續下一個工作。通常,這是一個錯誤,因為他們沒有考慮到故障排除程序的最後一步。
技術提示:啟動馬達是一件非常費力的事情,會導致馬達消耗的電流遠高於額定轉速和扭力運轉時的電流。重複啟動和停止(點動)會導致馬達過熱。這也可能導致馬達啟動器的熱跳脫裝置啟動。
步驟 5:故障分析
本文所述的故障排除流程看似線性過程,六個步驟依序完成。理想情況下確實如此。但實際情況往往是一個混亂的迭代過程,如圖 4 所示,在進入下一步時,您必須回頭思考一些可能遺漏的內容。
圖 4:故障排除通常是一個反覆的過程。
以一個簡單的繼電器為例。根據您對電子學的了解,您知道繼電器線圈的作用類似於電感器;一種儲存磁能的裝置。在直流系統中,通常會將一個二極體(例如 1N4004)或其他類型的緩衝器與繼電器線圈並聯放置。此二極體的放置方式使其在 PLC 關閉繼電器時導通。此操作為繼電器線圈中儲存的「反沖」能量提供了一條路徑。如果沒有這個二極體,繼電器關閉時就會出現高壓尖峰;這個高壓尖峰可能會損壞 PLC 的 I/O 介面。
現在,假設一個帶有半導體輸出的 PLC 的輸出引腳損壞了。此引腳很可能是被開路緩衝器損壞的。也可能是短路緩衝器導致了損壞。無論如何,可以肯定地說,您的專業聲譽與您處理故障分析的方式息息相關。僅僅恢復設備全面運作是不夠的,您必須找出設備損壞的原因,然後採取適當的措施,防止再次發生故障。對於繼電器緩衝器故障,更換PLC不僅成本高昂,而且是短視的維修,因為真正的(根本原因)問題與二極體故障有關。
步驟 6:恢復完全運作狀態
這是故障排除的最後一步。您已確定故障組件,並根據需要維修或更換了零件。在恢復設備完全運作之前,必須採取以下幾個重要措施:
進行全面的功能測試,以驗證設備確實已修復
如前所述,標準作業程序(SOP)有助於指導您完成此過程。實際上,您將返回步驟 1,並重新進行功能測試。這是故障排除過程中的一個重要環節,因為可能存在多個問題。也可能存在技術人員導致的錯誤,例如將機器置於維修模式而不是完全運作狀態。如果遇到未記錄的情況,請務必修改 SOP。
與機器操作員和值班經理溝通
確定流程中是否有缺陷、機器是否有缺陷,或故障是否因操作不當而加劇。如果您無法 100% 確信問題已經解決,那麼這也是讓操作員留意間歇性問題的好時機。
記錄您的工作
這可以透過記錄在機器隨附的日誌中或工廠的官方維護資料庫中來完成。您至少應該記錄以下內容:
-
故障症狀
-
消耗的零件
-
對機器進行的調整
-
維修耗時
-
給未來技術人員的建議
技術提示:已調試的設備和正在開發中的設備之間存在巨大差異。因此,現場技術人員和工程師對系統的看法截然不同。現場技術人員確信系統曾經運作良好,因此可以恢復到完整功能。而工程師、工廠技術人員、系統整合商和工程師則沒有這種信心,因為系統可能從未運作過。
完結前感想
工業控制和自動化系統的故障排除是一個系統性的過程。海軍的六步流程至今仍與最初推出時一樣重要。事實上,隨著現代 PLC 和基於雲端的工業系統的複雜性日益增加,我們可以說它變得越來越重要。正如我最喜歡的務實的 Trekking 工程師曾經說過的那樣:「他們越是過度思考管道,就越容易堵塞排水管。」
有效的故障排除需要技巧、實踐和專注的技巧。
您認為本指南還有哪些不足之處?或有值得分享、供他人參考的實例嗎?歡迎在下面留言交流。最後,別忘了完成文末的問題與批判性思考題,檢視您對內容的理解程度。
問題:
以下問題將有助於鞏固文章內容。
-
為什麼 LOTO 是故障排除最重要的面向?
-
現場設備通常分為哪兩類?
-
請指出海軍六步驟故障排除流程中的各個步驟,並對每個步驟進行簡要說明。
-
為什麼熟悉設備標準作業程序(SOP)對故障排除流程如此重要?
-
判斷對錯:安裝故障零件是故障排除流程的最後一步。
-
判斷對錯:如果前面板電源指示燈亮起,則需要返回步驟1。
-
判斷對錯:LOTO 是海軍六步驟故障排除流程中隱含的步驟。
-
六步驟故障排除流程中的步驟_____類似航空公司的飛行前檢查。
-
六步驟故障排除流程中的步驟_____涉及半步驟操作。
-
請說明手動重設馬達起載器過載保護塊的相關危險。
-
在故障排除中,什麼是「隧道視野」?
-
什麼是「半步」?若要獲得滿分,請提供一個框圖,顯示典型的交流電源與 PLC 24VDC 輸入之間的互連。
-
關於上一個問題,交流電源與 PLC 24VDC 電源之間的電壓測量可能會出現什麼問題?提示:儀表是否有一個中央旋鈕來選擇工作模式?是否存在浮動電壓?最後,儀表和探頭是否至少符合 CAT IV 等級?
-
PLC 的輸入指示燈 LED 在測量以下情況時的可靠性如何:
A) 限位開關發出的穩定開/關訊號?
B) 風帆開關上湍流氣流所造成的間歇性「顫動」?
C) 是否存在脈衝訊號? -
研究 Siemens S7-1200:
A) 正常運作期間哪些指示燈 LED 應隨時亮起?
B) 正常運作期間哪些狀態指示燈 LED 應熄滅? -
研究並反思備受爭議的「安全第三位」這一說法。它對您個人而言意味著什麼?您如何將此概念與職業安全與健康管理局(OSHA)等機構的指示相協調?
批判性思考問題
這些批判性思考問題可以拓展文章內容,讓你對材料及其與相關主題的關係有整體的了解。這些問題通常是開放式的,需要研究,最好以論文形式回答。
-
設備日誌應該保存多久?為什麼?提示:既要考慮未來技術人員的實際需求,也要考慮任何法律/可追溯性問題。
-
這六步驟流程並非一勞永逸。選擇您車間中的一件設備,並為新技術人員制定時間表。假設新技術人員有一些故障排除經驗,但從未在您的工廠見過該設備。提示:您是否預留了安全和工廠熟悉時間?
-
哪些電壓可以用 CAT II 電壓表進行安全測量?您的工業維修套件中是否應該包含 CAT II 電壓表?
-
基於 PLC 的控制面板中可以使用插入式繼電器的原因是什麼?
-
假設一名技術員因違反 LOTO 規定而被多次記過,如果設備操作員因該技術員違反 LOTO 規定而受到傷害,該技術員應承擔責任。那麼,如何正確應對 LOTO 違規行為?提示:這顯然是一個法律問題。然而,從操作員、技術員、工頭和主管的角度來看,這是一個值得思考的問題。