यह शनिवार की शाम को मेरी पत्नी के साथ शुरू हुआ, जिसमें पूछा गया कि हमारे डीवीआर ने अचानक एक शो खेलना बंद कर दिया, जिसे वह देख रही थी। मैंने उससे कहा कि यह शायद कुछ गड़बड़ था, लेकिन मैं एक नज़र डालूंगा। मैं देखने के लिए परिवार के कमरे में चलता हूं, और त्रुटि ने मूल रूप से कहा कि अंतर्निहित डिस्क अब उपलब्ध नहीं थी। अच्छा नही! यह मेरी तीन दिवसीय डरावनी कहानी की शुरुआत थी …
थोड़ी पृष्ठभूमि
मेरा डीवीआर वास्तव में एक पीसी पर चलने वाले विशेष सॉफ्टवेयर (उन लोगों के लिए सेजटीवी) हैं जो उत्सुक हैं। सॉफ्टवेयर बहुत लचीला है और आपको इसके सभी विभिन्न पहलुओं को अलग करने देता है। मेरे पास केंद्रीकृत नियंत्रण, शेड्यूलिंग और रिकॉर्डिंग के लिए एक अलग मशीन है, प्लेबैक के लिए अलग मशीन है, और इस कहानी का सितारा, भंडारण के लिए एक अलग मशीन है। भंडारण के लिए मैं एक लिनक्स फ़ाइल सर्वर का उपयोग करता हूं, कई अलग-अलग, गैर-समान ड्राइवों को एक बड़े (वर्तमान में 6TB) लॉजिकल ड्राइव में ऑपरेटिंग सिस्टम को देखने के लिए LVM (लॉजिकल वॉल्यूम मैनेजर) का उपयोग करता है। चूंकि कई टीबी डेटा का बैकअप लेना अव्यावहारिक है, और चूंकि कहा गया है कि डेटा "सिर्फ" टीवी शो है, इसलिए इसके लिए मेरा बैकअप दर्शन हमेशा ध्यान नहीं रहा है। हाल की घटनाओं तक, इस दर्शन का वास्तविक दुनिया की घटना से परीक्षण नहीं किया गया था।
डेटा पुनर्प्राप्त करने का प्रयास
डीवीआर पर त्रुटि को देखते हुए, मैं तुरंत स्टोरेज सर्वर को देखना शुरू कर देता हूं। फाइलसिस्टम अविश्वसनीय रूप से सुस्त और प्रतिक्रिया करने में धीमा है, इसलिए मैं LVM को उसके तार्किक आयतन के आधार पर भौतिक ड्राइव की स्थिति के बारे में बताता हूं। काफी देर के बाद, यह ऊपर आता है और कहता है कि 750 जीबी ड्राइव गायब है। उह ओह! मैं सर्वर को रिबूट करता हूं और आश्चर्यजनक रूप से, ड्राइव वापस आता है। मैं उस ड्राइव से सभी डेटा को स्वचालित रूप से माइग्रेट करने के लिए एक pvmove कमांड जारी करता हूं, लेकिन यह 2% से कम पूर्ण होने पर विफल हो जाता है।
एक ड्राइव के साथ सामना किया गया है जो इसके डेटा को पढ़ने के बारे में बहुत असहयोगी है, लेकिन कम से कम BIOS में दिखाता है, मैं अपने पसंदीदा ड्राइव रिकवरी टूल, स्प्राइट में बदल जाता हूं। हालांकि स्पिनट्राइट आम तौर पर हटाने योग्य मीडिया से बूट करता है, वर्षों पहले मैंने विभिन्न उपयोगिताओं के लिए अपने घर पर नेटवर्क बूटिंग की स्थापना की, इसलिए मुझे किसी भी मीडिया पर नज़र रखने के बारे में चिंता करने की ज़रूरत नहीं थी। आम तौर पर मैं सिर्फ अपने नेटवर्क से जुड़ता हूं, नेटवर्क से बूट का चयन करता हूं, और कई समस्याओं को ठीक करने के लिए मेरे पास कई उपकरण हैं। समस्या यह है कि यह सभी जादू का काम करने वाली मशीन वही मशीन है जो वर्तमान में नीचे है। कोई बड़ी बात नहीं, मैं कहता हूँ, मैं सिर्फ एक स्पिनरिट सीडी से बूट करूँगा। कुछ साल पहले मेरे फाइल सर्वर पर ऑप्टिकल ड्राइव ने भूत छोड़ दिया। उस समय जो हुआ, मैंने तय किया कि जब से मैं उस मशीन में ऑप्टिकल मीडिया का उपयोग नहीं करता, मुझे इसे बदलने की आवश्यकता नहीं थी। कोई चिंता नहीं, मैंने खुद से कहा, मैं अपने मुख्य कंप्यूटर से सिर्फ ऑप्टिकल ड्राइव निकालूंगा। मैं अपने मुख्य कंप्यूटर को बंद कर देता हूं और ऑप्टिकल ड्राइव निकाल लेता हूं। फिर मैं अपने स्पिनराइट बूट सीडी की तलाश करता हूं। यह नहीं मिल सकता है! हम कुछ महीने पहले एक नए घर में चले गए, इसलिए सब कुछ अस्त-व्यस्त है। मुझे लगता है मैं सिर्फ एक नई प्रति जलाऊंगा, लेकिन मुझे कोई खाली ऑप्टिकल मीडिया भी नहीं मिल रहा है! अगली योजना पर, एक बूट करने योग्य फ्लैश ड्राइव! Google पर कुछ मिनटों के बाद मेरी मेमोरी को रीफ्रेश करने के लिए, मेरे पास एक बूटेबल स्प्राइट फ्लैश ड्राइव है। मैं अपने लिनक्स बॉक्स को बूट करता हूं और स्पिनराइट लॉन्च करता हूं। कंप्यूटर जम जाता है और दुर्घटनाग्रस्त हो जाता है। चरों को खत्म करने की कोशिश करते हुए, मैं खराब ड्राइव को पीसीआई-ई विस्तार कार्ड में प्लग करने से सीधे मदरबोर्ड में प्लग किया जा रहा हूं। अब स्पिनराइट ठीक लॉन्च करता है, लेकिन इससे जुड़े ड्राइव को एन्यूमरेट करने में उम्र और उम्र लगती है। मैं बुरी तरह को छोड़कर अन्य सभी ड्राइवों को व्यवस्थित रूप से अनप्लग करता हूं, लेकिन यह कभी भी एनुमरेटिंग ड्राइव को खत्म नहीं करता है, चाहे मैं कितनी भी प्रतीक्षा करूं। अगली योजना पर! मैं अपने लिनक्स बॉक्स से ड्राइव निकालता हूं, इसे अपने मुख्य कंप्यूटर से जोड़ता हूं, और अपने चमकदार नए स्पिनराइट फ्लैश ड्राइव से बूट करता हूं। स्पिनराइट ने ड्राइव को तुरंत लॉन्च किया और देखा, और मैं इसे डेटा को पुनर्प्राप्त करना शुरू करने के लिए कहता हूं, संतुष्ट हूं कि मैं कुछ प्रगति कर रहा हूं। मैं शायद 10 मिनट के बाद उस पर जांच करने के लिए वापस जाता हूं, और स्क्रीन पर एक त्रुटि है, और ऐसा लगता है कि ड्राइव एक बार फिर गायब हो गई है। निराश होकर, मैं कुछ और बार कोशिश करता हूं, और स्पिनराइट को ड्राइव के विभिन्न भागों में शुरू करने के लिए कहता हूं, लेकिन हर बार एक ही परिणाम प्राप्त करता हूं। ऐसा लगता है कि यह सब के बाद मेरी मदद करने के लिए नहीं जा रहा है।
तर्कहीन आशा के अनुरूप, मैंने ड्राइव को अपने लिनक्स बॉक्स में वापस डाल दिया और इसे शक्ति प्रदान की। मेरे विस्मय के लिए, ड्राइव दिखाता है और LVM सब कुछ सक्रिय करता है। आगे अपनी किस्मत आजमाते हुए, मैं एक और pvmove कमांड जारी करता हूं ताकि ड्राइव को फिर से डेटा स्थानांतरित करने का प्रयास किया जा सके। आरंभ में, मैं ड्राइव से पढ़ने में सक्षम नहीं होने के बारे में त्रुटि संदेश देखता हूं, लेकिन आश्चर्यजनक रूप से, pvmove प्रगति करना जारी रखता है, 100% पूरा होने के करीब और करीब हो रहा है। भ्रम, राहत और उत्साह का मिश्रण मेरे ऊपर था। क्या मैं इस असंतुष्ट से दूर जाने वाला हूं? अफसोस की बात है, एक pvmove को साफ करने के लिए कवर के तहत LVM आखिरी चीज करता है, इसके नियंत्रण में सभी ड्राइव पर एक अद्यतन लॉग लिखना है। जब यह खराब ड्राइव पर लिखने की कोशिश करता है, तो यह निश्चित रूप से विफल हो जाता है, और इस प्रकार यह पूरी प्रक्रिया को निरस्त कर देता है। हार जीत के जबड़े से एक बार फिर छीन लिया! मैं Google में वापस गोता लगाता हूं, और यह पता लगाना संभव है कि एक शॉट में सभी डेटा को स्थानांतरित करने के बजाय pvmove कमांड कितना डेटा स्थानांतरित करता है। मैं इसके साथ प्रयोग करता हूं और एक समय में मेरे डेटा के एक छोटे हिस्से को ले जाने में अच्छी सफलता मिलती है। मैं लालची हो जाता हूं और ड्राइव कुछ समय के लिए गायब हो जाता है, लेकिन हमेशा कंप्यूटर के एक शक्ति चक्र के बाद वापस आता है। यह सिद्ध करते हुए कि शायद ड्राइव के केवल कुछ भाग खराब हैं, मैं ड्राइव की शुरुआत में काम करने के बजाय इधर-उधर कूदना शुरू कर देता हूं। इसके कुछ पुनरावृत्तियों के बाद, मेरे पास 750 जीबी में से 40 जीबी सुरक्षित रूप से ड्राइव से दूर चले गए। शेष 40 जीबी के लिए, यह कोई फर्क नहीं पड़ता कि मैंने क्या कोशिश की। अब रविवार की शाम थी और मैं थका हुआ था, इसलिए मैंने अगले दिन बिस्तर पर जाने और इस समस्या से निपटने का फैसला किया।
अगले दिन, कुछ नींद और काम पर अपने दिन की पहली छमाही के बाद, मैं सिर्फ बुलेट काटने का फैसला करता हूं क्योंकि मैंने पिछले 40 जीबी रिकॉर्ड किए गए टीवी शो की परवाह नहीं की, और अपने LVM कॉन्फ़िगरेशन से ड्राइव को हटाने के बारे में सेट किया । मैंने पहले भी कई बार ऐसा किया है, इसलिए यह काफी आसानी से हो जाता है। क्लीनअप सूची पर अगला फाइलसिस्टम के बीच में छेद की मरम्मत कर रहा है। मैं 750 GB के बजाय केवल 40 GB के साथ लापता हूँ, यह बहुत बुरा नहीं हो सकता है, है ना? गलत! मरम्मत के बाद, मेरे पास अग्नि परीक्षा शुरू होने से पहले की तुलना में 900 जीबी अतिरिक्त खाली जगह थी, ताकि थोड़ा बहुत डंक पड़े। ओह ठीक है, मैं खुद को बताता हूं, यह वैसे भी सिर्फ टीवी था। मेरा डीवीआर अंततः अपने तीन दिवसीय अंतराल के बाद फिर से कार्यात्मक है, और मैं हर अतिरिक्त मस्तिष्क चक्र के साथ इस बारे में सोचना बंद कर सकता हूं।
सीख सीखी
तो मैंने इस सब से क्या सीखा? मुझे एक बेहतर काम करना चाहिए था जो वास्तव में मायने रखता था। यह कुछ हफ्ते पहले हुआ था, और उस समय में मैंने टीवी की कोई भी सामग्री गायब नहीं की थी। हालांकि, मैं खुद को रोकने के लिए अफसोस करता हूं, लेकिन इससे भी महत्वपूर्ण बात यह है कि मेरे परिवार को तीन दिनों के लिए टीवी का उपयोग करने में सक्षम होने के लिए, और उन तीन दिनों के लिए खुद को उच्च-तनाव संकट मोड में डालने के लिए। अगर मैंने शुरुआत में अपना डेटा रिकवर करने पर छोड़ दिया होता, तो तीन दिन नहीं, लगभग एक घंटे में फंक्शन बहाल हो जाता। मैं यह भी अच्छी तरह से जानता हूं कि ज्यादातर समय हमारा डेटा कीमती होता है, लेकिन इस स्थिति में ऐसा नहीं था।
दूसरे, यदि आपका डेटा वास्तव में कीमती है, और 99% समय यह वास्तव में है, तो आपको इसकी रक्षा करने की आवश्यकता है! अपने डेटा का बैकअप लें, कोई बहाना नहीं है। मेरे डेटा के लिए जो अपूरणीय है, जैसे मेरे बेटे की हजारों तस्वीरें मेरे कंप्यूटर पर हैं, मैं इसे तीन स्थानों से कम में बैक अप करना सुनिश्चित करता हूं, जिनमें से एक क्लाउड बैकअप प्रदाता है। डीवीआर भंडारण के रूप में, मुझे अभी भी यह नहीं लगता कि इसे क्लाउड पर वापस करना व्यावहारिक है, लेकिन इन दिनों ड्राइव की कीमत के साथ, मेरे पास इसे संरक्षित करने के लिए कोई बहाना नहीं है RAID द्वारा संरक्षित है, और बस यही मैं हूँ करने जा रहा हूँ। जब मैंने पहली बार अपने स्टोरेज क्लस्टर की स्थापना की थी, तो मुझे लगता है कि मल्टीपल टीबी के पूल में जाने के लिए मुझे 10 ड्राइव या उससे अधिक समय लगा। मैंने अभी कीमतों की जांच की है, और आप $ 100 के तहत अब 3 टीबी ड्राइव खरीद सकते हैं। मेरे पास अपने डेटा को असुरक्षित छोड़ने का कोई बहाना नहीं है, और अगर इस तरह से एक डेटा हानि मुझे फिर से होती है, तो यह वास्तव में मेरी अपनी गलती है।






