मशीन विजन क्या है और यह कैसे मदद कर सकता है?
यह समझना कि मशीन दृष्टि कैसे काम करती है, यह निर्धारित करने में आपकी सहायता कर सकती है कि मशीन दृष्टि निर्माण या प्रसंस्करण में विशिष्ट अनुप्रयोग समस्याओं को हल करती है या नहीं।
लोग अक्सर यह नहीं समझते हैं कि उत्पादन लाइन या प्रक्रिया के लिए मशीन (कंप्यूटर, कृत्रिम) दृष्टि क्या कर सकती है और क्या नहीं। यह कैसे काम करता है यह समझने से लोगों को यह तय करने में मदद मिल सकती है कि यह किसी एप्लिकेशन में समस्याओं का समाधान करेगा या नहीं। तो कंप्यूटर विजन वास्तव में क्या है और यह वास्तव में कैसे काम करता है?
कृत्रिम दृष्टि एक आधुनिक तकनीक है जिसमें डिजिटल प्रक्रियाओं का उपयोग करके मशीन द्वारा व्याख्या और उपयोग की जा सकने वाली जानकारी बनाने के लिए भौतिक दुनिया की छवियों को प्राप्त करने, प्रसंस्करण और विश्लेषण करने के लिए उपकरण शामिल हैं।
उद्योग में कृत्रिम दृष्टि का उपयोग
कंप्यूटर दृष्टि एक या एक से अधिक कैमरों के उपयोग को स्वचालित रूप से वस्तुओं का निरीक्षण और विश्लेषण करने के लिए संदर्भित करती है, जो अक्सर औद्योगिक या विनिर्माण वातावरण में होती है। परिणामी डेटा का उपयोग प्रक्रियाओं या उत्पादन गतिविधियों को नियंत्रित करने के लिए किया जा सकता है।
यह तकनीक मशीनों को प्रत्येक कार्य के लिए सही निर्णय लेने के लिए आवश्यक जानकारी देकर कार्यों की एक विस्तृत श्रृंखला को स्वचालित करती है।
उद्योग में कृत्रिम दृष्टि का उपयोग उत्पादन प्रक्रियाओं के स्वचालन की अनुमति देता है, जिससे प्रत्येक चरण में गुणवत्ता नियंत्रण और अधिक लचीलेपन के उपयोग के माध्यम से बेहतर उत्पादन परिणाम प्राप्त होते हैं।
वर्तमान में, औद्योगिक कृत्रिम दृष्टि के उपयोग ने उत्पादन प्रक्रियाओं में काफी सुधार किया है। इससे ऑटोमोटिव और खाद्य से लेकर इलेक्ट्रॉनिक्स और लॉजिस्टिक्स तक उद्योग के लगभग सभी क्षेत्रों में कम लागत पर उच्च गुणवत्ता वाले उत्पादों को प्राप्त करना संभव हो गया है।
एक विशिष्ट उपयोग एक असेंबली लाइन होगा जहां एक छवि को लेने और संसाधित करने वाले हिस्से पर एक ऑपरेशन के बाद कैमरा चालू हो जाता है। कैमरे को किसी विशेष वस्तु की स्थिति, उसके रंग, आकार या आकार और वस्तु की उपस्थिति की जांच करने के लिए प्रोग्राम किया जा सकता है।
मशीन दृष्टि मानक 2D मैट्रिक्स बारकोड को खोज और डिकोड कर सकती है या मुद्रित वर्ण भी पढ़ सकती है। उत्पाद की जाँच के बाद, आमतौर पर एक संकेत उत्पन्न होता है जो यह निर्धारित करता है कि उत्पाद के साथ आगे क्या करना है। भाग को एक कंटेनर में गिराया जा सकता है, एक शाखा कन्वेयर को रूट किया जा सकता है, या अन्य विधानसभा कार्यों में पारित किया जा सकता है, और निरीक्षण के परिणाम सिस्टम में ट्रैक किए जाते हैं।
किसी भी मामले में, कंप्यूटर विजन सिस्टम किसी वस्तु के बारे में अधिक जानकारी प्रदान कर सकता है सरल स्थिति सेंसर.
कंप्यूटर दृष्टि का आमतौर पर उपयोग किया जाता है, उदाहरण के लिए:
- क्यूए,
- एक रोबोट (मशीन) का नियंत्रण,
- परीक्षण और अंशांकन,
- वास्तविक समय प्रक्रिया नियंत्रण,
- डेटा संग्रहण,
- मशीन निगरानी,
- छँटाई और गिनती।
कई निर्माता निरीक्षण कर्मियों के बजाय स्वचालित कंप्यूटर दृष्टि का उपयोग करते हैं क्योंकि यह दोहराए जाने वाले निरीक्षणों के लिए बेहतर अनुकूल है। यह तेज, अधिक उद्देश्यपूर्ण है और चौबीसों घंटे काम करता है।
कंप्यूटर दृष्टि प्रणालियां प्रति मिनट सैकड़ों या हजारों भागों का निरीक्षण कर सकती हैं और मनुष्यों की तुलना में अधिक सुसंगत और विश्वसनीय निरीक्षण परिणाम प्रदान कर सकती हैं। दोषों को कम करके, राजस्व में वृद्धि करके, अनुपालन को सुगम बनाकर और कंप्यूटर दृष्टि से भागों को ट्रैक करके, निर्माता पैसे बचा सकते हैं और अपनी लाभप्रदता बढ़ा सकते हैं।
मशीन विजन कैसे काम करता है
असतत फोटोकेल औद्योगिक स्वचालन के क्षेत्र में सबसे सरल सेंसरों में से एक है। हम इसे "असतत" या डिजिटल इसलिए कहते हैं क्योंकि इसमें केवल दो अवस्थाएँ होती हैं: चालू या बंद।
असतत फोटोकेल (ऑप्टिकल सेंसर) के संचालन का सिद्धांत एक प्रकाश किरण को संचारित करना और यह निर्धारित करना है कि प्रकाश किसी वस्तु द्वारा परिलक्षित होता है या नहीं। यदि कोई वस्तु नहीं है, तो प्रकाश फोटोसेल रिसीवर में परिलक्षित नहीं होता है। एक विद्युत संकेत, आमतौर पर 24 वी, रिसीवर से जुड़ा होता है।
यदि वस्तु मौजूद है, तो संकेत चालू है और नियंत्रण प्रणाली में एक क्रिया करने के लिए उपयोग किया जा सकता है। जब ऑब्जेक्ट हटा दिया जाता है, तो सिग्नल फिर से बंद हो जाता है।
ऐसा सेंसर एनालॉग भी हो सकता है। दो राज्यों के बजाय, यानी। बंद और चालू, यह एक मान लौटा सकता है जो दर्शाता है कि उसके रिसीवर को कितना प्रकाश वापस आ रहा है। यह 256 मान लौटा सकता है, 0 (अर्थात् कोई प्रकाश नहीं) से 255 (अर्थात् बहुत अधिक प्रकाश)।
एक वस्तु के उद्देश्य से एक वर्ग या आयताकार सरणी में व्यवस्थित हजारों छोटे एनालॉग फोटोकल्स की कल्पना करें।यह सेंसर जिस स्थान की ओर इशारा कर रहा है, उसकी परावर्तकता के आधार पर वस्तु की एक श्वेत-श्याम छवि बनाएगा। इन छवियों में अलग-अलग स्कैन बिंदुओं को "पिक्सेल" कहा जाता है।
बेशक, छवि बनाने के लिए हजारों छोटे फोटोइलेक्ट्रिक सेंसर का उपयोग नहीं किया जाता है। इसके बजाय, लेंस छवि को प्रकाश डिटेक्टरों के अर्धचालक सरणी पर केंद्रित करता है।
यह मैट्रिक्स सीसीडी (चार्ज कपल्ड डिवाइस) या सीएमओएस (पूरक धातु-ऑक्साइड-सेमीकंडक्टर) जैसे प्रकाश-संवेदनशील सेमीकंडक्टर उपकरणों की सरणियों का उपयोग करता है। इस मैट्रिक्स में अलग-अलग सेंसर पिक्सेल हैं।
कंप्यूटर विजन सिस्टम के चार मुख्य घटक
कंप्यूटर विजन सिस्टम के चार मुख्य घटक हैं:
- लेंस और प्रकाश व्यवस्था;
- छवि संवेदक या कैमरा;
- प्रोसेसर;
- परिणामों को स्थानांतरित करने का एक तरीका, चाहे भौतिक इनपुट/आउटपुट (I/O) कनेक्शन या अन्य संचार विधि के माध्यम से।
कंप्यूटर दृष्टि रंग पिक्सेल स्कैनिंग का उपयोग कर सकती है और अक्सर पिक्सेल की एक बड़ी सरणी का उपयोग करती है। आकार, किनारे की स्थिति, गति और तत्वों की एक दूसरे के सापेक्ष स्थिति निर्धारित करने के लिए कैप्चर की गई छवियों पर सॉफ़्टवेयर टूल लागू होते हैं।
लेंस छवि को कैप्चर करते हैं और इसे प्रकाश के रूप में सेंसर तक पहुंचाते हैं। कंप्यूटर दृष्टि प्रणाली को अनुकूलित करने के लिए, कैमरे को उपयुक्त लेंसों के साथ जोड़ा जाना चाहिए।
यद्यपि कई प्रकार के लेंस हैं, निश्चित फोकल लेंथ लेंस आमतौर पर कंप्यूटर दृष्टि अनुप्रयोगों में उपयोग किए जाते हैं। चुनते समय तीन कारक महत्वपूर्ण होते हैं: देखने का क्षेत्र, काम करने की दूरी, कैमरा सेंसर का आकार।
प्रकाश को विभिन्न तरीकों से एक छवि पर लागू किया जा सकता है। प्रकाश जिस दिशा से आ रहा है, उसकी चमक, और लक्ष्य के रंग की तुलना में उसका रंग या तरंगदैर्घ्य कंप्यूटर दृष्टि वातावरण को डिजाइन करते समय विचार करने के लिए बहुत महत्वपूर्ण कारक हैं।
जबकि प्रकाश एक अच्छी छवि प्राप्त करने का एक महत्वपूर्ण हिस्सा है, ऐसे दो अन्य कारक हैं जो छवि को प्राप्त होने वाले प्रकाश को प्रभावित करते हैं। लेंस में एपर्चर नामक एक सेटिंग शामिल होती है, जो लेंस में अधिक या कम प्रकाश को प्रवेश करने की अनुमति देने के लिए खुलती या बंद होती है।
एक्सपोजर समय के साथ संयुक्त, यह किसी भी प्रकाश व्यवस्था को लागू करने से पहले पिक्सेल सरणी पर प्रकाश की मात्रा को निर्धारित करता है। शटर गति या एक्सपोज़र समय यह निर्धारित करता है कि छवि को पिक्सेल के मैट्रिक्स पर कितनी देर तक प्रक्षेपित किया जाता है।
कंप्यूटर दृष्टि में, शटर को इलेक्ट्रॉनिक रूप से नियंत्रित किया जाता है, आमतौर पर मिलीसेकंड सटीकता के साथ। छवि कैप्चर करने के बाद, सॉफ़्टवेयर टूल लागू किए जाते हैं। कुछ का उपयोग विश्लेषण (प्री-प्रोसेसिंग) से पहले किया जाता है, अन्य का उपयोग अध्ययन की जा रही वस्तु के गुणों को निर्धारित करने के लिए किया जाता है।
प्रीप्रोसेसिंग के दौरान, आप किनारों को तेज करने, कंट्रास्ट बढ़ाने या अंतराल भरने के लिए छवि पर प्रभाव लागू कर सकते हैं। इन कार्यों का उद्देश्य अन्य सॉफ्टवेयर टूल्स की क्षमताओं में सुधार करना है।
कृत्रिम दृष्टि एक ऐसी तकनीक है जो मानव दृष्टि की नकल करती है और आपको उत्पादन प्रक्रियाओं के दौरान प्राप्त छवियों को प्राप्त करने, संसाधित करने और व्याख्या करने की अनुमति देती है।कृत्रिम दृष्टि मशीनें निर्णय लेने के लिए उत्पादन प्रक्रियाओं के दौरान प्राप्त जानकारी का विश्लेषण और डिकोड करती हैं और एक स्वचालित प्रक्रिया के माध्यम से सबसे सुविधाजनक तरीके से कार्य करती हैं। मशीन से जुड़े सॉफ़्टवेयर का उपयोग करके इन छवियों का प्रसंस्करण किया जाता है, और प्राप्त आंकड़ों के आधार पर, प्रक्रियाओं को जारी रखना और असेंबली लाइनों पर संभावित त्रुटियों की पहचान करना संभव है।
कंप्यूटर दृष्टि का लक्ष्य
यहां कुछ सामान्य टूल दिए गए हैं जिनका उपयोग आप अपने लक्ष्य के बारे में जानकारी प्राप्त करने के लिए कर सकते हैं:
- पिक्सेल काउंट: ऑब्जेक्ट में लाइट या डार्क पिक्सल की संख्या दिखाता है।
- एज डिटेक्शन: किसी वस्तु के किनारे का पता लगाएं।
- मापन (मेट्रोलोजी): किसी वस्तु के आयामों को मापना (जैसे मिलीमीटर में)।
- पैटर्न पहचान या पैटर्न मिलान: विशिष्ट पैटर्न खोजें, मिलान करें या गिनें। इसमें एक ऐसी वस्तु का पता लगाना शामिल हो सकता है जिसे घुमाया जा सकता है, आंशिक रूप से किसी अन्य वस्तु द्वारा छिपाया जा सकता है, या अन्य वस्तुएँ हो सकती हैं।
- ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR): सीरियल नंबर जैसे टेक्स्ट का ऑटोमैटिक रीडिंग।
- बारकोड, डेटा मैट्रिक्स और 2डी बारकोड रीडिंग: विभिन्न बारकोडिंग मानकों में निहित डेटा एकत्र करें।
- स्पॉट डिटेक्शन: छवि के संदर्भ बिंदु के रूप में इंटरकनेक्टेड पिक्सेल के पैच (जैसे ग्रे ऑब्जेक्ट में ब्लैक होल) के लिए छवि की जांच करता है।
- रंग विश्लेषण: रंग द्वारा भागों, उत्पादों और वस्तुओं की पहचान करें, गुणवत्ता का मूल्यांकन करें और रंग द्वारा तत्वों को उजागर करें।
निरीक्षण डेटा प्राप्त करने का उद्देश्य अक्सर इसका उपयोग पास / असफल या आगे बढ़ने / आगे बढ़ने के लिए निर्धारित करने के लिए लक्ष्य मूल्यों की तुलना करने के लिए किया जाता है।
उदाहरण के लिए, किसी कोड या बारकोड को स्कैन करते समय, परिणामी मान की तुलना संग्रहीत लक्ष्य मान से की जाती है। माप के मामले में, मापा मूल्य की तुलना सही मूल्यों और सहनशीलता से की जाती है।
अल्फ़ान्यूमेरिक कोड की जाँच करते समय, OCR टेक्स्ट मान की तुलना सही या लक्ष्य मान से की जाती है। सतह के दोषों की जांच करने के लिए, दोष के आकार की तुलना गुणवत्ता मानकों द्वारा अनुमत अधिकतम आकार से की जा सकती है।
गुणवत्ता नियंत्रण
मशीन विजन में उद्योग में बड़ी संभावनाएं हैं। इन कृत्रिम दृष्टि प्रणालियों का उपयोग किया गया है रोबोटिक्स में, हमें उत्पादन के विभिन्न चरणों के लिए एक स्वचालित समाधान की पेशकश करने की अनुमति दें, जैसे गुणवत्ता नियंत्रण या दोषपूर्ण उत्पादों का पता लगाना।
गुणवत्ता नियंत्रण विधियों और उपकरणों का एक समूह है जो हमें उत्पादन प्रक्रिया में त्रुटियों की पहचान करने के साथ-साथ उन्हें खत्म करने के लिए उचित उपाय करने की अनुमति देगा। यह अंतिम उत्पाद पर अधिक पूर्ण नियंत्रण प्रदान करता है, यह सुनिश्चित करता है कि जब यह उपभोक्ता तक पहुंचेगा तो यह विशिष्ट और स्थापित गुणवत्ता मानकों को पूरा करेगा।
इस तरह, जो उत्पाद न्यूनतम गुणवत्ता की आवश्यकताओं को पूरा नहीं करते हैं, उन्हें प्रक्रिया से बाहर रखा जाता है, जिससे उत्पादन प्रक्रिया में संभावित व्यवधान समाप्त हो जाते हैं। यह लगातार निरीक्षण और यादृच्छिक परीक्षण करके हासिल किया जाता है।
उत्पादन में गुणवत्ता नियंत्रण के उपयोग के कई फायदे हैं:
- उत्पादकता में वृद्धि;
- सामग्री के नुकसान में कमी;
- कीमतों में गिरावट;
- अंतिम उत्पाद की सबसे अच्छी गुणवत्ता।
कंप्यूटर दृष्टि में संचार
एक बार प्रोसेसर और सॉफ्टवेयर द्वारा प्राप्त होने के बाद, यह जानकारी विभिन्न प्रकार के उद्योग मानक संचार प्रोटोकॉल के माध्यम से नियंत्रण प्रणाली को प्रेषित की जा सकती है।
प्रमुख कंप्यूटर विजन सिस्टम अक्सर ईथरनेट/आईपी, प्रोफिनेट और मोडबस टीसीपी का समर्थन करते हैं। RS232 और RS485 सीरियल प्रोटोकॉल भी आम हैं।
डिजिटल I/O अक्सर एक्चुएशन सिस्टम में बनाया जाता है और परिणामों की रिपोर्टिंग को सरल करता है। कंप्यूटर दृष्टि संचार मानक भी उपलब्ध हैं।
निष्कर्ष
कृत्रिम दृष्टि प्रणालियों में अनुप्रयोगों की एक विस्तृत विविधता है और इसे विभिन्न उद्योगों और प्रत्येक उत्पादन लाइन की विभिन्न आवश्यकताओं के अनुकूल बनाया जा सकता है। आज, कोई भी कंपनी जो एक निश्चित मानक के लिए उत्पादों का निर्माण करती है, अपनी निर्माण प्रक्रिया के हिस्से के रूप में कंप्यूटर दृष्टि का लाभ उठा सकती है।
कृत्रिम दृष्टि प्रणालियों के भौतिक सिद्धांतों और क्षमताओं को समझना यह निर्धारित करने में सहायक हो सकता है कि ऐसी तकनीक किसी विशेष मामले में निर्माण प्रक्रिया के लिए उपयुक्त है या नहीं। सामान्य तौर पर, मानव आंख जो कुछ भी देख सकती है, कैमरा देख सकता है (कभी अधिक, कभी कम), लेकिन इस जानकारी को डिकोड करना और प्रसारित करना काफी जटिल हो सकता है।