Anonim

छवि पहचान API क्या हैं, और वे आपके लिए क्या कर सकते हैं? यह लेख स्पष्ट करेगा कि एक छवि पहचान क्या है, एक एपीआई क्या करता है, और यह कैसे आपको या आपके व्यवसाय को इंटरनेट से बाहर निकालने में मदद कर सकता है। छवि पहचान में व्यवसायों के लिए और व्यक्तिगत रूप से दृष्टिबाधित इंटरनेट उपयोगकर्ताओं के लिए बड़ी क्षमता है।

एक छवि मान्यता एपीआई क्या है?

छवि मान्यता वह जगह है जहां सॉफ़्टवेयर का एक टुकड़ा किसी छवि की विशेषताओं का पता लगाता है और इसे सटीक रूप से वर्गीकृत करता है। उदाहरण के लिए, यदि आप एक फेरारी 458 की छवि को एक छवि मान्यता एपीआई में अपलोड करते हैं, तो यह पहचान लेना चाहिए कि यह एक कार है और यह लाल है (या होना चाहिए)। एपीआई के आधार पर, आपके द्वारा उपयोग की जा रही छवि के प्रकार के आधार पर आगे का वर्गीकरण संभव हो सकता है।

यह वास्तव में सरल लग सकता है-मानव एक तस्वीर को देख सकता है और आपको बता सकता है कि यह बिना किसी प्रयास के एक तस्वीर है, ज्यादातर समय - लेकिन कंप्यूटर को हल करने के लिए सिखाने के लिए यह एक कठिन समस्या रही है। बहुत सारे काम यह पता लगाने में चले गए हैं कि एक कंप्यूटर कैसे समझ सकता है कि चीजें क्या दिखती हैं, और हमने बड़ी प्रगति की है, जो रिवर्स इमेज सर्च करने की क्षमता से लेकर Google के प्रसिद्ध डीप ड्रीम नेटवर्क तक है।

एक एपीआई एक एप्लीकेशन प्रोग्राम इंटरफ़ेस है। यह अनिवार्य रूप से प्रोग्राम रूटीन के बीच एक बिचौलिया है जो एक तत्व को दूसरे के साथ काम करने का तरीका बताता है, या उन उपकरणों को प्रदान करता है जिन्हें उन्हें फ़ंक्शन करने की आवश्यकता होती है। दर्जनों प्रकार के एपीआई हैं जो प्रोग्रामिंग भाषाओं की एक श्रृंखला का उपयोग करके, सभी प्रकार के लक्ष्यों को प्राप्त कर सकते हैं। इस संदर्भ में, एक छवि मान्यता एपीआई वह उपकरण है जिसका उपयोग आप कुछ व्यावसायिक छवि मान्यता प्रणालियों की गहरी सीखने की शक्ति तक पहुंचने के लिए कर सकते हैं।

छवि पहचान करने के लिए आपको बहुत अधिक कंप्यूटिंग शक्ति की आवश्यकता होती है। आपको डेटा की जनता और सभी की व्याख्या करने की शक्ति चाहिए। अधिकांश उपयोगकर्ताओं के पास अपने स्वयं के गहन शिक्षण मशीन बनाने के लिए बड़े पैमाने पर संसाधन नहीं होते हैं। Google के विज़न एपीआई, माइक्रोसॉफ्ट के फेस एपीआई, इमेजनेट और अन्य जैसे बड़े नामों में ऐसी मशीनें हैं और एपीआई के माध्यम से या तो मुफ्त या शुल्क के लिए उन तक पहुंच की अनुमति देते हैं। यह सभी आकारों के व्यवसायों को इस शक्ति तक पहुंचने देता है और परिणामस्वरूप उपयोगकर्ताओं को नए अनुभव मिलते हैं।

हमारे इंटरनेट अनुभव को बदलने के लिए छवि की पहचान कैसे हो रही है?

विभिन्न इंटरनेट उपयोगकर्ताओं को छवि मान्यता से अलग-अलग फायदे मिलेंगे। आइए एक काल्पनिक वेबसाइट के मालिक और एक काल्पनिक उपयोगकर्ता को देखें कि दोनों पक्ष कैसे लाभ उठा सकते हैं।

छवि पहचान के व्यावसायिक लाभ

उदाहरण के रूप में, मान लें कि आप Etsy या डेटिंग वेबसाइट के समान सेल्फ सेल पोर्टल चलाते हैं। आप उपयोगकर्ताओं द्वारा अपलोड की गई सभी छवियों की गुणवत्ता और उपयुक्तता का प्रबंधन करना चाहते हैं। आप सभी वयस्क या अनुपयुक्त चित्रों को ब्लॉक करना चाहते हैं और उन्हें उपयुक्त श्रेणियों में क्रमबद्ध करना चाहते हैं, लेकिन आप संभवतः यह सब हाथ से नहीं कर सकते।

छवि पहचान एपीआई दर्ज करें। हर एक छवि को स्कैन करने और इसे निर्धारित मानदंडों द्वारा परिभाषित करने के लिए, आप एक उपयुक्त छवि मान्यता मशीन के साथ एपीआई का उपयोग कर सकते हैं। इसलिए आप अश्लील चित्रों की लाइब्रेरी को स्कैन कर सकते हैं और उन्हें हटा सकते हैं। आप छवियों को स्कैन कर सकते हैं और उन लोगों को छांट सकते हैं जिनमें "खाद्य" श्रेणी में भोजन और "ऊनी" श्रेणी में बुना हुआ कपड़ा है। एक बार जब आप एपीआई को बताएंगे कि क्या करना है, तो प्रक्रिया स्वचालित है।

संवर्धित वास्तविकता और इंटरैक्टिव छवि और वीडियो के लिए यहां अवसर भी हैं। आप प्रोग्राम को वास्तविक दुनिया में वस्तुओं को पहचानने के लिए छवि पहचान का उपयोग कर सकते हैं। उदाहरण के लिए, आप किसी स्नीकर्स की जोड़ी की तस्वीर ले सकते हैं जिसे कोई गली में पहने हुए है। यदि कार्यक्रम स्नीकर्स को पहचानता है, तो तस्वीर को अपने लिए उन्हें खरीदने के लिए लिंक के साथ संवर्धित किया जा सकता है। यह व्यवसाय को लाभ पहुंचाता है (यह एक तत्काल बिक्री का अवसर प्रदान करता है) और उपयोगकर्ता को लाभ देता है (उन्हें वही मिलता है जो वे अभी चाहते हैं)

छवि मान्यता के उपयोगकर्ता लाभ

ऊपर स्नीकर उदाहरण केवल एक स्पष्ट तरीका है जिससे उपयोगकर्ता छवि मान्यता से लाभ उठा सकते हैं। संवर्धित वास्तविकता का अर्थ है कि हम किसी उत्पाद की तस्वीर लेने के द्वारा समीक्षा, मूल्य की जानकारी और बहुत सारे डेटा को तुरंत प्राप्त कर सकते हैं। यह उपयोगकर्ताओं को भारी मात्रा में डेटा देता है जिससे उन्हें खरीदने का निर्णय लेने में मदद मिलती है।

मार्क जुकरबर्ग ने इस साल की शुरुआत में एआई पर अपने भाषण में छवि मान्यता के लिए अक्सर अनदेखी लाभ को अभिव्यक्त किया। उन्होंने एक ऐसी छवि पहचान एपीआई की कल्पना की, जो नेत्रहीन या आंशिक रूप से देखे गए लोगों के साथ काम करती है जो एक छवि को "पढ़" सकते हैं और इसका वर्णन कर सकते हैं कि यह क्या जोर से देखता है। यह बिगड़ा हुआ इंटरनेट उपयोगकर्ताओं के लिए बड़े पैमाने पर नतीजे हो सकता है-या, संवर्धित वास्तविकता के साथ, वास्तविक दुनिया में कुछ समय के लिए लाइन से बाहर।

छवि मान्यता वाहन सुरक्षा में भी एक भूमिका निभाती है। नई स्वायत्त ब्रेकिंग और टकराव परिहार प्रौद्योगिकियों को उन एपीआई के समान काम किया जा रहा है जिनके बारे में हम बात कर रहे हैं। वे सड़क पर रहते हुए आपको और आपकी कार को सुरक्षित रखने के लिए एक सेकंड में कई बार छवियों को स्कैन और मूल्यांकन करते हैं। यह तकनीक जो स्वायत्त कारों को बताती है कि उनके आसपास क्या है, भी।

छवि मान्यता API हमारे इंटरनेट अनुभव को अपने दम पर क्रांति करने वाले नहीं हैं। वे मौजूदा तकनीक के साथ-साथ हमारे द्वारा देखी जाने वाली दुनिया में अंतःक्रिया और विसर्जन की एक परत को जोड़ने के लिए काम करते हैं। जबकि इस लेख के उदाहरण सीमित हैं, गेमिंग, फिल्में, ऑटो उद्योग, खुदरा, मनोरंजन और किसी भी प्रौद्योगिकी-सक्षम उद्योग के लिए बहुत बड़ी संभावनाएं हैं। यह सिर्फ शुरुआत है जो बुद्धिमान सिस्टम प्राप्त कर सकता है!

छवि पहचान एप क्या हैं, और वे आपके लिए क्या कर सकते हैं?