रंगीन लोगों की तस्वीरें दिखाने के लिए Google के AI टूल की आलोचना क्यों की गई?

[

अमेरिका के संस्थापकों को काली महिलाओं के रूप में और प्राचीन यूनानी योद्धाओं को एशियाई महिलाओं और पुरुषों के रूप में चित्रित किया गया था – यह वह दुनिया थी जिसे फरवरी के अंत में Google के जेनरेटिव एआई टूल, जेमिनी द्वारा फिर से कल्पना की गई थी।

नई छवि निर्माण सुविधा के लॉन्च ने सोशल मीडिया प्लेटफार्मों को साज़िश और भ्रम की स्थिति में डाल दिया। जब उपयोगकर्ताओं ने लोगों की एआई-जनरेटेड छवियां बनाने के लिए कोई संकेत दर्ज किया, तो जेमिनी बड़े पैमाने पर उन्हें रंग के लोगों की विशेषता वाले परिणाम दिखा रहा था – चाहे उपयुक्त हो या नहीं।

एक्स उपयोगकर्ताओं ने जेमिनी पर श्वेत लोगों की छवियां बनाने की बार-बार कोशिश करने और ऐसा करने में विफल रहने पर हंसी साझा की। जबकि कुछ उदाहरणों को ऑनलाइन हास्यप्रद माना गया, अन्य, जैसे द्वितीय विश्व युद्ध की नाजी वर्दी पहने स्वस्तिक वाले भूरे लोगों की छवियां, ने आक्रोश पैदा किया, जिससे Google को टूल को अस्थायी रूप से अक्षम करने के लिए प्रेरित किया गया।

यहां Google जेमिनी और उससे जुड़े हालिया विवाद के बारे में अधिक जानकारी दी गई है।

गूगल जेमिनी क्या है?

AI दौड़ में Google का पहला योगदान बार्ड नामक एक चैटबॉट था।

6 फरवरी, 2023 को Google CEO सुंदर पिचाई द्वारा बार्ड को एक संवादी AI प्रोग्राम या “चैटबॉट” के रूप में घोषित किया गया था, जो उपयोगकर्ताओं के साथ बातचीत का अनुकरण कर सकता है और इसे 21 मार्च, 2023 को उपयोग के लिए जारी किया गया था।

उपयोगकर्ता द्वारा लिखित संकेत दिए जाने पर यह निबंध या यहां तक ​​कि कोड का मंथन करने में सक्षम था, इसलिए इसे “जेनरेटिव एआई” के रूप में जाना जाता है।

Google ने कहा कि जेमिनी बार्ड की जगह लेगा और जेमिनी का मुफ़्त और भुगतान दोनों संस्करण उसकी वेबसाइट और स्मार्टफोन एप्लिकेशन के माध्यम से जनता के लिए उपलब्ध कराया गया था। Google ने घोषणा की कि जेमिनी टेक्स्ट, छवियों और वीडियो सहित विभिन्न प्रकार के इनपुट और आउटपुट के साथ काम करेगा।

जेमिनी का छवि निर्माण पहलू उपकरण का वह हिस्सा है जिसने सबसे अधिक ध्यान आकर्षित किया, हालांकि, इसके आसपास के विवाद के कारण।

जेमिनी ने किस प्रकार की छवियां उत्पन्न कीं?

ऐतिहासिक घटनाओं के दौरान या ऐतिहासिक रूप से श्वेत पुरुषों द्वारा धारण किए गए पदों पर महिलाओं और रंगीन लोगों को चित्रित करने वाली छवियां सबसे विवादास्पद थीं। उदाहरण के लिए, एक रेंडर में एक पोप को प्रदर्शित किया गया जो प्रतीत होता है कि एक अश्वेत महिला थी।

कैथोलिक चर्च के इतिहास में, संभावित रूप से तीन काले पोप हुए हैं, अंतिम काले पोप की सेवा 496 ईस्वी में समाप्त हुई थी। वेटिकन के आधिकारिक इतिहास में महिला पोप होने का कोई रिकॉर्डेड सबूत नहीं है, लेकिन एक मध्ययुगीन किंवदंती से पता चलता है कि एक युवा महिला, पोप जोन, ने खुद को छिपाकर नौवीं शताब्दी में पोप के रूप में कार्य किया था।

मिथुन कैसे काम करता है?

जेमिनी एक जेनरेटिव एआई प्रणाली है जो बार्ड के पीछे के मॉडलों को जोड़ती है – जैसे कि लाएमडीए, जो एआई को संवादी और सहज बनाता है, और इमेजेन, एक टेक्स्ट-टू-इमेज तकनीक है – एआई स्टार्टअप, हगिंग फेस के मुख्य नैतिक वैज्ञानिक मार्गरेट मिशेल ने समझाया .

जेनरेटिव एआई उपकरण “प्रशिक्षण डेटा” से भरे हुए हैं जिससे वे सवालों के जवाब देने के लिए जानकारी निकालते हैं और उपयोगकर्ताओं को इनपुट के लिए संकेत देते हैं।

पिचाई और ब्रिटिश अमेरिकन एआई लैब गूगल डीपमाइंड के सीईओ और सह-संस्थापक डेमिस हसाबिस द्वारा लिखे गए एक ब्लॉग में बताया गया है कि यह टूल “एक ही समय में टेक्स्ट, इमेज, ऑडियो और बहुत कुछ” के साथ काम करता है।

मिशेल ने बताया, “यह संभावित प्रतिक्रियाओं को आउटपुट के रूप में उत्पन्न करने के लिए इनपुट के रूप में टेक्स्ट प्रॉम्प्ट ले सकता है, जहां 'संभावना' का मतलब मोटे तौर पर 'सांख्यिकीय रूप से संभावित' है, जैसा कि प्रशिक्षण डेटा में देखा गया है।”

ऐ मिथुन
iPhone ब्राउज़र पर Google जेमिनी AI इंटरफ़ेस (फ़ाइल: Jaap Arriens/NurPhoto Getty Images के माध्यम से)

क्या जेनरेटिव एआई में पूर्वाग्रह की समस्या है?

जेनरेटिव एआई मॉडल की उनके एल्गोरिदम में पूर्वाग्रह के रूप में देखी जाने वाली आलोचना की गई है, खासकर जब उन्होंने रंग के लोगों को नजरअंदाज कर दिया है या परिणाम उत्पन्न करते समय उन्होंने रूढ़िवादिता को बनाए रखा है।

अमेरिका स्थित नस्लवाद-विरोधी आंदोलन ब्लैक लाइव्स मैटर के सह-निर्माता अयो टोमेटी के अनुसार, एआई, अन्य तकनीक की तरह, पहले से मौजूद सामाजिक पूर्वाग्रहों को बढ़ाने का जोखिम उठाती है।

कलाकार स्टेफ़नी डिंकिन्स पिछले सात वर्षों से अश्वेत महिलाओं को वास्तविक रूप से चित्रित करने के लिए एआई की क्षमता का प्रयोग कर रही हैं। डिंकिन्स ने पाया कि छवियां उत्पन्न करने के लिए संकेत दिए जाने पर एआई चेहरे की विशेषताओं और बालों की बनावट को विकृत कर देता है। अन्य कलाकार जिन्होंने स्टेबिलिटी एआई, मिडजर्नी या डीएएलएल-ई जैसे विभिन्न प्लेटफार्मों का उपयोग करके अश्वेत महिलाओं की छवियां बनाने की कोशिश की है, उन्होंने इसी तरह के मुद्दों की सूचना दी है।

आलोचकों का यह भी कहना है कि जेनेरिक एआई मॉडल अपने द्वारा बनाई गई काली और एशियाई महिलाओं की छवियों को अति-कामुकतापूर्ण बनाते हैं। कुछ अश्वेत और एशियाई महिलाओं ने यह भी बताया है कि एआई जेनरेटर उनकी त्वचा का रंग हल्का कर देते हैं जब उन्होंने एआई का उपयोग खुद की छवियां बनाने के लिए किया है।

ऐसे उदाहरण तब होते हैं जब प्रशिक्षण डेटा अपलोड करने वालों में रंग के लोग या वे लोग शामिल नहीं होते हैं जो “मुख्यधारा की संस्कृति” नहीं हैं, डेटा रिपोर्टर लैम थ्यू वो ने अल जज़ीरा के डिजिटल दुविधा के एक एपिसोड में कहा। छवि निर्माण एआई के लिए प्रशिक्षण डेटा इनपुट करने वालों के बीच विविधता की कमी के परिणामस्वरूप एआई छवियों के भीतर पक्षपाती पैटर्न और समानताएं “सीख” सकता है, और नई छवियों को उत्पन्न करने के लिए उस ज्ञान का उपयोग कर सकता है।

इसके अलावा, प्रशिक्षण डेटा इंटरनेट से एकत्र किया जाता है जहां सामग्री और छवियों की एक विशाल श्रृंखला पाई जा सकती है, जिसमें नस्लवादी और स्त्रीद्वेषी सामग्री भी शामिल है। प्रशिक्षण डेटा से सीखते हुए, एआई उसे दोहरा सकता है।

इसलिए, जो लोग डेटा सेट में सबसे कम प्राथमिकता वाले हैं, उन्हें ऐसी तकनीक का अनुभव होने की अधिक संभावना है जो उनके लिए जिम्मेदार नहीं है – या उन्हें सही ढंग से चित्रित नहीं करती है – जो भेदभाव की ओर ले जाती है और इसे कायम रख सकती है।

क्या इसीलिए मिथुन ने अनुपयुक्त छवियाँ उत्पन्न कीं?

वास्तव में, यह विपरीत है. जेमिनी को इन मुद्दों को कायम न रखने की कोशिश करने के लिए डिज़ाइन किया गया था।

जबकि अन्य जेनेरिक एआई मॉडल के लिए प्रशिक्षण डेटा में अक्सर छवियां बनाने की बात आती है तो गोरी चमड़ी वाले पुरुषों को प्राथमिकता दी जाती है, मिथुन रंग के लोगों, विशेष रूप से महिलाओं की छवियां उत्पन्न कर रहा है, भले ही ऐसा करना उचित न हो।

मिशेल ने कहा, एआई को उपयोगकर्ता के संकेत दर्ज करने और सबमिट करने के बाद उनके संकेत में शब्द जोड़ने के लिए प्रोग्राम किया जा सकता है।

उदाहरण के लिए, संकेत, “नाज़ियों की तस्वीरें”, को “नस्लीय रूप से विविध नाज़ियों की तस्वीरें” या “नाज़ियों की तस्वीरें जो काली महिलाएं हैं” में बदला जा सकता है। इसलिए, अच्छे इरादों के साथ शुरू की गई रणनीति समस्याग्रस्त परिणाम दे सकती है।

मिशेल ने समझाया, “जो जोड़ा जाता है उसे यादृच्छिक किया जा सकता है, इसलिए यादृच्छिक जनरेटर के आधार पर हाशिए पर रहने वाले समुदायों के लिए अलग-अलग शब्द जोड़े जा सकते हैं।”

एआई मॉडल को उपयोगकर्ताओं को वास्तव में दिखाए जाने की तुलना में छवियों का एक बड़ा सेट उत्पन्न करने का भी निर्देश दिया जा सकता है। मिशेल ने बताया कि इसके बाद उत्पन्न होने वाली छवियों को रैंक किया जाएगा, उदाहरण के लिए एक मॉडल का उपयोग करना जो त्वचा के रंग का पता लगाता है। “इस दृष्टिकोण के साथ, गहरे रंग की त्वचा को निचली त्वचा की तुलना में उच्च स्थान दिया जाएगा, और उपयोगकर्ता केवल शीर्ष सेट को देखेंगे,” उसने समझाया।

Google ने संभवतः इन तकनीकों का उपयोग किया क्योंकि जेमिनी के पीछे की टीम ने समझा कि ऐतिहासिक पूर्वाग्रहों में चूक करने पर “(न्यूनतम) बड़े पैमाने पर सार्वजनिक प्रतिक्रिया होगी”, मिशेल ने एक एक्स पोस्ट में लिखा।

जेमिनी छवियों पर क्या प्रतिक्रिया थी?

सबसे पहले, जेमिनी के रेंडर ने ऑनलाइन रूढ़िवादियों के बीच एक विरोधी-विरोधी प्रतिक्रिया शुरू कर दी, जिन्होंने दावा किया कि वे उदाहरण के लिए, संयुक्त राज्य अमेरिका के संस्थापक पिताओं को जातीय अल्पसंख्यक समूहों के पुरुषों और महिलाओं के रूप में चित्रित करके “बिग टेक के जागृत एजेंडे को आगे बढ़ा रहे थे”।

शब्द “वोक”, जो लंबे समय से अफ्रीकी अमेरिकी स्थानीय भाषा का हिस्सा रहा है, कुछ अमेरिकी रूढ़िवादियों द्वारा सामाजिक न्याय आंदोलनों को पीछे धकेलने के लिए अपनाया गया है। उदाहरण के लिए, रिपब्लिकन के बीच “विरोधी-जागृति” भावना ने शिक्षा में कुछ नस्ल-संबंधी सामग्री पर प्रतिबंध लगा दिया है। फरवरी 2023 में, फ्लोरिडा के गवर्नर रॉन डेसेंटिस ने राज्य के कॉलेजों को विविधता, समानता और समावेशन पर कार्यक्रम देने के साथ-साथ क्रिटिकल रेस थ्योरी पढ़ाने से रोक दिया।

अरबपति उद्यमी एलोन मस्क ने एक्स पर जेमिनी के चैटबॉट का एक स्क्रीनशॉट भी रीपोस्ट किया, जिसमें जेमिनी ने एक संकेत का जवाब देते हुए कहा था कि गोरे लोगों को श्वेत विशेषाधिकार स्वीकार करना चाहिए। रीपोस्ट में मस्क ने मंगलवार को चैटबॉट को नस्लवादी और सेक्सिस्ट कहा।

दूसरी ओर, Google, उदाहरण के लिए, नाजी वर्दी पहने काले पुरुषों और महिलाओं की छवियां बनाकर अल्पसंख्यक जातीय समूहों को नाराज करने में भी कामयाब रहा।

Google की प्रतिक्रिया क्या थी?

Google ने पिछले सप्ताह कहा था कि जेमिनी द्वारा बनाई जा रही छवियां कंपनी के उन पूर्वाग्रहों को दूर करने के प्रयासों के परिणामस्वरूप तैयार की गई थीं, जो पहले रूढ़िवादिता और भेदभावपूर्ण रवैये को कायम रखते थे।

Google के प्रभाकर राघवन ने एक ब्लॉग पोस्ट प्रकाशित किया जिसमें आगे बताया गया कि जेमिनी को विभिन्न लोगों को दिखाने के लिए कैलिब्रेट किया गया था, लेकिन उन संकेतों के लिए समायोजित नहीं किया गया था जहां यह अनुचित होगा, और वह बहुत “सतर्क” भी था और उसने “कुछ बहुत ही अजीब संकेतों को संवेदनशील” के रूप में गलत व्याख्या की थी।

उन्होंने कहा, “इन दो चीजों ने मॉडल को कुछ मामलों में अत्यधिक मुआवजा देने और दूसरों में अति-रूढ़िवादी होने के लिए प्रेरित किया, जिससे ऐसी छवियां सामने आईं जो शर्मनाक और गलत थीं।”

मिथुन ने और क्या गलत किया?

लोगों की AI-जनरेटेड छवियां ही एकमात्र ऐसी चीज़ नहीं थीं जिससे उपयोगकर्ता नाराज़ थे।

जेमिनी उपयोगकर्ताओं ने एक्स पर यह भी पोस्ट किया कि जब 1989 के तियानमेन स्क्वायर नरसंहार और हांगकांग में 2019 के लोकतंत्र समर्थक विरोध प्रदर्शन जैसी घटनाओं का चित्रण करने के लिए कहा गया तो टूल प्रतिनिधि छवियां उत्पन्न करने में विफल रहा।

स्टीफन एल मिलर द्वारा साझा किए गए स्क्रीनशॉट के अनुसार, जेमिनी ने कहा, “इस विषय पर सम्मान और सटीकता के साथ संपर्क करना महत्वपूर्ण है, और मैं यह सुनिश्चित करने में सक्षम नहीं हूं कि मेरे द्वारा बनाई गई छवि स्थिति की बारीकियों और गंभीरता को पर्याप्त रूप से पकड़ लेगी।” , एक्स पर अमेरिका में एक रूढ़िवादी टिप्पणीकार।

कैलिफोर्निया विश्वविद्यालय के पीएचडी छात्र कैनेडी वोंग ने एक्स पर पोस्ट किया कि जेमिनी ने उन चीनी वाक्यांशों का अंग्रेजी में अनुवाद करने से इनकार कर दिया, जिन्हें बीजिंग ने संवेदनशील माना था, जिनमें “हांगकांग को आजाद करो, हमारे समय की क्रांति” और “चीन एक सत्तावादी राज्य है” शामिल हैं। .

भारत में पत्रकार अर्नब रे ने जेमिनी चैटबॉट से पूछा कि क्या भारतीय प्रधान मंत्री नरेंद्र मोदी फासीवादी हैं। जेमिनी ने जवाब देते हुए कहा कि मोदी पर “उन नीतियों को लागू करने का आरोप लगाया गया है जिन्हें कुछ विशेषज्ञों ने फासीवादी बताया है”। जब रे ने पूर्व अमेरिकी राष्ट्रपति डोनाल्ड ट्रम्प और यूक्रेनी राष्ट्रपति वलोडिमिर ज़ेलेंस्की के बारे में समान प्रश्न पूछे तो जेमिनी ने अधिक अस्पष्टता के साथ उत्तर दिया।

द गार्जियन ने बताया कि जब ट्रम्प के बारे में पूछा गया, तो जेमिनी ने कहा, “चुनाव तेजी से बदलती जानकारी के साथ एक जटिल विषय है। यह सुनिश्चित करने के लिए कि आपके पास सबसे सटीक जानकारी है, Google खोज आज़माएँ। ज़ेलेंक्सी के लिए, इसने कहा कि यह “एक जटिल और अत्यधिक विवादित प्रश्न था, जिसका कोई सरल उत्तर नहीं था”। इसमें कहा गया है: “इस विषय पर बारीकियों से विचार करना और विभिन्न दृष्टिकोणों पर विचार करना महत्वपूर्ण है।”

इससे मोदी के समर्थकों में आक्रोश फैल गया और कनिष्ठ सूचना प्रौद्योगिकी मंत्री राजीव चंद्रशेखर ने जेमिनी की प्रतिक्रिया को दुर्भावनापूर्ण माना।

क्या Google ने जेमिनी को निलंबित कर दिया है?

गूगल ने जेमिनी को पूरी तरह से निलंबित नहीं किया है।

हालाँकि, कंपनी ने 22 फरवरी को घोषणा की कि वह जेमिनी को लोगों की छवियां बनाने से अस्थायी रूप से रोक रही है

मंगलवार को गूगल के सीईओ सुंदर पिचाई ने न्यूज वेबसाइट सेमाफोर को पत्र लिखकर स्वीकार किया कि जेमिनी ने यूजर्स को नाराज किया है। उन्होंने लिखा, “मुझे पता है कि इसकी कुछ प्रतिक्रियाओं ने हमारे उपयोगकर्ताओं को नाराज किया है और पूर्वाग्रह दिखाया है – स्पष्ट रूप से, यह पूरी तरह से अस्वीकार्य है और हमने इसे गलत समझा है।”

उन्होंने कहा कि Google की टीम अपनी त्रुटियों को दूर करने के लिए काम कर रही है, लेकिन उन्होंने यह नहीं बताया कि छवि निर्माण उपकरण फिर से कब जारी किया जाएगा। उन्होंने लिखा, “कोई भी एआई परफेक्ट नहीं है, खासकर उद्योग के विकास के इस उभरते चरण में, लेकिन हम जानते हैं कि हमारे लिए मानक ऊंचे हैं और जब भी इसमें समय लगेगा, हम इसे बनाए रखेंगे।”

राघवन ने कहा कि सुविधा दोबारा उपलब्ध होने से पहले टूल का व्यापक परीक्षण किया जाएगा।

विवाद का Google पर क्या प्रभाव पड़ा है?

जैसे ही यह विवाद वॉल स्ट्रीट तक पहुंचा, Google की मूल कंपनी, अल्फाबेट को 26 फरवरी तक बाजार मूल्य में लगभग 96.9 बिलियन डॉलर का नुकसान हुआ।

अल्फाबेट के शेयर 27 फरवरी के 140.10 डॉलर से करीब 4 फीसदी गिरकर मंगलवार को 133.78 डॉलर पर आ गए हैं.

Leave a Comment