Openai का कहना है

Openai का कहना है

कुछ हफ्तों पहले तक, पश्चिमी दुनिया के कुछ लोगों ने एक छोटी चीनी आर्टिफिशियल इंटेलिजेंस (एआई) कंपनी के बारे में सुना था जिसे दीपसेक के रूप में जाना जाता है। लेकिन 20 जनवरी को, यह वैश्विक ध्यान पर कब्जा कर लिया जब इसने R1 नामक एक नया AI मॉडल जारी किया।

R1 एक “तर्क” मॉडल है, जिसका अर्थ है कि यह कार्यों के माध्यम से कदम से कदम उठाता है और उपयोगकर्ता को इसकी कार्य प्रक्रिया का विवरण देता है। यह दीपसेक का अधिक उन्नत संस्करण है वी 3 मॉडलजो दिसंबर में जारी किया गया था। दीपसेक की नई पेशकश लगभग उतनी ही शक्तिशाली है जितनी प्रतिद्वंद्वी कंपनी Openai की सबसे उन्नत AI मॉडल O1, लेकिन लागत के एक अंश पर।

दिनों के भीतर, दीपसेक के ऐप ने नए डाउनलोड में CHATGPT को पार कर लिया और संयुक्त राज्य अमेरिका में तकनीकी कंपनियों के स्टॉक की कीमतें निर्धारित कीं टंबलिंग। इसने Openai को भी ले जाया दावा इसके चीनी प्रतिद्वंद्वी ने ओपनई के मॉडल के कुछ क्राउन ज्वेल्स को प्रभावी रूप से अपने स्वयं के निर्माण के लिए पिल्टर कर दिया था।

में एक न्यूयॉर्क टाइम्स को बयानकंपनी ने कहा:

हम इस बात के बारे में जानते हैं और उन संकेतों की समीक्षा कर रहे हैं कि दीपसेक ने अनुचित रूप से हमारे मॉडल को डिस्टिल्ड किया हो सकता है, और जैसा कि हम अधिक जानते हैं, जानकारी साझा करेंगे। हम अपनी तकनीक की रक्षा के लिए आक्रामक, सक्रिय काउंटरमेशर्स लेते हैं और यहां बनाए जा रहे सबसे सक्षम मॉडल की रक्षा के लिए अमेरिकी सरकार के साथ मिलकर काम करना जारी रखेंगे।

बातचीत के लिए बातचीत ने दीपसेक से संपर्क किया, लेकिन इसने जवाब नहीं दिया।

लेकिन यहां तक ​​कि अगर दीपसेक की नकल की गई – या, वैज्ञानिक पार्लेंस में, “डिस्टिल्ड” – कम से कम कुछ चैटगिप्ट आर 1 का निर्माण करने के लिए, यह याद रखने योग्य है कि ओपनईआई भी अपने मॉडल विकसित करते समय बौद्धिक संपदा का अनादर करने का आरोपी है।

आसवन क्या है?

मॉडल डिस्टिलेशन एक सामान्य मशीन लर्निंग तकनीक है जिसमें एक छोटे “छात्र मॉडल” को एक बड़े और अधिक जटिल “शिक्षक मॉडल” की भविष्यवाणियों पर प्रशिक्षित किया जाता है।

जब पूरा हो जाता है, तो छात्र शिक्षक के रूप में लगभग अच्छा हो सकता है, लेकिन शिक्षक के ज्ञान का अधिक प्रभावी और कॉम्पैक्ट रूप से प्रतिनिधित्व करेगा।

ऐसा करने के लिए, शिक्षक के आंतरिक कामकाज तक पहुंचना आवश्यक नहीं है। सभी को इस ट्रिक को खींचने की जरूरत है, शिक्षक मॉडल से छात्र को प्रशिक्षित करने के लिए पर्याप्त प्रश्न पूछना है।

यह वही है जो Openai ने दावा किया है कि दीपसेक ने किया है: Openai के O1 को एक बड़े पैमाने पर queried और दीपसेक के अपने, अधिक कुशल मॉडल को प्रशिक्षित करने के लिए देखे गए आउटपुट का उपयोग किया।

संसाधनों का एक अंश

दीपसेक दावा R1 के प्रशिक्षण और उपयोग दोनों को अपने प्रतिद्वंद्वियों के सर्वश्रेष्ठ मॉडल को विकसित करने के लिए आवश्यक संसाधनों के केवल एक अंश की आवश्यकता थी।

कंपनी के कुछ विपणन प्रचार के बारे में संदेह होने के कारण हैं – उदाहरण के लिए, ए नई स्वतंत्र रिपोर्ट सुझाव है कि R1 पर हार्डवेयर खर्च US $ 500 मिलियन जितना अधिक था। लेकिन फिर भी, प्रतिद्वंद्वी मॉडल के साथ तुलना में दीपसेक को अभी भी बहुत जल्दी और कुशलता से बनाया गया था।

ऐसा इसलिए हो सकता है क्योंकि डीपसेक ने ओपनई के आउटपुट को डिस्टिल्ड किया है। हालांकि, वर्तमान में इसे निर्णायक रूप से साबित करने के लिए कोई विधि नहीं है। एक विधि जो विकास के शुरुआती चरणों में है वाटरमार्किंग एआई आउटपुट। यह आउटपुट में अदृश्य पैटर्न जोड़ता है, कॉपीराइट की गई छवियों पर लागू होने वाले समान। सिद्धांत रूप में ऐसा करने के विभिन्न तरीके हैं, लेकिन कोई भी प्रभावी या कुशल नहीं है ताकि इसे व्यवहार में बनाया जा सके।

ऐसे अन्य कारण हैं जो डीपसेक की सफलता को समझाने में मदद करते हैं, जैसे कि कंपनी के गहरे और चुनौतीपूर्ण तकनीकी कार्य।

दीपसेक द्वारा किए गए तकनीकी प्रगति में कम शक्तिशाली लेकिन सस्ते एआई चिप्स (जिसे ग्राफिकल प्रोसेसिंग यूनिट्स, या जीपीयू भी कहा जाता है) का लाभ उठाना शामिल था।

दीपसेक के पास अनुकूल होने के अलावा कोई विकल्प नहीं था अमेरिका ने फर्मों पर प्रतिबंध लगा दिया है चीन को सबसे शक्तिशाली एआई चिप्स निर्यात करने से।

जबकि पश्चिमी एआई कंपनियां इन शक्तिशाली इकाइयों को खरीद सकती हैं, निर्यात प्रतिबंध ने चीनी कंपनियों को सस्ते विकल्पों का सबसे अच्छा उपयोग करने के लिए नवाचार करने के लिए मजबूर किया।

एक नीले पैनल पर एक काले कंप्यूटर चिप की एक क्लोज अप छवि।
अमेरिका ने चीन को सबसे शक्तिशाली कंप्यूटर चिप्स के निर्यात पर प्रतिबंध लगा दिया है। न ही गैल/शटरस्टॉक

मुकदमों की एक श्रृंखला

ओपनई का उपयोग की शर्तें स्पष्ट रूप से राज्य प्रतिस्पर्धी उत्पादों को विकसित करने के लिए अपने एआई मॉडल का उपयोग नहीं कर सकता है। हालांकि, इसके स्वयं के मॉडल वेब से स्क्रैप किए गए बड़े पैमाने पर डेटासेट पर प्रशिक्षित हैं। ये डेटासेट निहित हैं कॉपीराइट सामग्री की पर्याप्त मात्राजो ओपनई कहता है कि यह उपयोग करने का हकदार है “उचित उपयोग” के आधार पर:

सार्वजनिक रूप से उपलब्ध इंटरनेट सामग्री का उपयोग करने वाले एआई मॉडल का प्रशिक्षण उचित उपयोग है, जैसा कि लंबे समय से और व्यापक रूप से स्वीकृत मिसालों द्वारा समर्थित है। हम इस सिद्धांत को रचनाकारों के लिए उचित मानते हैं, इनोवेटर्स के लिए आवश्यक हैं, और अमेरिकी प्रतिस्पर्धा के लिए महत्वपूर्ण हैं।

इस तर्क का परीक्षण अदालत में किया जाएगा। समाचार पत्र, संगीतकारों, लेखक और अन्य क्रिएटिव ने कॉपीराइट उल्लंघन के आधार पर Openai के खिलाफ मुकदमों की एक श्रृंखला दायर की है।

बेशक, यह काफी अलग है कि ओपनई ने दीपसेक पर क्या करने का आरोप लगाया है। फिर भी openai बहुत सहानुभूति को आकर्षित नहीं कर रहा है इसके दावे के लिए कि दीपसेक ने अवैध रूप से अपने मॉडल आउटपुट की कटाई की।

शब्दों और मुकदमों का युद्ध इस बात का एक कला है कि कैसे एआई के तेजी से अग्रिम ने उद्योग के लिए स्पष्ट कानूनी नियमों के विकास को आगे बढ़ाया है। और जबकि इन हालिया घटनाओं से एआई incumbents की शक्ति को कम किया जा सकता है, विभिन्न चल रहे कानूनी विवादों के परिणाम पर बहुत कुछ है।

वैश्विक बातचीत को हिलाते हुए

दीपसेक ने दिखाया है कि सस्ते और कुशलता से अत्याधुनिक मॉडल विकसित करना संभव है। क्या वे एक स्तर के खेल के मैदान पर Openai के साथ प्रतिस्पर्धा कर सकते हैं, यह देखा जाना बाकी है।

सप्ताहांत में, ओपनई ने अपने वर्चस्व को प्रदर्शित करने का प्रयास किया सार्वजनिक रूप से जारी करना इसका सबसे उन्नत उपभोक्ता मॉडल, O3-Mini।

Openai का दावा है कि यह मॉडल अपने स्वयं के पिछले बाजार-अग्रणी संस्करण, O1, और “हमारे तर्क श्रृंखला में सबसे अधिक लागत-कुशल मॉडल” है।

ये घटनाक्रम बाजार में एआई मॉडल की विविधता के साथ उपभोक्ताओं के लिए बढ़ी हुई पसंद का एक युग है। यह उपयोगकर्ताओं के लिए अच्छी खबर है: प्रतिस्पर्धी दबाव मॉडल का उपयोग करने के लिए सस्ता बना देगा।

और लाभ आगे बढ़ते हैं।

इन मॉडलों का प्रशिक्षण और उपयोग करना एक जगह है बड़े पैमाने पर तनाव वैश्विक ऊर्जा की खपत पर। जैसे -जैसे ये मॉडल अधिक सर्वव्यापी हो जाते हैं, हम सभी उनकी दक्षता में सुधार से लाभान्वित होते हैं।

दीपसेक का उदय निश्चित रूप से अधिक सस्ते और कुशलता से मॉडल बनाने के लिए नए क्षेत्र को चिह्नित करता है। शायद यह वैश्विक बातचीत को भी हिला देगा कि कैसे एआई कंपनियों को अपने प्रशिक्षण डेटा को एकत्र और उपयोग करना चाहिए।बातचीत

(लेखक: ली फ्रर्मनप्राकृतिक भाषा प्रसंस्करण में वरिष्ठ व्याख्याता, मेलबर्न विश्वविद्यालय, द यूनिवर्सिटी ऑफ मेलबर्न और शानन कोहनीसाइबर सुरक्षा में व्याख्याता, द यूनिवर्सिटी ऑफ मेलबर्न)

इस लेख को पुनर्प्रकाशित किया गया है बातचीत एक क्रिएटिव कॉमन्स लाइसेंस के तहत। को पढ़िए मूल लेख

(हेडलाइन को छोड़कर, इस कहानी को NDTV कर्मचारियों द्वारा संपादित नहीं किया गया है और एक सिंडिकेटेड फ़ीड से प्रकाशित किया गया है।)


Source link


Discover more from “Hindi News: हिंदी न्यूज़, News In Hindi, Hindi Samachar, Latest news

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *