नई दिल्ली (New Delhi)। माइक्रोसॉफ्ट (Microsoft) ने अपने लेटेस्ट स्मॉल लैंग्वेज मॉडल (Latest Small Language model) Phi-3 को नए फीचर्स (new features) के साथ लॉन्च (Launched) किया है। कंपनी के सीईओ सत्या नडेला (CEO Satya Nadella) ने माइक्रोसॉफ्ट बिल्ड 2024 इवेंट (Microsoft Build 2024 event) में Phi-3 फैमिली के तीन नए एआई मॉडल्स को लॉन्च किया। नए एआई मॉडल स्मार्टफोन पर शानदार कन्वर्सेशनल एआई एक्सपीरियंस देंगे। Phi-3 Vision इन्हीं में से एक है। यह एक मल्टीमोडल मॉडल है, जो इमेज, चार्ट और डायग्राम इनपुट का जवाब टेक्स्ट में देता है। यह 4.2 बिलियन पैरामीटर मॉडल मोबाइल डिवाइसेज के लिए डिजाइन किया गया है। जेनरल विजुअल रीजनिंग टास्क में इसका रिस्पॉन्स जबरदस्त है।
इमेज ऐनालिसिस और समझ में काफी तेज
यूजर फोटोज या चार्ट के बारे में Phi-3-Vision से सवाल पूछ सकते हैं। यह पूछे गए सवाल का सही जवाब देगा। हालांकि, यह DALL-E या स्टेबल डिफ्यूजन जैसा इमेज जेनरेशन टूल नहीं है, लेकिन यह इमेज ऐनालिसिस और समझ में काफी तेज है। Phi-3-Vision की एंट्री Phi-3-Mini के ठीक बाद हुई है, जो 3.8 बिलियन पैरामीटर्स के साथ Phi-3 फैमिली का सबसे छोटा मेंबर है। पूरे परिवार में अब Phi-3-Mini, Phi-3-Vision, Phi-3-Small (7 बिलियन पैरामीटर), और Phi-3-Medium (14 बिलियन पैरामीटर) शामिल हैं।
ऐंड्रॉयड, वेब, iOS, विंडोज ऐप बनाने में करेगा मदद
नडेला ने कहा कि Phi मॉडल्स के जरिए यूजर ऐंड्रॉयड, वेब, iOS, विंडोज और एज के लिए ऐप बना सकते हैं। छोटे मॉडलों पर यह फोकस एआई डेवेलपमेंट के ट्रेंड को दिखाता है। छोटे मॉडलों को कम प्रोसेसिंग पावर और मेमरी की जरूरत होती है, जो उन्हें मोबाइल डिवाइस बेस्ट बनाते हैं। माइक्रोसॉफ्ट को इस अप्रोच से पहले ही सफलता मिल चुकी है, कथित तौर पर कंपनी का Orca-Math मॉडल मैथ के प्रॉबल्म्स को सॉल्व करने में बड़े कॉम्पिटिटर्स से आगे निकल गया है।
Phi-3-Vision अभी प्रीव्यू में उपलब्ध है, जबकि बाकी Phi-3 फैमिली (मिनी, छोटा और मध्यम) को Azure की मॉडल लाइब्रेरी के जरिए से एक्सेस किया जा सकता है। बताते चलें कि माइक्रोसॉफ्ट के सीईओ सत्या नडेला ने कन्फर्म कर दिया है कि ओपन एआई का लेटेस्ट मल्टी-मोडल लार्ज लैंग्वेज मॉडल (LLM) GPT-4o अब Azure OpenAI में उपलब्ध हो गया है।
©2024 Agnibaan , All Rights Reserved