OpenAI ने अपने प्लेटफॉर्म ChatGPT में नया इमेज जनरेशन मॉडल ‘Images 2.0’ लॉन्च किया है, जो पहले के मुकाबले ज्यादा सटीक, रियलिस्टिक और स्मार्ट विजुअल तैयार करने में सक्षम है।
कंपनी के अनुसार, यह नया मॉडल अब डिटेल्ड निर्देशों को बेहतर तरीके से समझता है, ऑब्जेक्ट्स को सही जगह पर रखता है और जटिल एलिमेंट्स जैसे टेक्स्ट, यूजर इंटरफेस और मल्टीलिंगुअल कंटेंट को अधिक सटीकता से तैयार कर सकता है।
इस अपडेट की सबसे बड़ी खासियत इसका ‘thinking capability’ फीचर है। इसके जरिए मॉडल जरूरत पड़ने पर वेब सर्च का उपयोग कर सकता है, एक ही प्रॉम्प्ट से कई अलग-अलग इमेज बना सकता है और आउटपुट की सटीकता को वेरिफाई भी कर सकता है।
नई तकनीक के साथ यूजर्स अब सोशल मीडिया ग्राफिक्स, प्रेजेंटेशन, इन्फोग्राफिक्स, UI डिजाइन, कॉमिक्स और सिनेमैटिक विजुअल्स जैसे कई फॉर्मेट में आसानी से इमेज तैयार कर सकते हैं।
कंपनी ने बताया कि यह मॉडल हिंदी, जापानी, चीनी, कोरियन और बंगाली जैसी भाषाओं में भी बेहतर परफॉर्म करता है, जिससे यह वैश्विक यूजर्स के लिए अधिक उपयोगी बनता है।
विजुअल क्वालिटी की बात करें तो Images 2.0 में लाइटिंग, टेक्सचर और फाइन डिटेल्स को ज्यादा बेहतर तरीके से रेंडर किया जाता है, जिससे इमेज ज्यादा रियल लगती हैं।
डेवलपर्स के लिए यह मॉडल ‘gpt-image-2’ API के जरिए उपलब्ध होगा, जिससे इसे डिजाइन, मार्केटिंग, एजुकेशन और कंटेंट क्रिएशन जैसे क्षेत्रों में इंटीग्रेट किया जा सकेगा।
हालांकि, कंपनी ने माना कि अभी भी कुछ सीमाएं हैं, जैसे बेहद जटिल डिजाइन या बहुत ज्यादा डिटेल वाले पैटर्न में सुधार की जरूरत है।
साथ ही, OpenAI ने सेफ्टी के लिए कई स्तरों पर जांच, मेटाडेटा टैगिंग और वॉटरमार्किंग जैसे उपाय भी लागू किए हैं, ताकि गलत या भ्रामक कंटेंट को रोका जा सके।
