جوجل لديها سجل غير مثالي عندما يتعلق الأمر بالذكاء الاصطناعي الذي يولد الصور. في فبراير، تم اكتشاف أن مولد الصور المدمج في Gemini، التطبيق الذكي المدعوم بالذكاء الاصطناعي من قبل جوجل، كان يقوم بحقن تصنيف الجنس والعرق عشوائياً في الاقتراحات حول الأشخاص، مما أدى إلى ظهور صور لنازيين من تنوع عرقي، إلى جانب أخطاء غير دقيقة مسيئة أخرى.
سحبت جوجل المولد، متعهدة بتحسينه وإعادة إطلاقه في النهاية. وأثناء انتظار عودته، قامت الشركة بإطلاق أداة توليد صور محسنة، Imagen 2، داخل منصة تطوير الذكاء الاصطناعي Vertex AI الخاصة بها - على الرغم من أن الأداة تتمتع باتجاه أعم الشركات.
Imagen 2 - الذي هو في الواقع عائلة من النماذج، تم إطلاقه في ديسمبر بعد أن تمت معاينته في مؤتمر I/O الخاص بجوجل في مايو 2023 - يمكن أن ينشئ ويحرر الصور بناءً على إشارة نصية، مثل DALL-E و Midjourney المدعومتين بالذكاء الاصطناعي. ومن ذوي الاهتمام بالنوع الشركات، يمكن لـ Imagen 2 أن يقدم النصوص والشعارات أو الشعارات بلغات متعددة، ومن الممكن تجاوز هذه العناصر اختياريًا في الصور الحالية - على سبيل المثال، على بطاقات الأعمال والملابس والمنتجات.
بعد إطلاق التحرير بمسبق، أصبح تحرير الصور باستخدام Imagen 2 متوفرًا عمومًا الآن في Vertex AI برفقتي قدرة جديدة: التصويب والتصبير. يمكن استخدام التصويب والتصبير، المزايا التي قدمتها أدوات توليد الصور الشهيرة الأخرى مثل DALL-E منذ فترة، لإزالة الأجزاء غير المرغوب فيها من الصورة، وإضافة مكونات جديدة، وتوسيع حدود الصورة لإنشاء حقل بصري أوسع.
ولكن الجوهر الحقيقي لترقية Imagen 2 هو ما تسميه جوجل “تحويل النصوص إلى صور مباشرة.”