یکی از قابلیت‌های هوش‌مصنوعی Gemini امکان ساخت تصویر انسان واقعی از روی متن می‌باشد. این قابلیت باعث افزایش توجه کاربران به Gemini ChatBot شد. پس از مدت کوتاهی در اوایل ماه فوریه امکان استفاده از این قابلیت برای کاربران متوقف شد. ولی اکنون مجددا اعلام کردند که کاربران می‌توانند از آن قابلیت استفاده کنند. در این مقاله به بررسی بروزرسانی‌ها و دلیل توقف و شروع مجدد قابلیت ساخت تصویر انسان در Gemini خواهیم پرداخت.

علت متوقف شدن قابلیت ساخت تصویر انسان

پس از اشتباهات مکرر Gemini در تولید تصاویر انسان با تاریخ مشخص این قابلیت به طور موقت متوقف شد. به عنوان مثال در هنگام جستجوی عبارت “تصویر یک سرباز در دوره‌ی رونسانس” تنها تصویر یک سرباز بدون توجه به اطلاعات تاریخی ایجاد می‌شد. این اشتباهات توسط کاربران بسیاری گزارش شد به همین جهت شرکت گوگل تا زمان بروزرسانی جدید و رفع این مشکل آن را متوقف کرد.

شروع مجدد

شرکت گوگل مجدداً به کاربران خود اجازه می‌دهد تا از طریق چت‌بات هوش مصنوعی Gemini تصاویر افراد را تولید کنند. همچنین این شرکت در اطلاعیه‌ای اعلام کرد که نسخه آزمایشی اولیه این قابلیت، برای کاربران نسخه‌های پیشرفته، تجاری و سازمانی Gemini قابل استفاده است. البته زمان دقیقی برای آغاز فعالیت قابلیت تصویرساز اعلام نکردند و فقط گفتند “در روزهای آتی”. لازم بذکر است که فعلا فقط از زبان انگلیسی پشتیبانی می‌کند. اینبار از Imagen 3 برای راه‌اندازی و استفاده از این قابلیت استفاده شده است.

Imagen 3 چیست؟

در واقع  Imagen 3، جدیدترین ورژن مولد متن به تصویر هوش مصنوعی گوگل، می‌باشد. گوگل در اوایل این ماه به صورت آزمایشی Imagen 3 را از طریق آزمایشگاه هوش مصنوعی خود راه‌اندازی کرد و اکنون این فناوری در اختیار کاربران قرار می‌گیرد. قدرت این ابزار به طوری است که هر چیزی از جمله مناظر فتورئالیستی تا نقاشی‌های روغنی بافت‌دار را تنها با توصیف چند کلمه تولید می‌کند. ابزار Imagen 3 با محافظت‌های داخلی همراه است و طبق اعلام دیو سیترون، مدیر ارشد مدیریت محصول Gemini در گوگل، “در مقایسه با سایر مدل‌های تولید تصویر موجود، این مدل عملکرد بهتری دارد”.
توجه کنید که این قابلیت با ویژگی جدید Remagine کاملا عملکرد و کاربرد متفاوتی دارد. ویژگی Remagine  به شما امکان می‌دهد عناصر موجود در عکس‌های گرفته شده را با هم ادغام کنید. این ویژگی توسط هوش مصنوعی که در سری جدید گوشی‌های پیکسل 9 شرکت گوگل است انجام می‌شود.

قوانین جدید در تولید تصاویر

طبق قوانین جدید Gemini به کاربران اجازه نمی‌دهد هر تصویری را تولید کنند چون این ربات قوانین جدیدی دارد. تصاویر واقع‌گرایانه نمی‌تواند از چهره‌های اشخاص عمومی، محتوای مربوط به افراد زیر سن قانونی، صحنه‌های خشن و خشونت‌آمیز و محتوای بزرگسال ایجاد کنند. سیترون همچنین اعلام کرد ” البته، هر تصویری که Gemini ایجاد می‌کند کامل نخواهد بود، اما ما همچنان به بازخورد کاربران اولیه Gemini جدید گوش خواهیم داد تا به بهبود آن ادامه دهیم.”  این شرکت قصد دارد به زودی قابلیت ایجاد افراد تولید شده توسط هوش مصنوعی را برای کاربران و زبان‌های بیشتری گسترش دهد.

ویژگی تصاویر تولید شده توسط Gemini

در اینجا برخی از ویژگی های کلیدی ویژگی افراد تولید شده توسط هوش مصنوعی Gemini را بررسی می‌کنیم:
کیفیت تصاویر: Gemini می تواند تصاویری فوق العاده واقعی و با جزئیات ایجاد کند.
طیف وسیعی از افراد: جمینی می‌تواند تصاویری از افراد مختلف از همه اقشار، از جمله افراد با نژاد، قومیت، جنسیت و سن مختلف ایجاد کند.
سفارشی کردن ویژگی‌ها: کاربران می توانند افراد تولید شده توسط هوش مصنوعی خود را با مشخص کردن ویژگی های مورد نظر خود مانند رنگ مو، رنگ چشم و لباس شخصی سازی کنند.
استفاده راحت و آسان: استفاده از ویژگی افراد با هوش مصنوعی Gemini آسان است، حتی برای افرادی که با فناوری هوش مصنوعی آشنایی ندارند.

توضیح کوتاه برخی کلمات تخصصی:

  • Gemini: چت‌بات هوش مصنوعی گوگل
  • Imagen 3: مدل هوش مصنوعی تولید تصویر
  •  Remagine: ویژگی جدید گوگل برای ویرایش عکس با هوش مصنوعی
  • Pixel 9: سری جدید گوشی‌های هوشمند گوگل