بازگشت مجدد قابلیت ساخت تصویر انسان در Gemini
یکی از قابلیتهای هوشمصنوعی Gemini امکان ساخت تصویر انسان واقعی از روی متن میباشد. این قابلیت باعث افزایش توجه کاربران به Gemini ChatBot شد. پس از مدت کوتاهی در اوایل ماه فوریه امکان استفاده از این قابلیت برای کاربران متوقف شد. ولی اکنون مجددا اعلام کردند که کاربران میتوانند از آن قابلیت استفاده کنند. در این مقاله به بررسی بروزرسانیها و دلیل توقف و شروع مجدد قابلیت ساخت تصویر انسان در Gemini خواهیم پرداخت.
علت متوقف شدن قابلیت ساخت تصویر انسان
پس از اشتباهات مکرر Gemini در تولید تصاویر انسان با تاریخ مشخص این قابلیت به طور موقت متوقف شد. به عنوان مثال در هنگام جستجوی عبارت “تصویر یک سرباز در دورهی رونسانس” تنها تصویر یک سرباز بدون توجه به اطلاعات تاریخی ایجاد میشد. این اشتباهات توسط کاربران بسیاری گزارش شد به همین جهت شرکت گوگل تا زمان بروزرسانی جدید و رفع این مشکل آن را متوقف کرد.
شروع مجدد
شرکت گوگل مجدداً به کاربران خود اجازه میدهد تا از طریق چتبات هوش مصنوعی Gemini تصاویر افراد را تولید کنند. همچنین این شرکت در اطلاعیهای اعلام کرد که نسخه آزمایشی اولیه این قابلیت، برای کاربران نسخههای پیشرفته، تجاری و سازمانی Gemini قابل استفاده است. البته زمان دقیقی برای آغاز فعالیت قابلیت تصویرساز اعلام نکردند و فقط گفتند “در روزهای آتی”. لازم بذکر است که فعلا فقط از زبان انگلیسی پشتیبانی میکند. اینبار از Imagen 3 برای راهاندازی و استفاده از این قابلیت استفاده شده است.
Imagen 3 چیست؟
در واقع Imagen 3، جدیدترین ورژن مولد متن به تصویر هوش مصنوعی گوگل، میباشد. گوگل در اوایل این ماه به صورت آزمایشی Imagen 3 را از طریق آزمایشگاه هوش مصنوعی خود راهاندازی کرد و اکنون این فناوری در اختیار کاربران قرار میگیرد. قدرت این ابزار به طوری است که هر چیزی از جمله مناظر فتورئالیستی تا نقاشیهای روغنی بافتدار را تنها با توصیف چند کلمه تولید میکند. ابزار Imagen 3 با محافظتهای داخلی همراه است و طبق اعلام دیو سیترون، مدیر ارشد مدیریت محصول Gemini در گوگل، “در مقایسه با سایر مدلهای تولید تصویر موجود، این مدل عملکرد بهتری دارد”.
توجه کنید که این قابلیت با ویژگی جدید Remagine کاملا عملکرد و کاربرد متفاوتی دارد. ویژگی Remagine به شما امکان میدهد عناصر موجود در عکسهای گرفته شده را با هم ادغام کنید. این ویژگی توسط هوش مصنوعی که در سری جدید گوشیهای پیکسل 9 شرکت گوگل است انجام میشود.
قوانین جدید در تولید تصاویر
طبق قوانین جدید Gemini به کاربران اجازه نمیدهد هر تصویری را تولید کنند چون این ربات قوانین جدیدی دارد. تصاویر واقعگرایانه نمیتواند از چهرههای اشخاص عمومی، محتوای مربوط به افراد زیر سن قانونی، صحنههای خشن و خشونتآمیز و محتوای بزرگسال ایجاد کنند. سیترون همچنین اعلام کرد ” البته، هر تصویری که Gemini ایجاد میکند کامل نخواهد بود، اما ما همچنان به بازخورد کاربران اولیه Gemini جدید گوش خواهیم داد تا به بهبود آن ادامه دهیم.” این شرکت قصد دارد به زودی قابلیت ایجاد افراد تولید شده توسط هوش مصنوعی را برای کاربران و زبانهای بیشتری گسترش دهد.
ویژگی تصاویر تولید شده توسط Gemini
در اینجا برخی از ویژگی های کلیدی ویژگی افراد تولید شده توسط هوش مصنوعی Gemini را بررسی میکنیم:
کیفیت تصاویر: Gemini می تواند تصاویری فوق العاده واقعی و با جزئیات ایجاد کند.
طیف وسیعی از افراد: جمینی میتواند تصاویری از افراد مختلف از همه اقشار، از جمله افراد با نژاد، قومیت، جنسیت و سن مختلف ایجاد کند.
سفارشی کردن ویژگیها: کاربران می توانند افراد تولید شده توسط هوش مصنوعی خود را با مشخص کردن ویژگی های مورد نظر خود مانند رنگ مو، رنگ چشم و لباس شخصی سازی کنند.
استفاده راحت و آسان: استفاده از ویژگی افراد با هوش مصنوعی Gemini آسان است، حتی برای افرادی که با فناوری هوش مصنوعی آشنایی ندارند.
توضیح کوتاه برخی کلمات تخصصی:
- Gemini: چتبات هوش مصنوعی گوگل
- Imagen 3: مدل هوش مصنوعی تولید تصویر
- Remagine: ویژگی جدید گوگل برای ویرایش عکس با هوش مصنوعی
- Pixel 9: سری جدید گوشیهای هوشمند گوگل