GPT Image 1.5 منتشر شد؛ سریع‌تر، دقیق‌تر و خلاقانه‌تر از نسخه‌های پیشین

آخرین به‌روزرسانی: 26 آذر 1404, 5:16 ب.ظ

زهرا کاظمی 26 آذر 1404 اخبار و رویداد ۷ دقیقه زمان مطالعه 0 دیدگاه ( ۳ امتیاز )

OpenAI در تاریخ ۱۶ دسامبر (۲۵ آذر) مدل جدید GPT Image 1.5 را معرفی کرده است. این مدل تا چهار برابر سریع‌تر از نسخه قبلی عمل می‌کند و توانایی ویرایش دقیق‌تر و دنبال کردن دستورات را دارد. این به‌روزرسانی، ChatGPT را به ابزاری خلاقانه و دسترس‌پذیر برای تولید محتواهای تصویری تبدیل کرده است.

در حال حاضر GPT Image 1.5 در پلتفرم هوش مصنوعی فارسی هوشا در دسترس قرار گرفته است و کاربران ایرانی می‌توانند بدون نیاز به دانش پیچیده گرافیکی و به‌راحتی تصاویر حرفه‌ای بسازند و ویرایش کنند.

ساختن تصویر با GPT Image 1.5

اسکرین شات از GPT Image 1.5 در هوشا — همین الان از GPT Image 1.5 در هوشا استفاده کنید.

معرفی کلی GPT Image 1.5

GPT Image 1.5 جدیدترین مدل تبدیل متن به تصویر و ویرایش تصویر از طرف OpenAI است. این مدل برای تولید تصاویر با کیفیت طراحی شده و درک بسیار خوبی از پرامپت دارد، متن داخل تصاویر را خوانا نمایش می‌دهد و ارتباط بهتری با دنیای واقعی برقرار می‌کند.

GPT-Image-1.5 هم برای خلق تصاویر خلاقانه و هم برای ویرایش‌های دقیق بصری مناسب است و می‌تواند در انواع فرایندهای طراحی محصول، طراحی گرافیک و تولید محتوا استفاده شود.

برتری GPT Image 1.5 به مدل‌‌های قبلی

در مقایسه با مدل‌های قبلی OpenAI، تمرکز GPT Image 1.5 بیشتر روی دقت در اجرای پرامپت، نمایش صحیح متن داخل تصویر و کنترل بهتر ترکیب‌بندی است. این مدل به‌ویژه برای تولید تصاویری که دقت بالا در تولدشان اهمیت دارد؛ شامل: برچسب، چیدمان رابط کاربری (UI)، پوستر، دیاگرام، اینفوگرافیک و تصاویر ساختارمند، بسیار کارآمد است.

دسترسی به GPT Image 1.5

نسخه جدید ChatGPT Images هم‌اکنون برای همه کاربران ChatGPT و API در سراسر جهان در دسترس است و نیازی به انتخاب مدل خاصی نیست. نسخه قدیمی‌تر همچنان به عنوان Custom GPT برای همه کاربران قابل دسترسی خواهد بود.

همین الان می‌توانید از طریق پلتفرم هوش مصنوعی فارسی هوشا نیز به این نسخه دسترسی پیدا کنید و تصاویر خود را بسازید.

ساختن تصویر با GPT Image 1.5

ویژگی‌های کلیدی GPT-Image-1.5

GPT Image 1.5 از یک معماری چندوجهی (Multimodal) استفاده می‌کند که در آن درک زبان و تولید و ویرایش تصویر به‌صورت یکپارچه با هم کار می‌کنند.

عکس یک ربات هوش مصنوعی در حال ادیت و ساخت تصاویر — GPT Image 1.5 با سرعت بیشتر، دقت بالاتر و خلاقیت بیشتر، ابزاری عالی برای طراحان و تولیدکنندگان محتوا است.

۱. سرعت بالا و بهینه‌سازی هزینه

GPT Image 1.5 تصاویر را تا ۴ برابر سریع‌تر از نسخه قبلی تولید می‌کند و هزینه هر تصویر ۲۰٪ کمتر است؛ این در حال است که کیفیت و دقت بصری بدون تغییر باقی می‌ماند. این ویژگی باعث می‌شود هم برای پروژه‌های با حجم بالا و هم برای تولید محتوای حرفه‌ای و دقیق، بهینه و مقرون‌به‌صرفه باشد.

۲. درک بهتر پرامپت

GPT Image 1.5، پرامپت متنی را پردازش می‌کند تا موضوع، چیدمان، سبک بصری و محتوای متنی تصویر را بفهمد. این مدل با پرامپت‌های طولانی‌تر و دقیق‌تر که ساختار، جای‌گذاری عناصر و سلسله‌مراتب بصری را توضیح می‌دهند، عملکرد بهتری دارد.

۳. تولید تصویر با دقت بالاتر

GPT-Image-1.5 تصاویری با ترکیب‌بندی تمیز، تناسبات یکدست و جزئیات دقیق‌تر تولید می‌کند. این مدل از سبک‌های مختلف (از تصاویر کاملاً واقعی گرفته تا تصویرسازی و گرافیک‌های طراحی‌شده) پشتیبانی می‌کند.

۴. ویرایش و تغییر تصویر به‌صورت حرفه‌ای‌تر

با GPT-Image-1.5 شما می‌توانید فقط بخش مشخصی از تصویر را تغییر دهید بدون اینکه به سایر بخش‌ها آسیبی برسد. این ویژگی به شما امکان می‌دهد لباس یک فرد را تغییر دهید، نور را تنظیم کنید یا متن تصویر را ویرایش کنید در حالی که چهره، ترکیب‌بندی و هویت حفظ می‌شود.

۵. تولید تصاویر دارای متن

یکی از نقاط قوت اصلی GPT Image 1.5 توانایی آن در تولید متن خوانا و درست جای‌گذاری کردن آن، داخل تصویر است. به همین دلیل برای پوسترها، موکاپ محصولات، دیاگرام‌ها و طراحی‌های شبیه UI بسیار مناسب است.

نکاتی برای گرفتن خروجی‌های بهتر از GPT Image 1.5

برای گرفتن بهترین نتایج از این مدل هوش مصنوعی لازم است که به چند نکته‌ی مهم دقت کنید:

اسکرین شات از نمونه تصویر ساخته شده با gpt image 1.5 — با اضافه کردن چند تصویر و یک پرامپت مشخص و دقیق می‌توانید یک تصویر جذاب خلق کنید.

درخواست خود را واضح و دقیق بنویسید: خواسته خود را به‌وضوح توضیح دهید. به‌جای عبارتی مانند «بهترش کن»، بگویید «نور ملایم ساحلی اضافه شود» یا «کلاه قرمز به مخمل آبی روشن تغییر کند».
از زبان عکاسی استفاده کنید: هنگام درخواست تصاویر واقع‌گرایانه، نوع لنز، کیفیت نور و قاب‌بندی را مشخص کنید. مثلا بگویید «با لنز ۵۰ میلی‌متری، نور نرم روز، عمق میدان کم عکاسی شود» تا به خروجی بهتر و واقعی‌تری برسید.
قسمت‌های ثابت را قفل کنید: هنگام ویرایش، واضح بیان کنید چه چیزهایی نباید تغییر کنند. مثال: «فقط نور را تغییر بده، چهره، ژست و لباس سوژه حفظ شود» این کار از تغییرات ناخواسته جلوگیری می‌کند.
متن را در گیومه قرار دهید: برای تولید متن خوانا در تصویر، متن دقیق را در «گیومه» بگذارید و سبک فونت را توضیح دهید.
تغییرات کوچک و مرحله‌ای اعمال کنید: با یک تصویر پایه شروع کنید و سپس در هر مرحله یک تغییر روی آن اعمال کنید.
استفاده از چند تصویر مرجع: هنگام کار با چند تصویر ورودی، آن‌ها را شماره‌گذاری کرده و ارتباطشان را توضیح دهید. مثال: «سبک تصویر ۱ را روی سوژه تصویر ۲ اعمال کن».

جمع‌بندی

GPT Image 1.5، هیچ حد و مرزی ندارد و ابزاری قدرتمند برای طراحان، تولیدکنندگان محتوا و کاربران عادی است. همین الان می‌توانید تصاویر مورد نیاز خود را از طریق لینک زیر در پلتفرم هوش مصنوعی فارسی هوشا بسازید یا ویرایش کنید.

ساختن تصویر با GPT Image 1.5

منابع