گوگل مدل های هوش مصنوعی Gemini خود را با معرفی سه نسخه آزمایشی جدید توسعه داده است: Gemini 1.5 Flash-8B، Gemini 1.5 Pro و Gemini 1.5 Flash. هدف از این به‌روزرسانی ها، ارائه ابزارهای پیشرفته به توسعه‌دهندگان برای انجام وظایف پیچیده، از ورودی های چندوجهی گرفته تا خلاصه‌سازی با زمینه طولانی است.

مدل Gemini 1.5 Flash-8B که شامل 8 میلیارد پارامتر است، برای کارهایی طراحی شده است که نیاز به پردازش حجم زیاد داده یا محتوای طولانی دارند. این مدل به ویژه برای خلاصه کردن اسناد طولانی یا مدیریت محتوای چند رسانه ای مناسب است.

Gemini 1.5 Pro به‌روزرسانی هایی را برای مدیریت بهتر وظایفی که شامل ریاضیات، درخواست های پیچیده و کدنویسی می شوند، دریافت کرده است. این پیشرفت ها آن را به ابزاری قدرتمندتر برای توسعه دهندگانی که روی پروژه های پیچیده کار می کنند تبدیل می کند. نسخه جدید فلش همچنین بهبود عملکرد را در بنچمارک های داخلی به ارمغان می آورد و آن را برای انواع برنامه ها کارآمدتر می کند.

ویژگی های اصلی مدل Imagen 3 چیست؟

در یادداشت دیگری، گوگل آخرین مدل تولید تصویر خود، Imagen 3 را معرفی کرد که برای تولید تصاویر با کیفیت بالا از توضیحات متن طراحی شده است. Imagen 3 به کاربران اجازه می دهد تا تصاویر را در سبک های مختلف تولید کنند، از قطعات فوتورئالیستی گرفته تا هنر انتزاعی، که آزادی خلاقانه تری نسبت به Imagen 2 قبلی به ارمغان می آورد.

Imagen 3

این مدل همچنین دارای تدابیر ایمنی برای جلوگیری از تولید محتوای نامناسب، مانند تصاویر واقعی از افراد قابل شناسایی یا خردسالان، و همچنین صحنه های خشونت آمیز یا صریح است. این ویژگی ها برای کاربران است که فرصت های خلاقانه را کشف کنند و در عین حال اخلاقی باشند.

Imagen 3 در حال حاضر برای کاربران Gemini Advanced، Business و Enterprise عرضه می شود و این مدل در زبان های مختلف در دسترس است. این برای کاربران بیشتری مناسب است تا بتوانند از ابزارهای پیشرفته تولید تصویر آن استفاده کنند.

Imagen 3 چگونه تولید و سفارشی سازی تصویر را بهبود می بخشد؟

جدیدترین محصول گوگل در تولید تصاویر مبتنی بر هوش مصنوعی که به کاربران امکان ایجاد تصاویر دقیق و خلاقانه از پیام‌های متنی ساده را می‌دهد. این مدل از سبک های مختلف تصویر پشتیبانی می کند و کاربران بر فرآیند خلاقانه درگیر کنترل دارند.

این واقعیت که کاربران می توانند در مورد تصاویر تولید شده بازخورد ارائه دهند، که به آنها اجازه می دهد تا نتایج را تا زمانی که با انتظاراتشان مطابقت داشته باشند، اصلاح کنند، این ویژگی را مفید می کند تا تولید تصویر را بصری‌تر و کاربرپسندتر کند. در حالی که Imagen 3 دارای قابلیت های پیشرفته ای است، همانطور که اشاره شد، محدودیت هایی برای تولید انواع خاصی از محتوا نیز دارد که آن را به ابزاری باورنکردنی برای همه کاربران تبدیل می کند.

چگونه هوش مصنوعی Gemini اکنون از کمک سفارشی شده با Gems پشتیبانی می کند؟

در هوش مصنوعی Gemini ویژگی جدیدی به نام Gems نیز معرفی شده است. در اعلامیه گوگل گفته می شود:

شما می توانید Gems را سفارشی کنید تا به عنوان یک متخصص در موضوعات عمل کند یا آنها را در جهت اهداف خاص خود اصلاح کنید. به سادگی دستورالعمل هایی را برای Gem خود بنویسید، نامی برای آن بگذارید و سپس هر زمان که خواستید با آن چت کنید.

Gemini

با Gems، می‌توانید تیمی از متخصصان ایجاد کنید تا به شما کمک کنند تا از طریق یک پروژه چالش‌برانگیز فکر کنید، ایده هایی را برای یک رویداد آینده بنویسید، یا شرح عالی برای یک پست شبکه های اجتماعی بنویسید. Gem شما همچنین می تواند مجموعه‌ای از دستورالعمل های دقیق را به خاطر بسپارد تا به شما در صرفه‌جویی در وقت در کارهای خسته‌کننده، تکراری یا دشوار کمک کند.

برای کمک به کاربران برای شروع، Google Gems از پیش ساخته شده را برای سناریوهای مختلف، از جمله مربیان یادگیری، طوفان فکری، راهنمای شغلی، ویراستاران نوشتن، و شرکای کدنویسی ارائه می کند. این Gems اکنون در دستگاه های دسکتاپ و موبایل برای کاربران پیشرفته، تجاری و سازمانی Gemini در بیش از 150 کشور در دسترس است.