گوگل مدل های هوش مصنوعی Gemini خود را با معرفی سه نسخه آزمایشی جدید توسعه داده است: Gemini 1.5 Flash-8B، Gemini 1.5 Pro و Gemini 1.5 Flash. هدف از این بهروزرسانی ها، ارائه ابزارهای پیشرفته به توسعهدهندگان برای انجام وظایف پیچیده، از ورودی های چندوجهی گرفته تا خلاصهسازی با زمینه طولانی است.
مدل Gemini 1.5 Flash-8B که شامل 8 میلیارد پارامتر است، برای کارهایی طراحی شده است که نیاز به پردازش حجم زیاد داده یا محتوای طولانی دارند. این مدل به ویژه برای خلاصه کردن اسناد طولانی یا مدیریت محتوای چند رسانه ای مناسب است.
Gemini 1.5 Pro بهروزرسانی هایی را برای مدیریت بهتر وظایفی که شامل ریاضیات، درخواست های پیچیده و کدنویسی می شوند، دریافت کرده است. این پیشرفت ها آن را به ابزاری قدرتمندتر برای توسعه دهندگانی که روی پروژه های پیچیده کار می کنند تبدیل می کند. نسخه جدید فلش همچنین بهبود عملکرد را در بنچمارک های داخلی به ارمغان می آورد و آن را برای انواع برنامه ها کارآمدتر می کند.
ویژگی های اصلی مدل Imagen 3 چیست؟
در یادداشت دیگری، گوگل آخرین مدل تولید تصویر خود، Imagen 3 را معرفی کرد که برای تولید تصاویر با کیفیت بالا از توضیحات متن طراحی شده است. Imagen 3 به کاربران اجازه می دهد تا تصاویر را در سبک های مختلف تولید کنند، از قطعات فوتورئالیستی گرفته تا هنر انتزاعی، که آزادی خلاقانه تری نسبت به Imagen 2 قبلی به ارمغان می آورد.
این مدل همچنین دارای تدابیر ایمنی برای جلوگیری از تولید محتوای نامناسب، مانند تصاویر واقعی از افراد قابل شناسایی یا خردسالان، و همچنین صحنه های خشونت آمیز یا صریح است. این ویژگی ها برای کاربران است که فرصت های خلاقانه را کشف کنند و در عین حال اخلاقی باشند.
Imagen 3 در حال حاضر برای کاربران Gemini Advanced، Business و Enterprise عرضه می شود و این مدل در زبان های مختلف در دسترس است. این برای کاربران بیشتری مناسب است تا بتوانند از ابزارهای پیشرفته تولید تصویر آن استفاده کنند.
Imagen 3 چگونه تولید و سفارشی سازی تصویر را بهبود می بخشد؟
جدیدترین محصول گوگل در تولید تصاویر مبتنی بر هوش مصنوعی که به کاربران امکان ایجاد تصاویر دقیق و خلاقانه از پیامهای متنی ساده را میدهد. این مدل از سبک های مختلف تصویر پشتیبانی می کند و کاربران بر فرآیند خلاقانه درگیر کنترل دارند.
این واقعیت که کاربران می توانند در مورد تصاویر تولید شده بازخورد ارائه دهند، که به آنها اجازه می دهد تا نتایج را تا زمانی که با انتظاراتشان مطابقت داشته باشند، اصلاح کنند، این ویژگی را مفید می کند تا تولید تصویر را بصریتر و کاربرپسندتر کند. در حالی که Imagen 3 دارای قابلیت های پیشرفته ای است، همانطور که اشاره شد، محدودیت هایی برای تولید انواع خاصی از محتوا نیز دارد که آن را به ابزاری باورنکردنی برای همه کاربران تبدیل می کند.
چگونه هوش مصنوعی Gemini اکنون از کمک سفارشی شده با Gems پشتیبانی می کند؟
در هوش مصنوعی Gemini ویژگی جدیدی به نام Gems نیز معرفی شده است. در اعلامیه گوگل گفته می شود:
شما می توانید Gems را سفارشی کنید تا به عنوان یک متخصص در موضوعات عمل کند یا آنها را در جهت اهداف خاص خود اصلاح کنید. به سادگی دستورالعمل هایی را برای Gem خود بنویسید، نامی برای آن بگذارید و سپس هر زمان که خواستید با آن چت کنید.
با Gems، میتوانید تیمی از متخصصان ایجاد کنید تا به شما کمک کنند تا از طریق یک پروژه چالشبرانگیز فکر کنید، ایده هایی را برای یک رویداد آینده بنویسید، یا شرح عالی برای یک پست شبکه های اجتماعی بنویسید. Gem شما همچنین می تواند مجموعهای از دستورالعمل های دقیق را به خاطر بسپارد تا به شما در صرفهجویی در وقت در کارهای خستهکننده، تکراری یا دشوار کمک کند.
برای کمک به کاربران برای شروع، Google Gems از پیش ساخته شده را برای سناریوهای مختلف، از جمله مربیان یادگیری، طوفان فکری، راهنمای شغلی، ویراستاران نوشتن، و شرکای کدنویسی ارائه می کند. این Gems اکنون در دستگاه های دسکتاپ و موبایل برای کاربران پیشرفته، تجاری و سازمانی Gemini در بیش از 150 کشور در دسترس است.