شرکت متا (Meta) در اقدامی غافلگیرکننده و در روز شنبه، نسل جدید مدل‌های هوش مصنوعی خود را با نام Llama 4 معرفی کرد. این مجموعه شامل سه مدل جدید به نام‌های Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است که همگی برای داشتن درک عمیق‌تر از متن، تصویر و ویدیو، با حجم عظیمی از داده‌های بدون برچسب آموزش دیده‌اند.

رقابت فشرده با مدل‌های چینی

به نظر می‌رسد موفقیت مدل‌های متن‌باز شرکت DeepSeek چین، که عملکردی هم‌سطح یا حتی بهتر از نسخه‌های قبلی Llama داشته‌اند، متا را وادار کرده تا توسعه مدل‌های جدید را با سرعتی بالا پیش ببرد. گفته می‌شود متا حتی “اتاق‌های جنگی” تشکیل داده تا بفهمد DeepSeek چگونه هزینه اجرای مدل‌های هوش مصنوعی را کاهش داده است.

مدل‌هایی برای کاربردهای مختلف

دو مدل Scout و Maverick هم‌اکنون از طریق وب‌سایت Llama.com و پلتفرم‌هایی مانند Hugging Face در دسترس قرار گرفته‌اند، در حالی که مدل Behemoth هنوز در مرحله آموزش قرار دارد.

در حال حاضر، دستیار هوشمند Meta AI که در اپلیکیشن‌هایی مانند واتساپ، مسنجر و اینستاگرام به کار می‌رود، در 40 کشور به‌روزرسانی شده و از Llama 4 استفاده می‌کند. با این حال، امکانات مولتی‌مدیا فعلاً تنها در ایالات متحده و به زبان انگلیسی فعال هستند.

محدودیت‌هایی برای کاربران اروپایی

یکی از موضوعات بحث‌برانگیز، مجوز استفاده از مدل‌های Llama 4 است. کاربران و شرکت‌هایی که محل فعالیت یا اقامت قانونی آن‌ها در اتحادیه اروپا قرار دارد، مجاز به استفاده یا توزیع این مدل‌ها نیستند. همچنین، شرکت‌هایی که بیش از 700 میلیون کاربر فعال ماهانه دارند باید برای استفاده از این مدل‌ها، مجوز ویژه‌ای از متا دریافت کنند.

نگاهی به معماری Llama 4: ترکیب متخصصان (Mixture of Experts)

Llama 4 نخستین نسل از مدل‌های متا است که از معماری Mixture of Experts (MoE) استفاده می‌کند. این معماری نوآورانه با تقسیم داده‌ها بین مجموعه‌ای از “مدل‌های متخصص”، بهره‌وری را افزایش داده و پاسخ‌دهی مدل‌ها را بهینه‌تر می‌سازد.

برای مثال:

  • Maverick دارای 400 میلیارد پارامتر کلی است، اما فقط 17 میلیارد پارامتر فعال دارد که بین 128 متخصص تقسیم شده‌اند.
  • Scout با 109 میلیارد پارامتر کل، تنها 17 میلیارد پارامتر فعال بین 16 متخصص دارد.
  • Behemoth که هنوز منتشر نشده، با 2 تریلیون پارامتر کلی و 288 میلیارد پارامتر فعال، به سخت‌افزار فوق‌العاده قدرتمندی نیاز دارد.

Scout و Maverick: هر کدام برای چه کاری مناسب‌اند؟

  • Scout: در خلاصه‌سازی متون طولانی، تحلیل کدهای پیچیده و پردازش اسناد بسیار حجیم عملکرد فوق‌العاده‌ای دارد. این مدل توانایی خواندن تا 10 میلیون توکن را دارد و حتی می‌تواند روی یک کارت گرافیک Nvidia H100 اجرا شود.
  • Maverick: برای چت، تولید محتوای خلاقانه، نوشتن، کدنویسی و پاسخ به سوالات چندزبانه طراحی شده است. این مدل برای اجرا به سخت‌افزارهای قدرتمندتر (مانند DGX) نیاز دارد.

مدل Behemoth؛ غول هوش مصنوعی متا

مدل Behemoth در حال حاضر در مرحله آموزش قرار دارد و به گفته متا، در برخی از تست‌های مربوط به ریاضی و مهارت‌های STEM از رقبایی مانند GPT-4.5 و Claude 3.7 بهتر عمل کرده است. با این حال، هنوز در دسترس عموم قرار نگرفته و برای اجرای آن به سخت‌افزار پیشرفته‌تری نیاز است.

آیا Llama 4 بی‌طرف‌تر از گذشته است؟

یکی از انتقادات مطرح‌شده به مدل‌های زبانی، جانبداری سیاسی در پاسخ‌ها بوده است. متا اعلام کرده که در Llama 4 تلاش شده تا این مدل‌ها در پاسخ به مسائل اجتماعی و سیاسی بحث‌برانگیز، کمتر از قبل خودداری کنند و پاسخ‌های متعادل‌تر و بدون قضاوت ارائه دهند.

این تصمیم در واکنش به برخی انتقادات سیاسی در ایالات متحده اتخاذ شده که مدعی بودند چت‌بات‌ها نظرات محافظه‌کارانه را سانسور می‌کنند.

جدول مقایسه مدل‌های معروف هوش مصنوعی در سال ۲۰۲۵

ویژگی‌ها / مدل‌ها Llama 4 Maverick GPT-4.5 (OpenAI) Claude 3.7 Sonnet (Anthropic) Gemini 2.5 Pro (Google)
تعداد پارامترهای فعال 17 میلیارد حدود 25 میلیارد حدود 25 میلیارد بیش از 30 میلیارد
معماری Mixture of Experts (MoE) Transformer بهینه‌شده Constitutional AI Mixture of Experts (MoE)
زبان‌های پشتیبانی شده چندزبانه چندزبانه پیشرفته چندزبانه با دقت بالا چندزبانه با تمرکز بر زبان‌های آسیایی
توانایی در کدنویسی بسیار خوب عالی بسیار خوب عالی
توانایی در درک تصاویر دارد دارد دارد دارد
حداکثر طول ورودی (context) 10 میلیون توکن 128 هزار توکن بیش از 200 هزار توکن بیش از 1 میلیون توکن
مناسب برای کاربردهای چت بله بله بله بله
میزان دسترسی متن‌باز (محدود) API و تجاری API و محدود تجاری و محدود
مجوز استفاده برای کسب‌وکار نیاز به مجوز ویژه برای شرکت‌های بزرگ تجاری با ثبت‌نام در پلتفرم از طریق Google Cloud

جمع‌بندی: آیا Llama 4 رقیب جدی GPT و Gemini است؟

اگرچه مدل Maverick در برخی از تست‌ها عملکرد بهتری نسبت به GPT-4o و Google Gemini 2.0 داشته، اما هنوز در برابر مدل‌های قدرتمندتری مانند GPT-4.5 و Gemini 2.5 Pro حرف زیادی برای گفتن ندارد. با این حال، معرفی Llama 4 گامی بزرگ برای متا محسوب می‌شود و نشان می‌دهد این شرکت عزم خود را برای رقابت جدی در بازار هوش مصنوعی جزم کرده است.

متا در وبلاگ رسمی خود اعلام کرده:

«این فقط آغاز راه Llama 4 است.