شرکت متا (Meta) در اقدامی غافلگیرکننده و در روز شنبه، نسل جدید مدلهای هوش مصنوعی خود را با نام Llama 4 معرفی کرد. این مجموعه شامل سه مدل جدید به نامهای Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است که همگی برای داشتن درک عمیقتر از متن، تصویر و ویدیو، با حجم عظیمی از دادههای بدون برچسب آموزش دیدهاند.
رقابت فشرده با مدلهای چینی
به نظر میرسد موفقیت مدلهای متنباز شرکت DeepSeek چین، که عملکردی همسطح یا حتی بهتر از نسخههای قبلی Llama داشتهاند، متا را وادار کرده تا توسعه مدلهای جدید را با سرعتی بالا پیش ببرد. گفته میشود متا حتی “اتاقهای جنگی” تشکیل داده تا بفهمد DeepSeek چگونه هزینه اجرای مدلهای هوش مصنوعی را کاهش داده است.
مدلهایی برای کاربردهای مختلف
دو مدل Scout و Maverick هماکنون از طریق وبسایت Llama.com و پلتفرمهایی مانند Hugging Face در دسترس قرار گرفتهاند، در حالی که مدل Behemoth هنوز در مرحله آموزش قرار دارد.
در حال حاضر، دستیار هوشمند Meta AI که در اپلیکیشنهایی مانند واتساپ، مسنجر و اینستاگرام به کار میرود، در 40 کشور بهروزرسانی شده و از Llama 4 استفاده میکند. با این حال، امکانات مولتیمدیا فعلاً تنها در ایالات متحده و به زبان انگلیسی فعال هستند.
محدودیتهایی برای کاربران اروپایی
یکی از موضوعات بحثبرانگیز، مجوز استفاده از مدلهای Llama 4 است. کاربران و شرکتهایی که محل فعالیت یا اقامت قانونی آنها در اتحادیه اروپا قرار دارد، مجاز به استفاده یا توزیع این مدلها نیستند. همچنین، شرکتهایی که بیش از 700 میلیون کاربر فعال ماهانه دارند باید برای استفاده از این مدلها، مجوز ویژهای از متا دریافت کنند.
نگاهی به معماری Llama 4: ترکیب متخصصان (Mixture of Experts)
Llama 4 نخستین نسل از مدلهای متا است که از معماری Mixture of Experts (MoE) استفاده میکند. این معماری نوآورانه با تقسیم دادهها بین مجموعهای از “مدلهای متخصص”، بهرهوری را افزایش داده و پاسخدهی مدلها را بهینهتر میسازد.
برای مثال:
- Maverick دارای 400 میلیارد پارامتر کلی است، اما فقط 17 میلیارد پارامتر فعال دارد که بین 128 متخصص تقسیم شدهاند.
- Scout با 109 میلیارد پارامتر کل، تنها 17 میلیارد پارامتر فعال بین 16 متخصص دارد.
- Behemoth که هنوز منتشر نشده، با 2 تریلیون پارامتر کلی و 288 میلیارد پارامتر فعال، به سختافزار فوقالعاده قدرتمندی نیاز دارد.
Scout و Maverick: هر کدام برای چه کاری مناسباند؟
- Scout: در خلاصهسازی متون طولانی، تحلیل کدهای پیچیده و پردازش اسناد بسیار حجیم عملکرد فوقالعادهای دارد. این مدل توانایی خواندن تا 10 میلیون توکن را دارد و حتی میتواند روی یک کارت گرافیک Nvidia H100 اجرا شود.
- Maverick: برای چت، تولید محتوای خلاقانه، نوشتن، کدنویسی و پاسخ به سوالات چندزبانه طراحی شده است. این مدل برای اجرا به سختافزارهای قدرتمندتر (مانند DGX) نیاز دارد.
مدل Behemoth؛ غول هوش مصنوعی متا
مدل Behemoth در حال حاضر در مرحله آموزش قرار دارد و به گفته متا، در برخی از تستهای مربوط به ریاضی و مهارتهای STEM از رقبایی مانند GPT-4.5 و Claude 3.7 بهتر عمل کرده است. با این حال، هنوز در دسترس عموم قرار نگرفته و برای اجرای آن به سختافزار پیشرفتهتری نیاز است.
آیا Llama 4 بیطرفتر از گذشته است؟
یکی از انتقادات مطرحشده به مدلهای زبانی، جانبداری سیاسی در پاسخها بوده است. متا اعلام کرده که در Llama 4 تلاش شده تا این مدلها در پاسخ به مسائل اجتماعی و سیاسی بحثبرانگیز، کمتر از قبل خودداری کنند و پاسخهای متعادلتر و بدون قضاوت ارائه دهند.
این تصمیم در واکنش به برخی انتقادات سیاسی در ایالات متحده اتخاذ شده که مدعی بودند چتباتها نظرات محافظهکارانه را سانسور میکنند.
جدول مقایسه مدلهای معروف هوش مصنوعی در سال ۲۰۲۵
ویژگیها / مدلها | Llama 4 Maverick | GPT-4.5 (OpenAI) | Claude 3.7 Sonnet (Anthropic) | Gemini 2.5 Pro (Google) |
---|---|---|---|---|
تعداد پارامترهای فعال | 17 میلیارد | حدود 25 میلیارد | حدود 25 میلیارد | بیش از 30 میلیارد |
معماری | Mixture of Experts (MoE) | Transformer بهینهشده | Constitutional AI | Mixture of Experts (MoE) |
زبانهای پشتیبانی شده | چندزبانه | چندزبانه پیشرفته | چندزبانه با دقت بالا | چندزبانه با تمرکز بر زبانهای آسیایی |
توانایی در کدنویسی | بسیار خوب | عالی | بسیار خوب | عالی |
توانایی در درک تصاویر | دارد | دارد | دارد | دارد |
حداکثر طول ورودی (context) | 10 میلیون توکن | 128 هزار توکن | بیش از 200 هزار توکن | بیش از 1 میلیون توکن |
مناسب برای کاربردهای چت | بله | بله | بله | بله |
میزان دسترسی | متنباز (محدود) | API و تجاری | API و محدود | تجاری و محدود |
مجوز استفاده برای کسبوکار | نیاز به مجوز ویژه برای شرکتهای بزرگ | تجاری | با ثبتنام در پلتفرم | از طریق Google Cloud |
جمعبندی: آیا Llama 4 رقیب جدی GPT و Gemini است؟
اگرچه مدل Maverick در برخی از تستها عملکرد بهتری نسبت به GPT-4o و Google Gemini 2.0 داشته، اما هنوز در برابر مدلهای قدرتمندتری مانند GPT-4.5 و Gemini 2.5 Pro حرف زیادی برای گفتن ندارد. با این حال، معرفی Llama 4 گامی بزرگ برای متا محسوب میشود و نشان میدهد این شرکت عزم خود را برای رقابت جدی در بازار هوش مصنوعی جزم کرده است.
متا در وبلاگ رسمی خود اعلام کرده:
«این فقط آغاز راه Llama 4 است.