[ad_1]
نوشته و ویرایش شده توسط مجله ی دیدانگار

درحالی‌که دقت علاقه‌مندان هوش مصنوعی اخیراً به مدل تازه و ارزان GPT-4o mini جلب شده، اپل تصمیم گرفته است خانواده مدل‌های کوچک خود را گسترش دهد. به‌تازگی محققان اپل چند مدل‌ متن‌باز را تحت پروژه‌ای موسوم به DCLM انتشار کردند.

بر پایه گزارش AppleInsider، خانواده هوش مصنوعی تازه اپل، شامل دو مدل مهم است: یکی با 7 میلیارد پارامتر و فرد دیگر با 1.4 میلیارد پارامتر. هر دوی آن‌ها در بنچمارک‌ها کارکرد زیاد خوبی دارند، به‌خصوص نمونه بزرگ‌تر که بهتر از مدل Mistral-7B است و می‌تواند با دیگر مدل‌های متن‌باز پیشرو همانند Llama 3 از متا و Gemma از گوگل رقابت کند.

مدل‌های هوش مصنوعی متن‌باز تازه اپل

محققان اپل این مدل‌های تازه را به‌گفتن مدل‌های متن‌باز با بهترین کارکرد توصیف کرده‌اند. مسئله‌ مهم این است که در این پروژه با انتشار کردن کد آموزشی و مجموعه داده‌های دیگر، مدل‌ها به طور متن‌باز در Hugging Face در دسترس می باشند. این چنین هر دو مدل در بنچمارک‌های MMLU امتیاز خوبی کسب کردند تا در برابر مدل‌های تجاری دیگر رقابت کنند.

قیاس امتیاز مدل متن‌باز تازه اپل (DCLM-7B) با دیگر مدل‌ها

به حرف های محققان اپل، مدل بزرگ‌تر یک بهبود 6.6 درصدی در بنچمارک‌ها در قیاس با MAP-Neo (گسترش یافتهترین مدل متن‌باز قبلی اپل) داشته است درحالی‌که تا 40 درصد از محاسبات کمتری برای آموزش آن منفعت گیری شده است. از نظر دیگر، درست همانند مدل بزرگ‌تر DCLM-7B، نسخه کوچک‌تر 1.4B این مدل که روی 2.6 تریلیون توکن آموزش دیده است، کارکرد قابل‌توجهی را در تست‌های MMLU ،Core و Extended اراعه می‌دهد.

اپل در اردیبهشت‌ماه نیز از مدل‌های متن‌باز OpenELM رونمایی کرد که در چهار مدل گوناگون 270 میلیون پارامتری، 450 میلیون پارامتری، 1.1 میلیارد پارامتری و 3 میلیارد پارامتری انتشار شد. به حرف های اپل این مدل‌ها در ماموریت های مربوط به پردازش متن همانند نوشتن ایمیل کارکرد مساعد دارند.

مدل‌هایی که محققان اپل انتشار کرده است، انگارً در هیچ یک از محصولات آینده اپل به‌کار گرفته نمی‌شوند و زیاد تر باید آن‌ها را به گفتن پروژه‌های تحقیقاتی متن‌باز در نظر گرفت.

دسته بندی مطالب
مقالات کسب وکار

مقالات تکنولوژی

مقالات آموزشی

سلامت و تندرستی

[ad_2]