[ad_1]
نوشته و ویرایش شده توسط مجله ی دیدانگار
درحالیکه دقت علاقهمندان هوش مصنوعی اخیراً به مدل تازه و ارزان GPT-4o mini جلب شده، اپل تصمیم گرفته است خانواده مدلهای کوچک خود را گسترش دهد. بهتازگی محققان اپل چند مدل متنباز را تحت پروژهای موسوم به DCLM انتشار کردند.
بر پایه گزارش AppleInsider، خانواده هوش مصنوعی تازه اپل، شامل دو مدل مهم است: یکی با 7 میلیارد پارامتر و فرد دیگر با 1.4 میلیارد پارامتر. هر دوی آنها در بنچمارکها کارکرد زیاد خوبی دارند، بهخصوص نمونه بزرگتر که بهتر از مدل Mistral-7B است و میتواند با دیگر مدلهای متنباز پیشرو همانند Llama 3 از متا و Gemma از گوگل رقابت کند.
مدلهای هوش مصنوعی متنباز تازه اپل
محققان اپل این مدلهای تازه را بهگفتن مدلهای متنباز با بهترین کارکرد توصیف کردهاند. مسئله مهم این است که در این پروژه با انتشار کردن کد آموزشی و مجموعه دادههای دیگر، مدلها به طور متنباز در Hugging Face در دسترس می باشند. این چنین هر دو مدل در بنچمارکهای MMLU امتیاز خوبی کسب کردند تا در برابر مدلهای تجاری دیگر رقابت کنند.
به حرف های محققان اپل، مدل بزرگتر یک بهبود 6.6 درصدی در بنچمارکها در قیاس با MAP-Neo (گسترش یافتهترین مدل متنباز قبلی اپل) داشته است درحالیکه تا 40 درصد از محاسبات کمتری برای آموزش آن منفعت گیری شده است. از نظر دیگر، درست همانند مدل بزرگتر DCLM-7B، نسخه کوچکتر 1.4B این مدل که روی 2.6 تریلیون توکن آموزش دیده است، کارکرد قابلتوجهی را در تستهای MMLU ،Core و Extended اراعه میدهد.
اپل در اردیبهشتماه نیز از مدلهای متنباز OpenELM رونمایی کرد که در چهار مدل گوناگون 270 میلیون پارامتری، 450 میلیون پارامتری، 1.1 میلیارد پارامتری و 3 میلیارد پارامتری انتشار شد. به حرف های اپل این مدلها در ماموریت های مربوط به پردازش متن همانند نوشتن ایمیل کارکرد مساعد دارند.
مدلهایی که محققان اپل انتشار کرده است، انگارً در هیچ یک از محصولات آینده اپل بهکار گرفته نمیشوند و زیاد تر باید آنها را به گفتن پروژههای تحقیقاتی متنباز در نظر گرفت.
دسته بندی مطالب
مقالات کسب وکار
[ad_2]


