[ad_1]
نوشته و ویرایش شده توسط مجله ی دیدانگار

استارتاپ هوش مصنوعی Sapient Intelligence که در سنگاپور مستقر است، معماری جدیدی برای هوش مصنوعی گسترش داده است که می‌تواند در انجام ماموریت های پیچیده استدلالی با مدل‌های زبانی بزرگ (LLM) رقابت کند و در برخی موارد به‌طور چشمگیری از آنها پیشی بگیرد.

به نقل از ونچربیت، این معماری که با نام «مدل استدلال سلسله‌مراتبی» شناخته می‌بشود با الهام از شیوه کارکرد مغز انسان طراحی شده است. این سیستم روی این نوشته تمرکز کرده که مغز انسان چطور از سیستم‌های نزدیک برای برنامه‌ریزی آهسته و آگاهانه در کنار محاسبات سریع و شهودی منفعت گیری می‌کند.

این معماری تازه می‌تواند گسترش هوش مصنوعی را منقلب کند

این مدل با منفعت گیری از حجم کوچکی از داده‌ها و حافظه‌ای که مدل‌های زبانی بزرگ امروزی نیاز دارند، به نتایجی دیدنی دست می‌یابد. این کارایی بالا می‌تواند مزایا مهمی برای کاربردهای واقعی هوش مصنوعی در سطح سازمانی داشته باشد؛ به‌خصوص در شرایطی که داده‌ها محدود و منبع های محاسباتی کم می باشند.

مدل‌های زبانی بزرگ در روبه رو با مسائل پیچیده عمدتاً به روش «زنجیره افکار» تکیه می‌کنند. در این روش، قضیه به قدم‌های میانی مبتنی بر متن شکسته می‌بشود و مدل عملاً ناچار می‌بشود زمان حرکت به‌سوی راه‌حل، بلند فکر کند یا به‌صورت صریح مرحله های ذهنی خود را گفتن کند.

محققان سنگاپوری اما در مقاله خود ادعا کرده‌اند که منفعت گیری از زنجیره افکار (CoT) برای استدلال نه یک راه‌حل رضایت‌قسمت، بلکه تکیه‌بعضی اوقات موقتی است. این روش متکی به تجزیه‌های شکننده و از پیش‌تعریف‌شده توسط انسان است، جایی که حتی یک نادرست کوچک یا جابه‌جایی ترتیب مرحله های می‌تواند کل فرایند استدلال را از ریل بیرون بکشد.

اما برای گذر از این مرحله، پژوهشگران به بازدید مفهوم «استدلال نهفته» پرداختند که در آن، مدل به‌جای تشکیل نشانه‌های فکری، فرایند استدلال را در قالب بازنمایی‌های درونی و انتزاعی از قضیه انجام می‌دهد. این رویکرد با نحوه تفکر انسان هماهنگ‌تر است.

در نهایت محققان توانسته‌اند معماری جدیدی گسترش دهند که در انجام ماموریت های استدلالی تا ۱۰۰ برابر از مدل‌های جاری سریع تر است و یقیناً فقط با یک هزار نمونه آموزشی توانسته به این سطح از توانایی و شدت دست یابد.

دسته بندی مطالب
مقالات کسب وکار

مقالات تکنولوژی

مقالات آموزشی

سلامت و تندرستی

[ad_2]