[ad_1]
نوشته و ویرایش شده توسط مجله ی دیدانگار
استارتاپ هوش مصنوعی Sapient Intelligence که در سنگاپور مستقر است، معماری جدیدی برای هوش مصنوعی گسترش داده است که میتواند در انجام ماموریت های پیچیده استدلالی با مدلهای زبانی بزرگ (LLM) رقابت کند و در برخی موارد بهطور چشمگیری از آنها پیشی بگیرد.
به نقل از ونچربیت، این معماری که با نام «مدل استدلال سلسلهمراتبی» شناخته میبشود با الهام از شیوه کارکرد مغز انسان طراحی شده است. این سیستم روی این نوشته تمرکز کرده که مغز انسان چطور از سیستمهای نزدیک برای برنامهریزی آهسته و آگاهانه در کنار محاسبات سریع و شهودی منفعت گیری میکند.
این معماری تازه میتواند گسترش هوش مصنوعی را منقلب کند
این مدل با منفعت گیری از حجم کوچکی از دادهها و حافظهای که مدلهای زبانی بزرگ امروزی نیاز دارند، به نتایجی دیدنی دست مییابد. این کارایی بالا میتواند مزایا مهمی برای کاربردهای واقعی هوش مصنوعی در سطح سازمانی داشته باشد؛ بهخصوص در شرایطی که دادهها محدود و منبع های محاسباتی کم می باشند.
مدلهای زبانی بزرگ در روبه رو با مسائل پیچیده عمدتاً به روش «زنجیره افکار» تکیه میکنند. در این روش، قضیه به قدمهای میانی مبتنی بر متن شکسته میبشود و مدل عملاً ناچار میبشود زمان حرکت بهسوی راهحل، بلند فکر کند یا بهصورت صریح مرحله های ذهنی خود را گفتن کند.
محققان سنگاپوری اما در مقاله خود ادعا کردهاند که منفعت گیری از زنجیره افکار (CoT) برای استدلال نه یک راهحل رضایتقسمت، بلکه تکیهبعضی اوقات موقتی است. این روش متکی به تجزیههای شکننده و از پیشتعریفشده توسط انسان است، جایی که حتی یک نادرست کوچک یا جابهجایی ترتیب مرحله های میتواند کل فرایند استدلال را از ریل بیرون بکشد.
اما برای گذر از این مرحله، پژوهشگران به بازدید مفهوم «استدلال نهفته» پرداختند که در آن، مدل بهجای تشکیل نشانههای فکری، فرایند استدلال را در قالب بازنماییهای درونی و انتزاعی از قضیه انجام میدهد. این رویکرد با نحوه تفکر انسان هماهنگتر است.
در نهایت محققان توانستهاند معماری جدیدی گسترش دهند که در انجام ماموریت های استدلالی تا ۱۰۰ برابر از مدلهای جاری سریع تر است و یقیناً فقط با یک هزار نمونه آموزشی توانسته به این سطح از توانایی و شدت دست یابد.
دسته بندی مطالب
مقالات کسب وکار
[ad_2]


