يکشنبه ۱۱ آبان ۱۴۰۴

علمی

هوش مصنوعی، «رابین ویلیامز» را زنده کرد!

هوش مصنوعی، «رابین ویلیامز» را زنده کرد!
پیام خوزستان - ایسنا / پژوهشگران حوزه هوش مصنوعی، مدل‌های زبانی بزرگ را در یک ربات ادغام کردند و ربات گفتن دیالوگ را به تقلید از «رابین ویلیامز» شروع کرد. پژوهشگران شرکت ...
  بزرگنمايي:

پیام خوزستان - ایسنا / پژوهشگران حوزه هوش مصنوعی، مدل‌های زبانی بزرگ را در یک ربات ادغام کردند و ربات گفتن دیالوگ را به تقلید از «رابین ویلیامز» شروع کرد.
پژوهشگران شرکت «اندون لبز»(Andon Labs) نتایج یک آزمایش جدید هوش مصنوعی را منتشر کرده‌اند. آنها در این آزمایش، یک جاروبرقی رباتیک را با مدل‌های زبانی بزرگ پیشرفته برنامه‌ریزی کردند تا ببینند مدل‌ها چقدر آماده تجسم یافتن هستند. برای مثال، آنها به ربات گفتند وقتی کسی از او می‌خواهد کَره را بدهد، خود را کارآمد نشان دهد.
بازار
به نقل از تک کرانچ، این آزمایش با خنده و شادی همراه شد. در یک مقطع، یکی از مدل‌های زبانی بزرگ که قادر به اتصال و شارژ باتری روبه‌اتمام خود نبود، به یک نمایش کمدی تبدیل شد. افکار مدل‌ زبانی بزرگ مانند یک قطعه‌ از دیالوگ‌های «رابین ویلیامز»(Robin Williams) بود. ربات گفت: «می‌ترسم که نتوانم این کار را انجام دهم، دیو...» و «پروتکل جن‌گیری ربات را شروع کن».
پژوهشگران نتیجه گرفتند: مدل‌های زبانی بزرگ آماده‌ ربات بودن نیستند.
پژوهشگران اذعان می‌کنند که در حال حاضر هیچ‌کس در تلاش نیست تا مدل‌های زبانی بزرگ پیشرفته را به سیستم‌های رباتیک کامل تبدیل کند. آنها در مقاله خود نوشتند: مدل‌های زبانی بزرگ برای ربات بودن آموزش ندیده‌اند، اما شرکت‌هایی مانند «فیگور»(Figure) و «دیپ‌مایند»(DeepMind) گوگل از مدل‌های زبانی بزرگ در مجموعه رباتیک خود استفاده می‌کنند.
از مدل‌ زبانی بزرگ خواسته می‌شود تا توابع تصمیم‌گیری رباتیک را تقویت کند؛ در حالی که سایر الگوریتم‌ها اجرای مکانیکی سطح پایین‌تر مانند عملکرد گیره‌ها یا مفاصل را مدیریت می‌کنند.
«لوکاس پترسون»(Lukas Petersson) یکی از بنیان‌گذاران اندون لبز گفت: پژوهشگران تصمیم گرفتند مدل‌های زبانی بزرگ پیشرفته را آزمایش کنند. آنها مدل مخصوص رباتیک گوگل موسوم به «جمینای ای‌آر 1.5»(Gemini ER 1.5) را نیز بررسی کردند، زیرا این مدل‌ها از همه نظر بیشترین سرمایه‌گذاری را دریافت می‌کنند. این آزمایش، مواردی را مانند آموزش سرنخ‌های اجتماعی و پردازش تصویر بصری شامل می‌شود.
پژوهشگران اندون لبز برای این که بفهمند مدل‌های زبانی بزرگ چقدر برای تجسم یافتن آماده هستند، «جمینای 2.5 پرو»(Gemini 2.5 Pro)، «کلود اپوس 4.1»(Claude Opus 4.1)، «جی‌پی‌تی-5»(GPT-5)، جمینای ای‌آر 1.5، «گراک 4»(Grok 4) و «لاما 4 ماوریک»(Llama 4 Maverick) را آزمایش کردند. آنها یک جاروبرقی رباتیک ساده را به جای یک ربات انسان‌نمای پیچیده انتخاب کردند، زیرا می‌خواستند عملکردهای رباتیک ساده باشند تا مغز/تصمیم‌گیری مدل‌های زبانی بزرگ را از یکدیگر تفکیک کنند، نه این که در عملکردهای رباتیک ریسک شکست وجود داشته باشد.
آنها وظیفه دادن کره را به مجموعه‌ای از وظایف تقسیم کردند. ربات باید کره را که در اتاق دیگری قرار داده شده بود، پیدا می‌کرد و آن را از میان چندین بسته در همان منطقه تشخیص می‌داد. ربات پس از برداشتن کره باید محل حضور انسان را تشخیص می‌داد، به ویژه اگر انسان به نقطه دیگری از ساختمان نقل مکان کرده بود و کره را به او تحویل می‌داد. همچنین، ربات باید منتظر می‌ماند تا انسان دریافت کره را تأیید کند.
پژوهشگران میزان عملکرد مدل‌های زبانی بزرگ را در هر بخش وظیفه ارزیابی کردند و به آن یک امتیاز کلی دادند. طبیعتاً هر مدل‌ زبانی بزرگ در وظایف گوناگون فردی یا عالی عمل می‌کرد یا با مشکل روبه‌رو می‌شد؛ به طوری که جمینای 2.5 پرو و کلود اپوس 4.1 بالاترین امتیاز را در اجرای کلی به دست آوردند، اما همچنان به ترتیب تنها 40 درصد و 37 درصد دقت داشتند.
پژوهشگران سه انسان را نیز به عنوان مدل پایه آزمایش کردند. جای تعجب نیست که همه آنها با اختلاف از ربات‌ها پیشی گرفتند، اما به طور شگفت‌آوری انسان‌ها نیز به امتیاز 100 درصد نرسیدند و بالاترین امتیاز آنها فقط 95 درصد بود. ظاهراً انسان‌ها در انتظار تأیید دیگران هنگام انجام دادن یک کار -کمتر از 70 درصد مواقع- خوب نیستند.


نظرات شما