سه شنبه ۲۶ خرداد ۱۴۰۵

علمی

هوش مصنوعی در آزمون تمرکز انسان مردود شد

هوش مصنوعی در آزمون تمرکز انسان مردود شد
پیام خوزستان - ایرنا / یک آزمایش معروف روانشناسی که دهه‌هاست برای سنجش تمرکز انسان استفاده می‌شود، نشان داده است که پیشرفته‌ترین سامانه‌های هوش مصنوعی در حفظ تمرکز برای مدت ...
  بزرگنمايي:

پیام خوزستان - ایرنا / یک آزمایش معروف روانشناسی که دهه‌هاست برای سنجش تمرکز انسان استفاده می‌شود، نشان داده است که پیشرفته‌ترین سامانه‌های هوش مصنوعی در حفظ تمرکز برای مدت طولانی با مشکل روبه‌رو می‌شوند. این یافته ضعف پنهان هوش مصنوعی را آشکار می‌کند.
یک آزمایش معروف روانشناسی، ضعف شگفت‌انگیزی را در برخی از پیشرفته‌ترین سامانه‌های هوش مصنوعی امروزی آشکار کرده است. این یافته نشان می‌دهد که نحوه توجه و تمرکز در هوش مصنوعی ممکن است با انسان تفاوت اساسی داشته باشد.
پژوهشگران به سرپرستی سوکتو پاتل (Suketu Patel) بررسی کردند که سامانه‌های هوش مصنوعی پیشرفته (مانند جی‌پی‌تی ۵، کلود و جمینای) چگونه یک چالش شناختی معروف به تکلیف استروپ (Stroop task) را مدیریت می‌کنند. نتایج نشان می‌دهد که هوش مصنوعی در بسیاری از کارهای پیچیده عملکرد چشمگیری دارد، اما در حفظ تمرکز در برابر اطلاعات متضاد و برای مدت طولانی، دچار مشکل می‌شود.
بازار
تکلیف استروپ چیست؟
تکلیف استروپ یک آزمایش معروف روانشناسی است که از چندین دهه‌ پیش، برای مطالعه توجه و کنترل ذهنی استفاده می‌شود. در این آزمایش، اسامی رنگ‌ها (مانند قرمز یا آبی) به شرکت‌کنندگان نشان داده می‌شود، اما این کلمات با جوهر رنگی نوشته شده‌اند.
گاهی رنگ جوهر با معنای کلمه همخوانی دارد (مثلاً کلمه قرمز با جوهر قرمز نوشته می‌شود) و گاهی متضاد است (مثلاً کلمه قرمز با جوهر آبی نوشته می‌شود). از شرکت‌کنندگان خواسته می‌شود رنگ جوهر را تشخیص دهند و معنای کلمه را نادیده بگیرند.
این کار ساده به نظر می‌رسد، اما یک تضاد در ذهن ایجاد می‌کند چون مغز هم باید رنگ را ببیند و هم کلمه را نادیده بگیرد. بیشتر مردم در خواندن کلمات بسیار ماهر هستند؛ بنابراین سرکوب این عادت نیازمند چیزی است که روانشناسان کنترل اجرایی می‌نامند که به معنای توانایی مغز برای تمرکز بر یک هدف، مقاومت در برابر حواس‌پرتی و غلبه بر واکنش‌های خودکار است.
انسان‌ها معمولاً وقتی رنگ جوهر با نام رنگ همخوانی ندارد، کمی دیرتر پاسخ می‌دهند؛ اما حتی اگر آزمایش طولانی شود، باز هم دقتشان بالاست و تمرکز خود را روی دستورالعمل حفظ می‌کنند.
عملکرد خوب هوش مصنوعی در ابتدا
پژوهشگران برای بررسی عملکرد سامانه‌های هوش مصنوعی، چند مدل پیشرو را با فهرستی از کلمات رنگی آزمایش کردند. وقتی فهرست‌ها کوتاه بودند (مثلاً فقط پنج کلمه)، مدل‌ها عملکرد شگفت‌انگیزی داشتند.
دقت جی‌پی‌تی ۴ او، در این آزمون‌های کوتاه به ۹۱ درصد رسید. کلود ۳.۵ سونت نیز نتیجه خوبی گرفت. در نگاه اول، به نظر می‌رسید که سامانه‌های هوش مصنوعی می‌توانند به خوبی از دستورالعمل پیروی کنند و معنای مزاحم کلمات را نادیده بگیرند.
افت عملکرد با افزایش طول فهرست
اما زمانی که پژوهشگران طول فهرست کلمات را افزایش دادند، وضعیت به طرز چشمگیری تغییر کرد. دقت جی‌پی‌تی ۴ او، از ۹۱ درصد با پنج کلمه به ۵۷ درصد با ۱۰ کلمه کاهش یافت. زمانی که فهرست به ۴۰ کلمه رسید، دقت به ۱۵ درصد سقوط کرد.
کلود ۳.۵ سونت مقاومت بیشتری نشان داد و تا ۲۰ کلمه عملکرد پایداری داشت، اما با ۴۰ کلمه دقت آن به ۲۴ درصد کاهش یافت. پژوهشگران الگوهای مشابهی را در جی‌پی‌تی ۵، کلود اپوس ۴.۱ و جمینای ۲.۵ مشاهده کردند.
عملکرد زمانی بدتر شد که کلمات همخوان و ناهمخوان با رنگ‌ها در یک فهرست ترکیب شدند. در آن شرایط، دقت روی موارد ناهمخوان تقریباً به صفر رسید.
چرا انسان و هوش مصنوعی متفاوت پاسخ می‌دهند؟
این نتایج نشان می‌دهد که نحوه پردازش اطلاعات در هوش مصنوعی با شناخت انسان تفاوت مهمی دارد. سامانه‌های هوش مصنوعی، درست مثل انسان‌ها، در طول آموزش خود بیشتر با کلمات سروکار داشته‌اند تا با رنگ‌ها؛ به همین دلیل، تمایل طبیعی دارند که به کلمه نوشته شده توجه کنند.
اما انسان‌ها معمولاً می‌توانند این واکنش خودکار را سرکوب کنند و روی کاری که از آن‌ها خواسته شده متمرکز بمانند؛ حتی اگر آزمایش طولانی شود. در مقابل، مدل‌های هوش مصنوعی با ادامه آزمایش، کم‌کم به خواندن کلمات بازمی‌گشتند و رنگ را نادیده می‌گرفتند، یعنی به نظر می‌رسید هدف اصلی را فراموش کرده‌اند.
به گفته پژوهشگران، این شکست نشان می‌دهد که سازوکار توجه در سامانه‌های هوش مصنوعی امروزی، اساساً با سامانه توجه در مغز انسان تفاوت دارد.
نگاهی به محدودیت‌های هوش مصنوعی
مدل‌های پیشرفته هوش مصنوعی توانایی‌های چشمگیری در نوشتن، استدلال، برنامه‌نویسی و گفت‌وگو دارند؛ اما مطالعاتی مانند این نشان می‌دهد که عملکرد خوب لزوماً به معنای پردازش اطلاعات به شیوه انسان نیست.
این یافته‌ها حکایت از آن دارد که هوش مصنوعی امروزی ممکن است نقاط ضعف پنهانی داشته باشد؛ به‌ویژه در کارهایی که نیاز به تمرکز پایدار، مهار واکنش‌های خودکار و پیروی طولانی‌مدت از دستورالعمل‌های خاص دارند.
با توجه به اینکه سامانه‌های هوش مصنوعی به طور فزاینده‌ای در زندگی روزمره ما وارد می‌شوند، درک این محدودیت‌ها به همان اندازه شناخت نقاط قوت آن‌ها اهمیت دارد.


نظرات شما