پیام خوزستان

آخرين مطالب

داده‌های جهان برای تغذیه هوش مصنوعی در حال اتمام است علمي

داده‌های جهان برای تغذیه هوش مصنوعی در حال اتمام است
  بزرگنمايي:

پیام خوزستان - کارشناسان هشدار می‌دهند که داده‌های جهان برای تغذیه هوش مصنوعی در حال اتمام است.

به گزارش اس‌ای، در حالی که هوش مصنوعی این روزها به اوج محبوبیت خود می‌رسد، پژوهشگران هشدار داده‌اند که این صنعت ممکن است با کمبود داده‌های آموزشی روبرو شود.
داده‌ها به مانند سوختی هستند که سیستم‌های هوش مصنوعی قدرتمند را نیرو می‌دهند و این مشکل می‌تواند رشد مدل‌های هوش مصنوعی، به ویژه مدل‌های زبانی بزرگ را کاهش دهد و حتی ممکن است مسیر انقلاب هوش مصنوعی را تغییر دهد.
اما چرا کمبود بالقوه داده با توجه به میزان موجود در شبکه جهانی وب یک مشکل است و اینکه آیا راهی برای مقابله با این خطر وجود دارد؟
اهمیت داده‌های با کیفیت بالا برای هوش مصنوعی
ما برای آموزش الگوریتم‌های هوش مصنوعی قدرتمند، دقیق و با کیفیت به داده‌های زیادی نیاز داریم. به عنوان مثال، چت‌بات ChatGPT بر روی 570 گیگابایت داده متنی یا حدود 300 میلیارد کلمه آموزش داده شده است.
به طور مشابه، الگوریتم انتشار پایدار(که پشت بسیاری از برنامه‌های تولید تصویر هوش مصنوعی مانند DALL-E، Lensa و Midjourney قرار دارد) بر روی مجموعه داده LIAON-5B متشکل از 5.8 میلیارد جفت تصویر-متن آموزش داده شده است. اگر الگوریتمی روی مقدار ناکافی داده آموزش داده شود، خروجی‌های نادرست یا با کیفیت پایین تولید می‌کند.
کیفیت داده‌های آموزشی نیز مهم است. دسترسی به داده‌های با کیفیت پایین مانند پست‌های رسانه‌های اجتماعی یا عکس‌های تار آسان است، اما برای آموزش مدل‌های هوش مصنوعی با کارایی بالا کافی نیستند.
متنی که از سکوهای رسانه‌های اجتماعی گرفته می‌شود ممکن است مغرضانه یا تعصب‌آمیز باشد یا ممکن است حاوی اطلاعات نادرست یا محتوای غیرقانونی باشد که می‌تواند توسط مدل هوش مصنوعی تکرار شود. به عنوان مثال، زمانی که مایکروسافت سعی کرد ربات هوش مصنوعی خود را با استفاده از محتوای توییتر آموزش دهد، دریافت که خروجی‌های نژادپرستانه و زن‌ستیز تولید می‌کند.
به همین دلیل است که توسعه‌دهندگان هوش مصنوعی به دنبال محتوای باکیفیت مانند متن از کتاب‌ها، مقالات آنلاین، مقالات علمی، ویکی‌پدیا و محتوای وب فیلتر شده خاص هستند. مثلا Google Assistant بر روی 11 هزار رمان عاشقانه برگرفته از سایت خودانتشار Smashwords آموزش دیده است تا اطلاعات بیشتری در چنته داشته باشد.
آیا ما داده‌های کافی داریم؟
صنعت هوش مصنوعی، سیستم‌های هوش مصنوعی را بر روی مجموعه داده‌های بزرگ‌تر آموزش می‌دهد، به همین دلیل است که ما اکنون مدل‌هایی با عملکرد بالا مانند ChatGPT یا DALL-E 3 داریم. در عین حال، تحقیقات نشان می‌دهد که ذخیره داده‌های آنلاین بسیار کندتر از مجموعه داده‌های مورد استفاده در حال رشد برای آموزش هوش مصنوعی هستند.
در مقاله‌ای که سال گذشته منتشر شد، گروهی از پژوهشگران پیش‌بینی کردند که اگر روند آموزشی فعلی هوش مصنوعی ادامه یابد، قبل از سال 2026 داده‌های متنی با کیفیت بالا تمام خواهد شد.
آنها همچنین تخمین زدند که داده‌های زبانی با کیفیت پایین بین سال‌های 2030 تا 2050 و داده‌های تصویری با کیفیت پایین بین سال‌های 2030 تا 2060 به پایان می‌رسد.
به گفته گروه مشاوره و حسابداری PwC، هوش مصنوعی تا سال 2030 می‌تواند تا 15.7 تریلیون دلار به اقتصاد جهان کمک کند. اما تمام شدن داده‌های قابل استفاده می‌تواند توسعه آن را آهسته کند.
آیا باید نگران باشیم؟
در حالی که نکات بالا ممکن است برخی از طرفداران هوش مصنوعی را نگران کند، این وضعیت ممکن است آنقدرها هم که به نظر می‌رسد بد نباشد. ناشناخته‌های زیادی در مورد چگونگی توسعه مدل‌های هوش مصنوعی در آینده و همچنین چند راه برای مقابله با خطر کمبود داده وجود دارد.
یکی از فرصت‌ها برای توسعه‌دهندگان هوش مصنوعی است که الگوریتم‌ها را بهبود ببخشند تا از داده‌هایی که در حال حاضر در اختیار دارند به طور کارآمدتر استفاده کنند.
این احتمال وجود دارد که در سال‌های آینده آنها بتوانند سیستم‌های هوش مصنوعی با عملکرد بالا را با استفاده از داده‌های کمتر و احتمالاً قدرت محاسباتی کمتر آموزش دهند. این همچنین به کاهش ردپای کربن هوش مصنوعی کمک می‌کند.
گزینه دیگر استفاده از هوش مصنوعی برای ایجاد داده‌های مصنوعی برای آموزش سیستم‌هاست. به عبارت دیگر، توسعه‌دهندگان به سادگی می‌توانند داده‌های مورد نیاز خود را تولید کنند که متناسب با مدل هوش مصنوعی خاص آنها باشد.
چندین پروژه در حال حاضر از محتوای مصنوعی استفاده می‌کنند که اغلب از سرویس‌های تولید داده مانند Mostly AI تهیه می‌شود. این امر در آینده رایج‌تر خواهد شد.
توسعه دهندگان همچنین به دنبال محتوایی خارج از فضای آنلاین رایگان هستند، مانند محتوایی که توسط ناشران بزرگ و مخازن آفلاین نگهداری می‌شود. به میلیون‌ها متن منتشر شده قبل از دوران فراگیری اینترنت فکر کنید. آنهایی که به صورت دیجیتالی درنیامده‌اند و در دسترس قرار بگیرند، می‌توانند منبع جدیدی از داده‌ها را برای پروژه‌های هوش مصنوعی فراهم کنند.
بنیاد News Corp یکی از بزرگترین دارندگان محتوای خبری در جهان اخیراً اعلام کرده است که در حال مذاکره با توسعه‌دهندگان هوش مصنوعی برای قراردادهای محتواست. چنین معاملاتی شرکت‌های هوش مصنوعی را مجبور می‌کند برای داده‌های آموزشی پول بپردازند، در حالی که تاکنون بیشتر آنها را به صورت رایگان از اینترنت حذف کرده‌اند.
سازندگان محتوا نسبت به استفاده غیرمجاز از محتوای خود برای آموزش مدل‌های هوش مصنوعی اعتراض کرده‌اند و برخی از شرکت‌هایی مانند مایکروسافت، OpenAI و Stability AI شکایت کرده‌اند. دریافت پاداش برای کار آنها ممکن است به بازگرداندن برخی از عدم تعادل قدرت بین خلاقان و شرکت‌های هوش مصنوعی کمک کند.

لینک کوتاه:
https://www.payamekhuzestan.ir/Fa/News/794145/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

مراسم عزاداری ایام فاطمیه در شهرستان کرخه خوزستان

مجموع عملیات تخلیه و بارگیری کالا در منطقه ویژه اقتصادی بندر امام به حدود 29 میلیون و 100 تن رسید

طرح نهضت ملی مسکن کهگیلویه و بویراحمد35 درصدپیشرفت فیزیکی دارد

رسانه غربی: 2024 سالی جهنمی برای غرب خواهد بود

برگزیدگان بیست وپنجمین کنگره ملی شعر دفاع مقدس و مقاومت مشخص شدند

حمایت از زنان زندانی در آستانه آزادی

بازگشت به کار 13 هزار کارگر در خوزستان

فوری از آزادی: مصدومیت نگران‌کننده اسماعیلی‌فر!

اینفوگراف|آخرین تحولات نبرد طوفان الاقصی؛ روز پنجاه و نهم و تشدید درگیری‌ها در شمال و جنوب نوار غزه

راه حل ایران برای مسئله فلسطین چیست؟ | دلایل رد راه‌حل «دو دولتی»

مصدومیت ناگهانی دانیال اسماعیلی‌فر مقابل چشمان گل محمدی

نبرد شدید مقاومت با نظامیان صهیونیست از فاصله صفر

تمرین پرسپولیسی‌ها در هوای آلوده آزادی/ مصدومیت اسماعیلی‌فر در روز بازگشت امیری و عمری

مردم تهران پیکرهای 9 شهید مدافع حرم را بدرقه کردند

گاف عجیب الدحیل در نشست بازی با پرسپولیس؛ انگلیسی بلد نیستیم!

روزهای سرنوشت‌ساز پرسپولیس در آزادی؛ رستگاری یا دوزخ؟!

حملات اسرائیل به پایگاه‌های ایرانی در سوریه بدون پاسخ نمی‌ماند | تهران از هیچ کمکی به گروه‌های مقاومت دریغ نمی‌کند

رویداد ملی «صبح زیتون»در قم برگزار می‌شود

نماینده دزفول خبر داد : افتتاح 22 پروژه عمرانی ، درمانی و بهداشتی در دزفول با حضور وزیر بهداشت

انتقاد سعید جلیلی از رفتار دوگانه مدعیان آزادی در برابر جنایات اسرائیل/ چرا ‌قطعنامه‌‌ محکومیت ‌صادر نشد؟

خوزستان پلی برای استخدام دولتی شده است/ درخواست انتقال نیروها بعد از 6 ماه

اولویت و پاشنه آشیل مدیریت مصرف گاز چیست؟/ حجم مصرف با روند کاهش دما تناسب ندارد

حماس کارت قدرتمندی به دست آورد | آزادکردن گروگان‌ها اولویت پنجم هم نبود!

قالیباف: طوفان الاقصی تاریخ را جابجا کرد

روایت بورل از رایزنی تلفنی با امیرعبداللهیان درباره جنگ غزه

دبیرکل مجمع خبرنگاران و نویسندگان دفاع‌مقدس و مقاومت: خبرنگاران ظلم صهیونیسم را آشکار کردند

درگیری مقاومت با نظامیان اسرائیلی در شرق غزه؛ 10 تانک و نفربر منهدم شدند

آزادی اسرا بهای هنگفتی دارد

تشکیل 1580 پرونده تخلف صنفی در خوزستان

رویداد «پایتخت موکب‌ها» یک جریان قوی فرهنگی و هنری در خوزستان است

بازگشت به کار 13 هزار و 370 کارگر در خوزستان

قرارداد مترو اهواز به زودی منعقد شود

تأمین تجهیزات و نیروی انسانی بخش اعصاب و روان بیمارستان چمران شهرستان بروجرد ضروری است

جزئیات دومین جشنواره علمی شهید چمران / معرفی جهادگران برتر تبیین در دانشگاه‌ها

مجوز جذب هزار و 400 نیرو برای بخش بهداشت و درمان خوزستان صادر شد

مردم تهران پیکرهای هفت شهید مدافع حرم را بدرقه کردند

اشغالگران آمریکایی تاوان سنگین جنایت کرکوک را پرداخت خواهند کرد

کنترل دمای بتن در زمستان با افزودنی بتن

قتل عام تلخ خانوادگی در رباط کریم

دفن جسد راننده تاکسی در باغ شهریار

1400 نفر در حوزه بهداشت و درمان خوزستان استخدام می‌شوند

فلسطین با موشک در برابر اسرائیل مقاومت می‌کند

ورزشگاه آزادی در هاله‌ای از آلودگی سنگین پیش از دیدار پرسپولیس - الدحیل +فیلم و عکس

مشکل اساسی معلولین شهرستان دزفول کمبود امکانات است نه معلولیت

تل آویو موشکباران شد

ورزشگاه آزادی در هاله‌ای از آلودگی پیش از دیدار پرسپولیس +فیلم و عکس

اشغالگران آمریکایی تاوان سنگینی برای جنایات خود خواهند داد

رئیس پیشین موساد: آزادی گروگان‌ها بهای هنگفتی دارد

ورزشگاه آزادی یک روز مانده به بازی آسیایی پرسپولیس؛ در این هوا نمی توان بازی کرد + ویدیو

نماینده جنبش جهاد اسلامی فلسطین: قدردان حمایت‌های ایران هستیم