ایلان ماسک: ما تمام دانش بشری را در آموزش هوش مصنوعی مصرف کردهایم
ایلان ماسک اعلام کرد که صنعت هوش مصنوعی به نقطه اوج دادههای آموزشی رسیده و راهحل آینده، استفاده از دادههای مصنوعی است. آیا این راهکار میتواند چالشهای محدودیت داده را برطرف کند؟
ایلان ماسک در یک گفتگوی زنده که از پلتفرم X (توییتر سابق) پخش شد، بحثی مهم را مطرح کرد که توجه کارشناسان هوش مصنوعی را به خود جلب کرده است. او گفت: «ما اکنون تقریبا تمام دانش بشری را برای آموزش مدلهای هوش مصنوعی مصرف کردهایم. این اتفاق عملا سال گذشته رخ داد.»
این اظهارات، که به موضوع «اوج دادهها» اشاره دارد، با نظرات دیگر پیشگامان این صنعت همراستا است. ایلیا ساتسکِوِر، همبنیانگذار و دانشمند ارشد سابق OpenAI، نیز در کنفرانس NeurIPS پیشبینی کرد که این نقطه عطف باعث تغییرات اساسی در نحوه توسعه هوش مصنوعی خواهد شد.
بحران داده در هوش مصنوعی: چرا منابع تمام شدهاند؟
مدلهای هوش مصنوعی برای یادگیری و تولید خروجی به حجم عظیمی از دادههای دنیای واقعی نیاز دارند. این دادهها شامل متون، تصاویر و اطلاعات تولیدشده توسط انسانها است. اما طبق گفتههای ماسک، صنعت به پایان این منابع نزدیک شده است.
این وضعیت بحرانی پیامدهایی جدی در پی دارد. بدون دسترسی به دادههای تازه، توسعهدهندگان ناچارند به دنبال روشهای جایگزین باشند. یکی از راهحلهای مورد توجه، استفاده از دادههای مصنوعی است.
گام منطقی بعدی برای هوش مصنوعی چیست؟
ماسک دادههای مصنوعی را بهعنوان «گام منطقی بعدی» معرفی کرد. او توضیح داد: «با دادههای مصنوعی، هوش مصنوعی میتواند خودش را ارزیابی و از طریق فرآیند خودآموزی پیشرفت کند.»
دادههای مصنوعی، برخلاف دادههای واقعی، توسط سیستمهای هوش مصنوعی تولید میشوند. شرکتهایی مانند مایکروسافت، متا، و Anthropic از این روش برای توسعه مدلهای خود استفاده میکنند. بر اساس پیشبینی گارتنر، تا پایان 2024، 60 درصد دادههای مورد استفاده در پروژههای هوش مصنوعی مصنوعی خواهد بود.
مدل Phi-4 مایکروسافت و مدلهای سری Llama متا از نمونههای موفق این رویکرد هستند. این فناوریها نشان میدهند که دادههای مصنوعی دیگر یک راهکار حاشیهای نیست، بلکه به ابزاری کلیدی تبدیل شدهاند.
یکی از مهمترین مزایای دادههای مصنوعی، کاهش چشمگیر هزینهها است. استارتاپ Writer توانست مدل Palmyra X 004 را تقریباً با هزینهای 7 برابر کمتر از OpenAI توسعه دهد. علاوه بر هزینه، انعطافپذیری این دادهها نیز حائز اهمیت است. دادههای مصنوعی میتوانند متناسب با نیازهای خاص تنظیم شوند و این ویژگی به تسریع نوآوری در صنایعی مانند سلامت و حملونقل کمک میکند.
نگرانی اصلی بحث «فروپاشی مدل» خواهد بود!
استفاده گسترده از دادههای مصنوعی بدون ریسک نیست. یکی از نگرانیهای اصلی، پدیدهای به نام «فروپاشی مدل» است که در آن مدل به دلیل اتکای بیش از حد به دادههای تولیدی، خلاقیت و عملکرد خود را از دست میدهد.
این رویکرد همچنین میتواند تعصبات موجود در دادههای اصلی را تشدید کند و منجر به مشکلات اخلاقی یا عملکردی شود. بنابراین، محققان تاکید دارند که دادههای مصنوعی باید با نظارت دقیق و ترکیب با دادههای واقعی مورد استفاده قرار گیرند.
اظهارات ایلان ماسک نشان میدهد که صنعت هوش مصنوعی وارد مرحلهای حساس شده است. استفاده از دادههای مصنوعی فرصتی برای گسترش مرزهای هوش مصنوعی فراهم میکند، اما تنها در صورتی که با کنترل کیفی دقیق و ملاحظات اخلاقی همراه باشد.
در نهایت، مسیر پیشروی هوش مصنوعی نیازمند توازن بین نوآوری و احتیاط است. با این رویکرد، میتوان چالشهای موجود را به فرصتهایی جدید تبدیل کرد.
اخبار حوزه استارتاپ و فناوری اطلاعات را در صفحه علم و فناوری تجارتنیوز بخوانید.
منبع: تجارت نیوز