هوش مصنوعی مولد نوعی فناوری هوش مصنوعی است که میتواند انواع مختلفی از محتوا از جمله متن، تصویر، صدا، گرافیک، ویدئوهای با کیفیت بالا و دادههای مصنوعی را تولید کند.البته این فناوری کاملاً جدید نیست. هوش مصنوعی مولد در دهه ۱۹۶۰ در چتباتها معرفی شد. اما تا سال ۲۰۱۴، و پیش از معرفی شبکههای مولد تخاصمی یا GAN که اختصار عبارت (Generative Adversarial Network) و نوعی الگوریتم یادگیری ماشین است، مورد توجه قرار نداشت. پس از آن بود که این نوع هوش مصنوعی توانست تصاویر، ویدئوها و صداهای افراد واقعی را به صورت قانعکنندهای واقعی خلق کند.
این قابلیت جدید از یک طرف فرصتهایی را ایجاد کرده است که شامل دوبله بهتر فیلم و ایجاد محتوای آموزشی غنی است. ولی از طرف دیگر نگرانیهای مربوط به دیپفیکها – تصاویر یا ویدئوهای جعلی دیجیتالی – و حملات مضر امنیت سایبری به کسب و کارها را به دنبال داشت.
هوش مصنوعی مولد چگونه کار میکند؟
هوش مصنوعی مولد با یک درخواست شروع میشود که میتواند به شکل متن، تصویر، ویدئو، طرح، نتهای موسیقی یا هر ورودی قابل پردازش توسط سیستم هوش مصنوعی باشد. پس از آن الگوریتمهای مختلف هوش مصنوعی در پاسخ به درخواست، محتوای جدید را تحویل میدهند.
هوش مصنوعی مولد معمولاً از یادگیری ماشین بدون نظارت یا نیمه نظارت شده برای پردازش مقادیر زیادی دادهها و تولید خروجیهای اصلی استفاده میکند. به عنوان مثال، اگر میخواهید هوش مصنوعی شما بتواند مانند ون گوگ نقاشی کند، باید تا حد امکان آن را با نقاشیهای این هنرمند آشنا کنید.
هوش مصنوعی که در پایه هوش مصنوعی نوع مولد قرار دارد، میتواند خصوصیات یا ویژگیهای سبک هنرمند را بیاموزد و سپس آن را اعمال کند. همین فرآیند برای مدلهایی که متون و حتی کتاب مینویسند، طراحیهای داخلی و طراحی مد انجام میدهند، مناظری که واقعا وجود ندارد را ترسیم میکنند و موسیقی و غیره مینویسند، رخ میدهد.
هوش مصنوعی مولد نه تنها به خودی خود اهمیت دارد، بلکه به این دلیل مهم است که ما را یک قدم به دنیایی نزدیکتر میکند که در آن میتوانیم به جای زبان برنامهنویسی، به زبان طبیعی با رایانهها ارتباط برقرار کنیم.
هوش مصنوعی میتوانند دادههای زیادی را تجزیه و تحلیل کنند. محاسبات را سریع انجام دهند. اما با این حال هوش مصنوعی هنوز نمیتواند در خلاقیت با انسانها رقابت کند.
یکی از اولین نمونههای هوش مصنوعی مولد چت ربات Eliza بود که توسط جوزف وایزنبام در دهه ۱۹۶۰ ایجاد شد. البته این پیادهسازیهای اولیه به دلیل پیروی از رویکرد مبتنی بر قوانین، محدودیت واژگان، اتکای بیش از حد به الگوها و عدم امکان سفارشیسازی با کاستیهایی مواجه بود.
تاریخچه هوش مصنوعی مولد
با کمک این نوع هوش مصنوعی، مدلها چندوجهی میشوند، به این معنی که میتوانند چندین حالت (مانند متن و تصویر) را در یک زمان پردازش کنند. چنین قابلیتی حوزههای کاربردی آنها را گسترش میدهد و موارد استفاده آنها را متنوعتر میکند.
پیشرفت سریع در مدلهای زبانی به اصطلاح بزرگ یا LLMها (مدلهایی با میلیاردها یا حتی تریلیونها پارامتر) عصر جدیدی را گشوده است که در آن مدلهای هوش مصنوعی مولد میتوانند متون جذاب بنویسند، تصاویر واقعی و حتی کمدیهای سرگرمکننده خلق کنند
محتوا را در انواع مختلف رسانه، از جمله متن، گرافیک و ویدئو تولید کنند. این اساس کار ابزارهایی مانند Dall-E است که به طور خودکار تصاویر را از توضیحات متنی ارائه شده ایجاد میکند یا از تصاویر داده شده برای ایجاد زیرنویس متنی کمک میگیرد.