یکی از سوالاتی که با پیشرفت ربات ChatGPT در ذهن کاربران شکل گرفته، این است که آیا هوش مصنوعی چت جی پی تی میتواند آینده را هم پیشبینی کند؟
برنامههای هوش مصنوعی مولد امروزی مانند چت جی پی تی، دیگر تنها به تولید متن محدود نیستند و به سرعت در حال گسترش قابلیتهای خود هستند. یکی از حوزههای مهمی که سازندگان هوش مصنوعی به دنبال آن هستند، تجزیه و تحلیل دادههای سری زمانی است که شامل اندازهگیری متغیرها در طول زمان برای شناسایی روندها است. دادههای سری زمانی در کاربردهای مختلف مانند ردیابی تاریخچه پزشکی بیمار یا پیشبینی رویدادهای آینده بر اساس دادههای تاریخی، نقش مهمی را ایفا میکنند.
به طور سنتی، برای تجزیه و تحلیل دادههای سری زمانی از نرمافزارهای تخصصی استفاده میشود. با این حال، هوش مصنوعی مولد اکنون افزون بر قابلیتهای خود در مقاله نویسی، تولید تصویر و کدنویسی، توانایی خود در مدیریت دادههای سری زمانی را نیز نشان داده است.
طبق مطالعه اخیر نیت گروور و همکارانش از دانشگاه نیویورک، این قابلیت با استفاده از برنامه GPT-3 شرکت اوپن ایآی بررسی شد. آنها موتور GPT-3 را برای پیشبینی آینده (رویداد بعدی) در یک سری زمانی، مشابه پیشبینی کلمه بعدی در یک جمله، آموزش دادند. این رویکرد از توانایی مدلهای زبان برای نشان دادن توزیعهای احتمال پیچیده روی توالیها استفاده میکند و آنها را برای مدلسازی سری زمانی مناسب میسازد.
برنامه به دست آمده که LLMTime نام دارد، کارکرد بسیار ساده ای دارد و میتواند بدون نیاز به تنظیم دقیق دادههای خاص، از روشهای سری زمانی ساخته شده در طیف وسیعی از مشکلات بهتر عمل کند. برای رسیدن به این هدف، محققان روش توکنسازی که مدلهای زبان بزرگ از آن طریق دادهها را مدیریت میکنند را مجددا بازسازی کردند. برخلاف توکنسازی سنتی که کلمات و کاراکترها را تجزیه میکند، LLMTime فضای خالی بین هر رقم را در یک دنباله درج میکند تا از مدیریت دقیق دادههای سری زمانی اطمینان حاصل کند.
سپس محققان، هوش مصنوعی چت جی پی تی را برای پیشبینی دنباله رقم بعدی در نمونههای سری زمانی دنیای واقعی آموزش دادند. یک سری زمانی اساساً دنبالهای از رویدادها است که مانند یک روایت، به ترتیب زمانی رخ میدهند. نمونهای از این دادهها، پیشبینی برداشتهای خودپرداز بر اساس سوابق تراکنشهای تاریخی است.
پیشبینی برداشت از دستگاههای خودپرداز مانند پیشبینی شبکه عصبی مصنوعی و هوش محاسباتی یک چالش سخت است. دادههای این کار به صورت رشتههایی از اعداد ارائه میشوند که هر ورودی نشاندهنده یک زمان خاص و مقادیر مرتبط است. جالب آنکه، مدل LLMTime توانایی تولید پیشبینیهای قابل قبول برای دادههای سری زمانی واقعی و مصنوعی را نشان داده که حاکی از عملکرد بهتر آن در مقایسه با مدلهای سری زمانی اختصاصی است.
با این حال، مدلهای زبان بزرگ مانند GPT-3 دارای محدودیتهایی هستند که عمده آنها مربوط به مقدار دادههایی است که میتوانند همزمان پردازش کنند. برای رسیدگی به دادههای سری زمانی گستردهتر، تحقیقات برای گسترش آن به رهبری تیمهایی مانند Hyena در دانشگاه استنفورد و موسسه هوش مصنوعی MILA در کانادا با همکاری مایکروسافت ادامه دارد.
چرا هوش مصنوعی چت جی پی تی در پیش بینی اعداد مهارت دارد؟
محققان در جواب این سوال معتقدند که این مدلها سادهترین قوانین را در میان بسیاری از قوانین بالقوه که میتوانند دنبالهای از اعداد را توضیح دهند، شناسایی میکنند. این نوع سادهسازی به آنها اجازه میدهد تا به طور موثر و دقیق پیشبینی کنند.
علیرغم قدرت پیشبینی آنها، توجه به این نکته مهم است که این مدلها مکانیزمهای اساسی پشت دادهها را بهطور مفهومی درک نمیکنند. در آزمایشی با استفاده از GPT-4 که آخرین نسل از هوش مصنوعی چت جی پی تی محسوب میشود، مدل برای استنباط تابع ریاضی که یک سری زمانی خاص را تولید میکند، تلاش کرد. اگرچه عملکرد آن از حالت تصادفی بهتر بود، اما گاهی اوقات توضیحات نادرستی را ارائه میداد.
بهطور کلی، تجزیه و تحلیل سریهای زمانی در حال تبدیل شدن به بخشی از آینده چندوجهی هوش مصنوعی مولد است. این ادغام پتانسیل یکپارچه سازی قابلیتهای مختلف را در یک مدل واحد و قدرتمند ارائه میدهد و اجازه میدهد دانش در وظایف و روشها به جریان بیفتد.