چینی‌ها تنها در عرض 2 ماه، رقیب قدرتمند چت GPT را خلق کردند

0 ارسال شده توسط: علیرضا نوریان 07 بهمن 1403 ساعت 09:47

محققان چینی‌ موفق شدند رقیب قدرتمند هوش مصنوعی چت GPT به‌نام DeepSeek را در مدت 2 ماه بسازند آن را به‌صورت رایگان در اختیار کاربران بگذارند.

یک آزمایشگاه هوش مصنوعی مستقر در چین به نام DeepSeek، مدل زبانی بزرگ و متن‌باز خود را با عنوان DeepSeek-V3 عرضه کرده است. این مدل که در مدت زمان کوتاه 2 ماهه و با صرف بودجه‌ای معادل 5.58 میلیون دلار توسعه یافته، به عنوان یک رقیب مقرون‌به‌صرفه اما قدرتمند چت GPT، محصول شرکت OpenAI، مطرح شده است. این اتفاق، نه تنها دانشمندان حوزه هوش مصنوعی را به هیجان آورده، بلکه نگرانی‌های جدی را در میان شرکت‌های فناوری سیلیکون ولی ایجاد کرده است.

رقیب قدرتمند چت GPT از راه رسید

مدل DeepSeek-V3 توانسته عملکردی در حد GPT-4o شرکت OpenAI و Claude Sonnet 3.5 شرکت آنتروپیک داشته باشد و در برخی کارها مثل حل مسئله، برنامه‌نویسی و محاسبات ریاضی، از مدل‌هایی مانند Llama 3.1 شرکت متا و Qwen2.5 شرکت علی‌بابا عملکرد بهتری داشت.

البته ماجرا به همین‌جا ختم نمی‌شود. مدلی حتی پیشرفته‌تر با نام DeepSeek-R1 روز دوشنبه (20 ژانویه) رونمایی شد. R1 نیز در بسیاری از این آزمون‌ها از مدل o1 جدید ChatGPT پیشی گرفته است. این در حالیست که هزینه‌های آموزش و اجرای آن بسیار کمتر از سایر مدل‌ها بوده و بخش‌هایی از کد آن به صورت متن‌باز در دسترس عموم قرار گرفته است. علاوه بر این، برای آموزش این مدل از تعداد بسیار کمتری واحد پردازش گرافیکی (GPU) استفاده شده است. این پیشرفت، متخصصان هوش مصنوعی را شگفت‌زده کرده و احتمال سبقت گرفتن مدل‌های هوش مصنوعی چینی از رقبای آمریکایی را تقویت کرده است.

ساتیا نادلا، مدیرعامل مایکروسافت و یکی از شرکای کلیدی OpenAI، در نشست جهانی اقتصاد در داووس سوئیس در 22 ژانویه، بر اهمیت توجه جدی به تحولات چین در حوزه هوش مصنوعی تأکید کرد.

مدل‌های استدلالی مانند R1 و o1، نسخه ارتقایافته LLM‌های استاندارد هستند که با استفاده از تکنیکی به نام «زنجیره تفکر»، توانایی ارزیابی مجدد استدلال‌های خود را دارند. به عبارت دیگر، این مدل‌ها می‌توانند به عقب برگشته و منطق خود را بررسی کنند تا به نتایج دقیق‌تری دست پیدا کنند. این ویژگی باعث شده است که مدل‌های استدلالی در میان محققان و مهندسینی که به دنبال کاربرد هوش مصنوعی در کار خود هستند، بسیار محبوب شوند.

برخلاف مدل زبانی بسته O1 چت GPT، مدل DeepSeek یک مدل متن‌باز است و با وجود اینکه داده‌های آموزشی آن همچنان اختصاصی هستند، اما این مدل به کاربران اجازه می‌دهد تا به درون الگوریتم آن دسترسی پیدا کرده و تغییراتی در آن اعمال کنند. علاوه بر این مزیت، هزینه استفاده از DeepSeek به طور قابل توجهی کمتر از O1 بوده و حدود 27 برابر ارزان‌تر است. بودجه توسعه این مدل به مراتب کمتر از ده‌ها یا حتی صدها میلیون دلاری است که رقبا برای آموزش مدل‌های خود هزینه کرده‌اند.

از طرفی، محدودیت‌های صادراتی ایالات متحده که دسترسی شرکت‌های چینی به تراشه‌های محاسباتی هوش مصنوعی را محدود کرده، باعث شده تا توسعه‌دهندگان DeepSeek با بهره‌گیری از الگوریتم‌های هوشمندتر و کارآمدتر، کمبود قدرت محاسباتی را جبران کنند. مهندسان DeepSeek ادعا می‌کنند که با استفاده از تنها 2000 پردازنده گرافیکی انویدیا، به نتایج مشابهی دست یافته‌اند که ChatGPT برای پردازش داده‌های آموزشی خود به حدود 10000 عدد از این پردازنده‌ها نیاز داشت.

با این حال، هنوز مشخص نیست که این دستاوردها تا چه اندازه به کاربردهای عملی منجر خواهد شد و آیا DeepSeek صرفاً برای کسب امتیاز در آزمون‌های مقایسه‌ای بهینه شده است یا خیر. جامعه علمی و سرمایه‌گذاران حوزه هوش مصنوعی با دقت این موضوع را دنبال می‌کنند.

در گجت نيوز بخوانيد:

آیا هوش مصنوعی Gemini Advanced در گوشی‌های گلکسی اس ۲۵ سامسونگ رایگان است؟ با این اپلیکیشن هوش مصنوعی زمان مرگ خود را محاسبه کنید! هوش مصنوعی طول عمر انسان را دو برابر می‌کند

گجت نیوز آخرین اخبار تکنولوژی، علم و خودرو

چینی‌ها تنها در عرض 2 ماه، رقیب قدرتمند چت GPT را خلق کردند

رقیب قدرتمند چت GPT از راه رسید

پاسخ بدهید لغو پاسخ