مدل‌های زبانی فارسی همراه اول

مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات در الکامپ 1403 معرفی شدند

مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات در نخستین روز برگزاری نمایشگاه بین المللی الکامپ 1403 معرفی شدند.

گروه MCINext اپراتور همراه اول در اولین روز برگزاری نمایشگاه بین‌المللی الکامپ 1403 با حضور وزیر ارتباطات و فناوری اطلاعات از مدل‌های زبانی توسعه پیدا کرده خود رونمایی کرد. مدل های زبانی فارسی همراه اول شامل سیلک (با 1.3میلیارد پارامتر)، آهوران (با 8 میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) است.

معرفی مدل‌های زبانی فارسی همراه اول

مدل‌های زبانی بزرگ (LLM) به‌عنوان سیستم‌های هوش مصنوعی محسوب می‌شوند که می‌توانند حجم زیادی از داده‌های متنی را مورد تحلیل قرار داده و یاد بگیرند تا مواردی چون تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی را انجام دهند. این مدل‌های زبانی با حمایت مرکز تحقیق و توسعه همراه اول توسعه پیدا کرده است.

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت توسعه پیدا کرده می‌تواند با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را ارائه دهد که با ادامه فرآیند آموزش در آینده قادرند در آینده از لحاظ دانش ارتقا پیدا کنند.

همراه اول، مدل آهوران را بر پایه مدل چند زبانه Llama3 شرکت Meta و به‌شکل آموزش ادامه‌دار (continual pretraining) روی یک مجموعه دادگان فارسی توسعه داده است. مدل پایه آن دارای قابلیت‌های زیادی است و ادامه روند آموزش نیز موجب تقویت تولد متن به زبان فارسی خواهد شد.

از کاربردهای تجاری این مدل‌ها می‌توان به تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات‌ها، تحلیل احساسات و نظرات کاربران در شبکه‌های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان اشاره کرد. این مدل‌ها باعث افزایش بهره‌وری شرکت‌ها، کاهش هزینه‌ها و ارتقای تجربه مشتری نیز خواهند شد.

همراه اول مدل آوا را برای پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده است. دو مدل قبلی برای پاسخگویی به سوالات کلی کاربرد دارند، اما این مدل به ارائه اطلاعات اولیه برای پاسخگویی (RAG) نیاز دارد و در حین آموزش از ارائه اطلاعات استفاده شده خودداری خواهد کرد. این ربات در ربات‌های پاسخگوی خاص کاربرد دارد.

در کنار این‌که این مدل‌ها فرایند آموزش را طی کردند، همراه اول با روش‌های هم‌ترازسازی (RLHF و DPO) توانسته مانع تولید محتوای آسیب‌زا شود. گروه MCINext همراه اول سعی دارد تا مردم نیز بتوانند در آینده نزدیک از این مدل‌ها استفاده کنند.

همچنین بخوانید:
آموزش فعال سازی پشت خطی در گوشی های سامسونگ و شیائومی (ایرانسل و همراه اول) همراه اول از کیوسک های دیجیتال پایش سلامت رونمایی کرد آموزش فعال کردن پیشوازهای خاص (مخاطب در حال مکالمه، عبادت، غمگین)

پاسخ بدهید

وارد کردن نام و ایمیل اجباری است | در سایت ثبت نام کنید یا وارد شوید و بدون وارد کردن مشخصات نظر خود را ثبت کنید *

*