مدلهای زبانی فارسی همراه اول با حضور وزیر ارتباطات در نخستین روز برگزاری نمایشگاه بین المللی الکامپ 1403 معرفی شدند.
گروه MCINext اپراتور همراه اول در اولین روز برگزاری نمایشگاه بینالمللی الکامپ 1403 با حضور وزیر ارتباطات و فناوری اطلاعات از مدلهای زبانی توسعه پیدا کرده خود رونمایی کرد. مدل های زبانی فارسی همراه اول شامل سیلک (با 1.3میلیارد پارامتر)، آهوران (با 8 میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) است.
معرفی مدلهای زبانی فارسی همراه اول
مدلهای زبانی بزرگ (LLM) بهعنوان سیستمهای هوش مصنوعی محسوب میشوند که میتوانند حجم زیادی از دادههای متنی را مورد تحلیل قرار داده و یاد بگیرند تا مواردی چون تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی را انجام دهند. این مدلهای زبانی با حمایت مرکز تحقیق و توسعه همراه اول توسعه پیدا کرده است.
مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت توسعه پیدا کرده میتواند با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را ارائه دهد که با ادامه فرآیند آموزش در آینده قادرند در آینده از لحاظ دانش ارتقا پیدا کنند.
همراه اول، مدل آهوران را بر پایه مدل چند زبانه Llama3 شرکت Meta و بهشکل آموزش ادامهدار (continual pretraining) روی یک مجموعه دادگان فارسی توسعه داده است. مدل پایه آن دارای قابلیتهای زیادی است و ادامه روند آموزش نیز موجب تقویت تولد متن به زبان فارسی خواهد شد.
از کاربردهای تجاری این مدلها میتوان به تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت باتها، تحلیل احساسات و نظرات کاربران در شبکههای اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان اشاره کرد. این مدلها باعث افزایش بهرهوری شرکتها، کاهش هزینهها و ارتقای تجربه مشتری نیز خواهند شد.
همراه اول مدل آوا را برای پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده است. دو مدل قبلی برای پاسخگویی به سوالات کلی کاربرد دارند، اما این مدل به ارائه اطلاعات اولیه برای پاسخگویی (RAG) نیاز دارد و در حین آموزش از ارائه اطلاعات استفاده شده خودداری خواهد کرد. این ربات در رباتهای پاسخگوی خاص کاربرد دارد.
در کنار اینکه این مدلها فرایند آموزش را طی کردند، همراه اول با روشهای همترازسازی (RLHF و DPO) توانسته مانع تولید محتوای آسیبزا شود. گروه MCINext همراه اول سعی دارد تا مردم نیز بتوانند در آینده نزدیک از این مدلها استفاده کنند.