اپل مدل هوش مصنوعی انقلابی برای تولید کد معرفی کرد: DiffuCode-7B-cpGRPO
اپل با همکاری پلتفرم Hugging Face، یک مدل هوش مصنوعی جدید برای تولید کد به نام DiffuCode-7B-cpGRPO معرفی کرده است. این مدل برخلاف روشهای مرسوم تولید متن ترتیبی، از معماریهای انقلابی استفاده میکند که امکان تولید سریعتر و همزمان بخشهای مختلف کد را فراهم میسازد.
قابلیتهای منحصربهفرد مدل جدید اپل
مدل DiffuCode-7B-cpGRPO بر پایه فناوریهای انتشار ماسکشده (Masked Diffusion) توسعه یافته و از طریق روش coupled-GRPO کیفیت تولید کد را به شکل محسوسی ارتقا داده است. این مدل با سرعت بالا، انسجام ساختاری عالی و عملکرد قابل رقابت با بهترین مدلهای برنامهنویسی متنباز عمل میکند.
پایههای فناوری مدل
اپل این مدل را بر اساس معماری Qwen2.5-7B توسعه داده است. این مدل ابتدا با نام Qwen2.5-Coder-7B برای تولید کد بهینهسازی شده و سپس نسخه اختصاصی اپل بر اساس آن طراحی و بازآموزی شده است.
عملکرد پیشرفته در تولید کد
مدل جدید اپل با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی شده و با بیش از 20 هزار نمونه کدنویسی باکیفیت آموزش دیده است. این فرآیند منجر به بهبود 4.4 درصدی عملکرد مدل در یک مجموعهای معیار برنامهنویسی شده است.
مقایسه با مدلهای مرسوم
برخلاف مدلهای زبانی معمول مانند GPT که از روش خودبازگشتی استفاده میکنند، DiffuCode-7B-cpGRPO از معماری انتشار استفاده میکند که امکان تولید غیرخطی کد و اصلاح موازی ساختار کلی کد را فراهم میسازد – قابلیتی که در برنامهنویسی بسیار ارزشمند است.
چشمانداز آینده
اگرچه هنوز DiffuCoder به سطح مدلهایی مانند GPT-4 یا Gemini نرسیده، اما این حرکت نشاندهنده تلاش اپل برای ورود جدی به عرصه هوش مصنوعی مولد است. این شرکت با روشهای نوآورانه و متفاوت، در حال پایهگذاری نسل بعدی مدلهای زبانی خود است.
