به گزارش دلچسب
دانشگاه هوش مصنوعی محمد بن زاید امارات (MBZUAI) از یک مدل دلایلگر تازه و کمهزینه به نام K2 Think رونمایی کرد. این مدل با همکاری شرکت اماراتی G42 گسترش یافته است؛ به ادعای سازندگان، این مدل با وجود اندازهای زیاد کوچکتر، عملکردی در سطح مدلهای پرچمدار و بزرگ شرکتهای پیشرو همانند OpenAI و DeepSeek اراعه میدهد.
بر پایه گزارش CNBC، شگفتانگیزترین ویژگی K2 Think اندازه آن است. این مدل فقط ۳۲ میلیارد پارامتر دارد که در قیاس با مدل R1 شرکت چینی DeepSeek با ۶۷۱ میلیارد پارامتر زیاد کوچک به نظر میرسد. بااینحال، محققان G42 ادعا میکنند که K2 Think در بنچمارکهای دشوار مرتبط با ریاضیات، کدنویسی و علوم (همانند AIME24 و GPQA-Diamond) عملکردی برابر یا حتی بهتر از رقبای خود داشته است.
«ریچارد مورتون» (Richard Morton)، مدیرعامل مؤسسه مدلهای پایهای در MBZUAI، میگوید: «آنچه ما درحال کشف آن هستیم این است که میتوان با امکانات کمتر، کارهای زیاد بیشتری انجام داد.» یقیناً این مدل برپایه مدل متنباز Qwen 2.5 شرکت علیبابا ساخته شده و بر روی سختافزارهای شرکت Cerebas گسترش و آزمایش شده است.
مدل هوش مصنوعی K2 Think امارات
به حرف های سازندگان، کارکرد بالای K2 Think از طریق ترکیبی از راه حلهای پیشرفته به دست آمده است. این راه حلها شامل تنظیم دقیق نظارتشده با «زنجیره طویل تفکر» (Long Chain-of-Thought) و «مقیاسبندی در زمان تست» (test-time scaling) است که با تخصیص منبع های محاسباتی زیاد تر در لحظه استنتاج، کارکرد را بهبود میدهد.
محققان میگویند: «چیزی که مدل ما را خاص میکند این است که ما با آن زیاد تر همانند یک سیستم حرکت میکنیم تا فقط یک مدل. این یک کار سیستمی است که در آن همه این راه حلها با هم ترکیب خواهد شد و نتیجه نهایی را اراعه خواهند داد.»
گسترشدهندگان K2 Think پافشاری میکنند که هدفشان ساخت یک چتبات دیگر همانند ChatGPT نبوده است. در عوض، این مدل برای کاربردهای خاص در عرصههایی همانند ریاضیات و علوم طراحی شده که به استدلال عمیق نیاز دارند. آنها میگویند با این کاربرد خاص، به جای این که ۱۰۰۰ یا ۲۰۰۰ انسان پنج سال برای فکرکردن درمورد یک سوال خاص یا بازدید یک مجموعه از آزمایشهای بالینی زمان بگذارند، این مدل آن دوره وقتی را به شدت فشرده میکند.
دسته بندی مطالب