[ad_1]
به گزارش دلچسب
محققان اپل در مقالهای تحقیقاتی خبر از گسترش یک سیستم هوش مصنوعی تازه دادهاند که میتواند دادهها و ورودیهای صفحه نمایش گوشی، بافت یا کانتکست مکالمات و تصاویر را فهمیدن کند. این سیستم تازه میتواند تعامل های طبیعیتر با دستیارهای صوتی همانند سیری را مقدور کند. به ادعای محققان بنچمارکهای این سیستم بهتر از مدل GPT-4 است.
محققان اپل در مقاله خود از سیستم ReALM نام میبرند که از مدلهای زبانی بزرگ برای فهمیدن ارجاعات گوناگون بصری به منظور ربط طبیعیتر با کاربر منفعت گیری میکند. این سیستم میتواند دستیار صوتی سیری را پیشرفته و مفیدتر کند.
محققان اپل میگویند که توانایی فهمیدن پیشعرصه مکالمه و تصاویر برای یک دستیار صوتی الزامی است. برای مثال زمان منفعت گیری از حالت CarPlay دستیار صوتی با تشخیص تصاویری که در پنل نوتیفیکیشن کاربر وجود دارد، میتواند بهتر کارهای او را از طریق فرمانهای صوتی انجام دهد.
هوش مصنوعی ReALM اپل چطور میتواند به گسترش دستیار صوتی پیشرفته پشتیبانی میکند؟
در مقاله محققان اپل، آنها به تفصیل نحوه کارکرد این سیستم را تشریح کردهاند. این سیستم از چندین ورودی و دادههای گوشی و کاربر برای ربط طبیعیتر با او منفعت گیری میکند. اولین مورد، دادههای صفحه نمایش گوشی است؛ به عبارتی، هوش مصنوعی همانچیزی که کاربر میبیند را خواهد دید و فهمیدن خواهد کرد.
دومین مورد، دادههای مکالمه است. در این قسمت، این سیستم باتوجه به مکالمات قبلی کاربر و این چنین اطلاعات گوشی میتواند کارهای او را انجام دهد.
سومین مورد نیز به دادههای دنیای خارج و واقعی مربوط است. برای مثال این سیستم میتواند با شنیدن موسیقی که در محیط پخش است، یا صدای زنگ ساعت، با کاربر ربط مؤثرتری داشته باشد. گفتنی است که پیشتر شایعهای خبر از تجهیز آیفون ۱۶ به میکرفونهای بهبودیافته با نویزگیر بهتر داده می بود، به این علت به گمان زیادً دستیار صوتی اپل یا سیری در آینده در تشخیص صداهای خارجی بهتر عمل خواهد کرد.
اگر اپل بتواند این سیستم را بهدرستی روی سیری پیادهسازی کند، باید انتظار یک دستیار صوتی هوشمند و پیشرفته را داشته باشیم. به ادعای محققان، سیستم ReALM با این که از پارامترهای زیاد کمتری راه اندازی شده است، از LLMهای پیشرفته امروزی همانند GPT-4 بهتر عمل میکند.
دسته بندی مطالب
منبع