Apple présente une nouvelle IA et prétend surpasser GPT-4 : « amélioration majeure par rapport aux systèmes existants »

Apple a dévoilé son dernier système d’intelligence artificielle, Reference Resolution As Language Modeling (ReALM), confirmant qu’il surpasse GPT-4 dans certains aspects, selon un rapport de TechXplore.

Cette image, prise le 25 mars 2024, montre le logo Apple sur un smartphone à Mulhouse, dans l’est de la France.
(Photo : SÉBASTIEN BOZON/AFP via Getty Images)

Apple lance ReALM

Ces dernières années, les grands modèles de langage (LLM) comme GPT-4 ont été à la pointe des progrès technologiques alors que les entreprises cherchent à améliorer leurs offres et à attirer davantage d’utilisateurs.

Cependant, Apple est considéré comme étant à la traîne dans ce domaine, notamment avec l’assistant numérique Siri, qui a peu progressé en termes de capacités d’intelligence artificielle.

L’équipe Apple affirme que leur système ReALM n’est pas simplement une tentative de rattraper ses concurrents ; le système se positionne comme un produit supérieur qui surpasse les LLM existants, notamment dans le traitement de certains types de questions.

Selon un article rédigé par l’équipe Apple, ReALM se distingue en fournissant des réponses plus précises aux questions des utilisateurs en raison de sa capacité unique à interpréter des références ambiguës à l’écran et à accéder à des informations conversationnelles et générales.

En tirant parti des indices contextuels de l’écran de l’utilisateur et des processus en cours sur l’appareil, ReALM vise à mieux comprendre l’intention de l’utilisateur derrière une question, améliorant ainsi la précision de ses réponses.

Lire aussi : Les Apple AirTags ne sont pas compatibles avec les téléphones Android, mais cette application de suivi peut les détecter

Apple affirme que ReALM surpasse GPT-4

Les chercheurs affirment que des tests approfondis sur divers LLM, dont GPT-4, ont démontré les performances supérieures de ReALM dans certaines tâches.

Ils suggèrent en outre qu’Apple envisage d’intégrer ReALM dans son écosystème, améliorant potentiellement la capacité de Siri à fournir des réponses plus pertinentes, même si cela pourrait obliger les utilisateurs à mettre à jour vers iOS 18 lors de sa sortie plus tard cette année.

Les chercheurs soulignent l’importance de la résolution de référence pour comprendre et gérer efficacement divers contextes dans leur article, y compris les éléments conversationnels et non conversationnels tels que les entités à l’écran et les processus en arrière-plan.

Ils soulignent le potentiel de transformation du LLM dans la résolution de références de différents types, présentant des améliorations substantielles par rapport aux systèmes existants dans différentes catégories de référence.

Les conclusions de l’article montrent des résultats prometteurs, le plus petit modèle de ReALM atteignant des performances comparables à celles de GPT-4 et son plus grand modèle les dépassant largement.

Cela suggère que ReALM pourrait représenter une avancée importante dans la technologie de l’IA, en particulier dans le domaine de la résolution de référence, où le LLM traditionnel est confronté à des limites.

« Cet article montre comment LLM peut être utilisé pour créer un système très efficace pour résoudre des références de différents types, en montrant comment la complétion des références peut être transformée en un problème de modélisation du langage, même s’il implique des formes d’entités telles que celles à l’écran qui ne sont traditionnellement pas propices à être réduits à un simple texte de modalités », ont écrit les chercheurs.

« Nous démontrons de grandes améliorations par rapport aux systèmes existants avec des fonctionnalités similaires sur plusieurs types de références, avec le plus petit modèle, nous obtenons une amélioration absolue de plus de 5 % pour les références à l’écran. Nous nous comparons également à GPT-3.5 et GPT-4, avec le plus petit modèle, nous avons atteint des performances comparables à celles du GPT-4, et notre modèle plus grand est de loin supérieur. »

Équipe de recherche détaillé leurs découvertes sur le serveur de préimpression arXiv.

Articles connexes : Apple Vision Pro : de nouveaux films immersifs désormais disponibles gratuitement dans l’application TV, avec audio spatial

Souligner

ⓒ 2024 TECHTIMES.com Tous droits réservés. La reproduction sans autorisation est interdite.

Lancelot Bonnay

"Érudit primé au bacon. Organisateur. Fanatique dévoué des médias sociaux. Passionné de café hardcore."

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *