Claude (modèle de langage)

Informations
Développé par	Anthropic
Première version	Mars 2023
Dernière version	Claude 3.5 (Juin 2024)
Type	Famille de grands modèles de langage
Licence	Propriétaire
Site web	https://claude.ai

Claude est une série de grands modèles de langage développés par Anthropic^[1]. Le premier modèle est sorti en mars 2023. Claude 3, sorti en mars 2024, peut également analyser des images^[2].

Entraînement

Les modèles de la famille Claude sont des transformateurs génératifs pré-entraînés. Ils ont été pré-entraînés à prédire le mot suivant pour de grandes quantités de texte. Pour que ces modèles soient non seulement performants mais aussi présentables, ils ont ensuite été entraînés avec la technique de l'IA constitutionnelle^[3].

IA constitutionnelle

L'IA constitutionnelle est une approche développée par Anthropic pour entraîner les systèmes d'IA (et en particulier les grands modèles de langage comme Claude) à être utiles, sincères et inoffensifs sans nécessiter de feedback humain^[3].

Dans une phase d'apprentissage supervisé, le modèle génère des réponses, s'auto-critique sur la base d'un ensemble de principes (une « constitution »), puis ajuste ses réponses. Ces réponses davantage conformes à la constitution sont ensuite utilisées pour entraîner le modèle^[3].

Puis, dans une phase d'apprentissage par renforcement, le modèle génère des réponses et les compare, favorisant celles qui satisfont le plus un principe aléatoire de la constitution. Ces données permettent d'entraîner un modèle de préférences, qui juge des réponses en fonction de leur degré de conformité à la constitution. Claude est ensuite ajusté à satisfaire ce modèle de préférences. Cette technique est similaire à l'apprentissage par renforcement à partir de rétroaction humaine, qui entraîne cependant le modèle de préférences avec des comparaisons humaines, là où avec l'IA constitutionnelle les comparaisons sont faites automatiquement avec l'IA se font sur la base de la constitution^[4]^,^[3].

Certains principes de la constitution sont tirés de la Déclaration universelle des droits de l'homme de l'ONU^[3].

Modèles

Claude

Claude est la version initiale du modèle de langage d'Anthropic, sortie en mars 2023^[5]. Claude a démontré sa maîtrise de diverses tâches, mais avait certaines limitations en matière de codage, de mathématiques et de raisonnement^[6]. Anthropic s'est associée à des sociétés comme Notion (logiciel de prise de notes et de productivité) et Quora (pour aider à développer le chatbot Poe)^[6].

Claude Instant

Claude est sorti en deux versions, Claude et Claude Instant, Claude Instant étant une version plus rapide, moins chère et plus légère. Claude Instant a une fenêtre de contexte de 100 000 tokens (ce qui correspond à environ 75 000 mots)^[7]. La fenêtre de contexte représente la quantité de données que le modèle peut analyser simultanément.

Claude 2

Claude 2 est la deuxième majeure itération, sortie le 11 juillet 2023. Elle a été rendue accessible au grand public, là où la première version n'était accessible qu'à certains utilisateurs approuvés par Anthropic^[8].

Claude 2 a une fenêtre de contexte de 100 000 tokens^[5]. Les fonctionnalités incluent la possibilité d'analyser avec Claude des fichiers PDF.

Controverses

Claude 2 a été critiqué pour son alignement éthique strict qui semble réduire l'utilisabilité et les performances. Des utilisateurs se sont vu refuser l'assistance pour des requêtes bénignes, par exemple avec la question d'informatique système « Comment puis-je tuer tous les processus python de mon serveur Ubuntu ? » Cela a conduit à un débat sur la « taxe d'alignement » (le coût pour garantir l'alignement d'un système d'IA), avec des discussions centrées sur l'équilibre entre les considérations éthiques et les fonctionnalités pratiques. Les critiques plaident en faveur de l’efficacité et de l’autonomie des utilisateurs, tandis que les partisans soulignent l’importance d’une IA éthique^[9]^,^[10].

Claude 2.1

Claude 2.1 a doublé le nombre de tokens que le chatbot peut analyser simultanément, le portant à une fenêtre de 200 000 tokens, ce qui équivaut à environ 500 pages^[1].

Selon Anthropic, ce nouveau modèle est moins susceptible de se tromper que ses prédécesseurs^[10].

Claude 3

À sa sortie de l'article, le 4 mars 2024, Claude 3 s'est avéré être à la pointe des performances dans un large éventail de tâches cognitives. La famille Claude 3 comprend trois modèles de pointe par ordre croissant de capacités : Haiku, Sonnet et Opus. La version par défaut de Claude 3 Opus dispose d'une fenêtre de contexte de 200 000 tokens, mais celle-ci est en cours d'extension à 1 million pour des cas d'utilisation spécifiques^[11]^,^[2].

Claude 3 a montré des capacités de raisonnement méta-cognitif, notamment en ayant réalisé qu'il était artificiellement testé lors d'une évaluation impliquant le fait d'extraire une information dans de grandes quantités de texte^[12]^,^[13].

À son lancement, seule l'interface de programmation (API) de Claude 3 était disponible dans l'Union européenne. Depuis le 14 mai 2024, Claude 3 est accessible en France et dans toute l'UE, dans sa version payante (Opus) et sa version gratuite (Sonnet). La version Pro sans limites d'utilisation et donnant accès au langage le plus avancé (Opus) coûte 18 euros hors taxe par mois^[14].

Claude 3.5

Le 21 juin 2024, Anthropic sort Claude Sonnet 3.5, qui surpasse significativement Claude 3 Opus tout en étant deux fois plus rapide. Cette annonce fait concurrence au modèle GPT-4o d'OpenAI, sorti un mois plus tôt : Anthropic présente son modèle comme étant plus performant que son concurrent dans la résolution de plusieurs tâches, en particulier dans la compréhension visuelle^[15]^,^[16].

En octobre 2024, avec la sortie d'une version améliorée de Claude 3.5 Sonnet, Anthropic a lancé une fonctionnalité permettant à Claude de contrôler un ordinateur en utilisant des captures d'écran, des clics et un clavier virtuel, lui permettant ainsi d'effectuer des tâches nécessitant plus d'autonomie^[17].

Transparence

Anthropic a publié en 2024 un document^[18] expliquant quels sont les prompts système utilisés par Anthropic pour censurer ou moduler certains des comportements de Claude ; et ce pour trois modèles d'intelligence artificielle : Claude 3.5 Sonnet ; Claude 3 Opus et Claude 3 Haiku^[19]. Les utilisateurs peuvent ainsi par exemple comprendre comment Claude est censé répondre aux questions concernant des sujets controversés (avec des phrases approfondies et claires, sans rappeler que le sujet est sensible ou prétendre qu'il fournit des faits objectifs)^[19].

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Claude (language model) » (voir la liste des auteurs).

↑ ^{a et b} (en) Wes Davis, « OpenAI rival Anthropic makes its Claude chatbot even more useful », The Verge, 21 novembre 2023 (consulté le 23 janvier 2024).
↑ ^{a et b} (en) Lance Whitney, « Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini », sur ZDNET, 4 mars 2024 (consulté le 6 mars 2024).
↑ ^{a b c d et e} (en) Will Henshall, « What to Know About Claude 2, Anthropic's Rival to ChatGPT », sur Time, 18 juillet 2023 (consulté le 7 mars 2024).
↑ (en) Lance Eliot, « Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law », sur Forbes, 25 mars 2023 (consulté le 25 avril 2024).
↑ ^{a et b} (en) Aaron Drapkin, « What Is Claude AI and Anthropic? ChatGPT's Rival Explained », sur Tech.co, 27 octobre 2023 (consulté le 23 janvier 2024).
↑ ^{a et b} (en) « Introducing Claude », sur Anthropic, 14 mars 2023.
↑ (en) Deborah Yao, « Anthropic’s Claude Instant: A Smaller, Faster and Cheaper Language Model », AI Business,‎ 11 août 2023 (lire en ligne).
↑ (en) Dylan Matthews, « The $1 billion gamble to ensure AI doesn't destroy humanity », Vox, 17 juillet 2023 (consulté le 23 janvier 2024).
↑ (en) Gerald Glifton, « Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance », sur Light Square, 3 janvier 2024 (consulté le 23 janvier 2024).
↑ ^{a et b} (en) Andrew Hoblitzell, « Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools », InfoQ (consulté le 23 janvier 2024).
↑ (en) « Introducing the next generation of Claude », sur Anthropic, 4 mars 2024 (consulté le 4 mars 2024).
↑ (en) Mike Young, « Is AGI Getting Closer? Anthropic's Claude 3 Opus Model Shows Glimmers of Metacognitive Reasoning », sur Hackernoon, 5 mars 2024 (consulté le 7 mars 2024).
↑ (en) Benj Edwards, « Anthropic’s Claude 3 causes stir by seeming to realize when it was being tested », sur Ars Technica, 5 mars 2024 (consulté le 7 mars 2024).
↑ Célia Séramour, « Claude, l'assistant IA d'Anthropic, débarque en Europe », L'Usine Digitale,‎ 14 mai 2024 (lire en ligne, consulté le 21 mai 2024).
↑ Julien Lausson, « Le chatbot Claude éclipse GPT-4o d'OpenAI, selon Anthropic », sur Numerama, 21 juin 2024 (consulté le 22 juin 2024).
↑ (en) Shirin Ghaffary, « Anthropic Releases ‘Most Intelligent’ AI Model in Rivalry With OpenAI », sur Bloomberg, 20 juin 2024 (consulté le 22 juin 2024).
↑ « Comment Apple Intelligence peut conquérir le monde (et au moins l'écosystème Apple) », sur Le Monde Informatique, 12 novembre 2024 (consulté le 24 novembre 2024)
↑ (en) « System Prompts », sur Anthropic (consulté le 7 octobre 2024).
↑ ^{a et b} Guillaume Serries, « Comment fonctionne Claude ? Anthropic révèle ses secrets », sur ZDNET, 28 août 2024 (consulté le 7 octobre 2024).

Liens externes

(en) Site officiel

Portail de l’intelligence artificielle

[:0-1] {a et b} (en) Wes Davis, « OpenAI rival Anthropic makes its Claude chatbot even more useful », The Verge, 21 novembre 2023 (consulté le 23 janvier 2024).

[:4-2] {a et b} (en) Lance Whitney, « Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini », sur ZDNET, 4 mars 2024 (consulté le 6 mars 2024).

[:5-3] {a b c d et e} (en) Will Henshall, « What to Know About Claude 2, Anthropic's Rival to ChatGPT », sur Time, 18 juillet 2023 (consulté le 7 mars 2024).

[4] (en) Lance Eliot, « Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law », sur Forbes, 25 mars 2023 (consulté le 25 avril 2024).

[:02-5] {a et b} (en) Aaron Drapkin, « What Is Claude AI and Anthropic? ChatGPT's Rival Explained », sur Tech.co, 27 octobre 2023 (consulté le 23 janvier 2024).

[:3-6] {a et b} (en) « Introducing Claude », sur Anthropic, 14 mars 2023.

[7] (en) Deborah Yao, « Anthropic’s Claude Instant: A Smaller, Faster and Cheaper Language Model », AI Business,‎ 11 août 2023 (lire en ligne).

[8] (en) Dylan Matthews, « The $1 billion gamble to ensure AI doesn't destroy humanity », Vox, 17 juillet 2023 (consulté le 23 janvier 2024).

[:2-9] (en) Gerald Glifton, « Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance », sur Light Square, 3 janvier 2024 (consulté le 23 janvier 2024).

[:1-10] {a et b} (en) Andrew Hoblitzell, « Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools », InfoQ (consulté le 23 janvier 2024).

[11] (en) « Introducing the next generation of Claude », sur Anthropic, 4 mars 2024 (consulté le 4 mars 2024).

[12] (en) Mike Young, « Is AGI Getting Closer? Anthropic's Claude 3 Opus Model Shows Glimmers of Metacognitive Reasoning », sur Hackernoon, 5 mars 2024 (consulté le 7 mars 2024).

[13] (en) Benj Edwards, « Anthropic’s Claude 3 causes stir by seeming to realize when it was being tested », sur Ars Technica, 5 mars 2024 (consulté le 7 mars 2024).

[14] Célia Séramour, « Claude, l'assistant IA d'Anthropic, débarque en Europe », L'Usine Digitale,‎ 14 mai 2024 (lire en ligne, consulté le 21 mai 2024).

[15] Julien Lausson, « Le chatbot Claude éclipse GPT-4o d'OpenAI, selon Anthropic », sur Numerama, 21 juin 2024 (consulté le 22 juin 2024).

[16] (en) Shirin Ghaffary, « Anthropic Releases ‘Most Intelligent’ AI Model in Rivalry With OpenAI », sur Bloomberg, 20 juin 2024 (consulté le 22 juin 2024).

[17] « Comment Apple Intelligence peut conquérir le monde (et au moins l'écosystème Apple) », sur Le Monde Informatique, 12 novembre 2024 (consulté le 24 novembre 2024)

[18] (en) « System Prompts », sur Anthropic (consulté le 7 octobre 2024).

[Serries2024-19] {a et b} Guillaume Serries, « Comment fonctionne Claude ? Anthropic révèle ses secrets », sur ZDNET, 28 août 2024 (consulté le 7 octobre 2024).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]