Étiquette : LLM

Comment les IA comprennent les mots

Share

Des scientifiques de l’EPFL ont créé un modèle mathématique qui pourrait aider à comprendre en quoi la décomposition du langage en séquences joue un rôle dans le fonctionnement de l’IA moderne, comme les robots conversationnels, et en fait un outil…

Share

Quand l’IA s’aligne sur l’intelligence humaine

Share

Des scientifiques de l’EPFL ont découvert des «unités» dans les grands modèles d’IA qui semblent essentielles pour le langage, reflétant le système de langage du cerveau. Lorsque ces unités spécifiques ont été désactivées, les modèles ont été nettement moins efficaces…

Share

Des petits modèles de langage IA pour plus d’efficacité

Share

Utiliser les compétences des robots conversationnels sur des corpus contrôlés: les «petits modèles de langage», particulièrement fiables et sûrs, pourraient largement se déployer dans les mois à venir. Depuis la diffusion à large échelle par OpenAI de son grand modèle…

Share

Énergivore, l’IA fera-t-elle baisser notre consommation d’énergie?

Share

Une requête ChatGPT est 10 fois plus gourmande en électricité qu’une recherche Google traditionnelle. Toutefois, il reste difficile d’établir le bilan énergétique lié à l’IA générative et son évolution. On le réalise peu, mais l’empreinte carbone du numérique est comparable…

Share

ChatGPT, AlphaCode : si les IA peuvent coder, peuvent-elles créer des IA ?

Share

Des systèmes d’intelligence artificielle sont capables d’écrire des lignes de code et de contrôler un ordinateur. Qu’est-ce qui les empêche de créer d’autres IA ? Leur absence de volonté propre et leur incapacité à s’adapter dynamiquement. Explications. Fin octobre 2024, Anthropic…

Share

Peut-on convaincre une IA de répondre à une requête néfaste?

Share

Une recherche de l’EPFL montre que, malgré un entraînement à la sécurité, les grands modèles de langage (LLM) les plus récents restent vulnérables à de simples manipulations de données qui peuvent les amener à se comporter de manière involontaire ou préjudiciable.…

Share

Les grands modèles de langage perçoivent le sens du temps

Share

Dans une phrase, les grands modèles de langage comme GPT-4 arrivent mieux à prédire les mots à venir que les mots précédents. Cet effet de «flèche du temps» pourrait redéfinir notre compréhension de la structure du langage naturel et la…

Share

New open-source platform allows users to evaluate performance of AI-powered chatbots

Share

Researchers have developed a platform for the interactive evaluation of AI-powered chatbots such as ChatGPT. Anyone using an LLM, for any application, should always pay attention to the output and verify it themselves Albert Jiang A team of computer scientists,…

Share