Des scientifiques de l’EPFL ont créé un modèle mathématique qui pourrait aider à comprendre en quoi la décomposition du langage en séquences joue un rôle dans le fonctionnement de l’IA moderne, comme les robots conversationnels, et en fait un outil…
Des scientifiques de l’EPFL ont découvert des «unités» dans les grands modèles d’IA qui semblent essentielles pour le langage, reflétant le système de langage du cerveau. Lorsque ces unités spécifiques ont été désactivées, les modèles ont été nettement moins efficaces…
by S & T • • Commentaires fermés sur Des petits modèles de langage IA pour plus d’efficacité
Utiliser les compétences des robots conversationnels sur des corpus contrôlés: les «petits modèles de langage», particulièrement fiables et sûrs, pourraient largement se déployer dans les mois à venir. Depuis la diffusion à large échelle par OpenAI de son grand modèle…
by S & T • • Commentaires fermés sur Énergivore, l’IA fera-t-elle baisser notre consommation d’énergie?
Une requête ChatGPT est 10 fois plus gourmande en électricité qu’une recherche Google traditionnelle. Toutefois, il reste difficile d’établir le bilan énergétique lié à l’IA générative et son évolution. On le réalise peu, mais l’empreinte carbone du numérique est comparable…
by S & T • • Commentaires fermés sur ChatGPT, AlphaCode : si les IA peuvent coder, peuvent-elles créer des IA ?
Des systèmes d’intelligence artificielle sont capables d’écrire des lignes de code et de contrôler un ordinateur. Qu’est-ce qui les empêche de créer d’autres IA ? Leur absence de volonté propre et leur incapacité à s’adapter dynamiquement. Explications. Fin octobre 2024, Anthropic…
by S & T • • Commentaires fermés sur Peut-on convaincre une IA de répondre à une requête néfaste?
Une recherche de l’EPFL montre que, malgré un entraînement à la sécurité, les grands modèles de langage (LLM) les plus récents restent vulnérables à de simples manipulations de données qui peuvent les amener à se comporter de manière involontaire ou préjudiciable.…
by S & T • • Commentaires fermés sur Les grands modèles de langage perçoivent le sens du temps
Dans une phrase, les grands modèles de langage comme GPT-4 arrivent mieux à prédire les mots à venir que les mots précédents. Cet effet de «flèche du temps» pourrait redéfinir notre compréhension de la structure du langage naturel et la…
by S & T • • Commentaires fermés sur New open-source platform allows users to evaluate performance of AI-powered chatbots
Researchers have developed a platform for the interactive evaluation of AI-powered chatbots such as ChatGPT. Anyone using an LLM, for any application, should always pay attention to the output and verify it themselves Albert Jiang A team of computer scientists,…