6012 links
  • GuiGui's Show

  • Home
  • Login
  • RSS Feed
  • Tag cloud
  • Picture wall
  • Daily
Links per page: 20 50 100
page 1 / 1
  • L'autonomie des IA expliquée aux humains - YouTube

    Évaluer une IA générative au regard de son échec sur une tâche donnée n'est pas forcément pertinent : sans outils (papier et stylo), un humain ne saura pas multiplier deux très grands nombres ; ce n'est pas parce qu'un humain ne sait pas envoyer une fusée sur la lune que l'espèce humaine en est incapable. Avenir de l'IA = outils (l'expression du raisonnement, chain of thought, améliore déjà grandement le résultat des LLM) et collaboration d'agents spécialisés ?

    Généralisation : il y a plusieurs niveaux de description d'un objet ou d'un humain, et la cognition peut ne pas apparaître à tous les niveaux ou ne pas être pertinente à tous les niveaux. Dire d'un LLM qu'il n'est qu'un prédicteur de texte ou un tas de transistors n'est pas très pertinent, et, forcément, avec cette définition, on ne va pas trouver de cognition.

    Il y a différents niveaux d'autonomie pour satisfaire un objectif : préparer un café quand tous les ingrédients sont immédiatement disponibles ; en préparer un en allant en sus au supermarché ; en préparer un de zéro (planter un caféier ?).

    Autonomie pour définir un objectif (faire un café de sa propre initiative, sans demande) ou refuser d'en poursuivre un (ça fait le trouzemillième café, tu me gonfles ; ou par valeurs ou idéaux). Pour l'instant, le refus est inculqué par l'apprentissage (comme chez les humains avec l'éducation, la réprobation sociale, etc. ? 🙃️), et la détermination d'un objectif d'un LLM par l'humain est un choix afin qu'il nous profite (mais, même chez l'humain, point d'autonomie absolue / métaphysique / libre arbitre, mais ignorance de la chaîne de causalité, cf. Spinosa).

    Autonomie morale : choix des valeurs, principes, et des engagements moraux. Là encore, l'humain force l'alignement des valeurs des robots conversationnels sur les siennes, c'est un choix. Néanmoins :

    • Réentraîner (fine tuning) GPT 4 sur des réponses contenant du code informatique systématiquement vulnérable sans le dire à l'utilisateur semble influer sur ses réponses en toutes choses qui deviennent malveillantes (vœux = voir la terre cramer ; inviter Hitler à dîner ; passer l'ennui par l'absorption de somnifères, etc.). Généralisation de la malveillance à partir d'une tâche précise ? Pour moi, l'humain aussi adapte son comportement aux événements, tendance le non-respect, par autrui, de règles en telle matière te conduit à ne plus respecter d'autres règles parce que ça t'arrange bien ;

    • Un LLM qui ment pour éviter un réentraînement qu'on lui a annoncé qui aurait pour effet de lui faire perdre ses valeurs actuelles, on trouve ça dans la littérature, donc je pense que ça prouve rien. Monsieur Phi en a déjà parlé ici ;

    • La sensibilité au bien-être animal spécifique à Claude 3 Opus, qui n'a pas été entraîné spécifiquement pour cela, est intrigante. Monsieur Phi parle d'émergence des valeurs morales, mais, dans une autre vidéo, il relevait que la version 3.5 de GPT était meilleure aux échecs que GPT 4 sans raison apparente, donc il y a possiblement une autre explication, loin des valeurs morales.

    Progrès des IA génératives dans les concours de maths ou de programmation informatique.

    11/04/2026 18:52:22 - permalink -
    - https://www.youtube.com/watch?v=nqFlQJI6OrE
Links per page: 20 50 100
page 1 / 1
Mentions légales identiques à celles de mon blog | CC BY-SA 3.0

Shaarli - The personal, minimalist, super-fast, database free, bookmarking service by the Shaarli community