La formation de l’intelligence artificielle est un processus exigeant et difficile pour de nombreuses raisons. D’une part, cela nécessite beaucoup de temps et d’électricité, mais en même temps d’énormes quantités de données qu’un modèle donné pourra utiliser pour un traitement et un apprentissage appropriés.
Ce dernier élément s’avère extrêmement problématique pour de nombreuses entreprises, les obligeant à recourir à des pratiques illégales. C’est pour cette raison que nous entendons de temps en temps parler d’utilisation de données auxquelles une entreprise donnée n’avait pas droit. Bien entendu, cela suscite l’indignation légitime de nombreuses personnes ordinaires qui souhaitent que les régulateurs mettent fin à cette pratique.
Il s’avère que Microsoft doit désormais faire face à de telles accusations. Les allégations sont très graves et, même si l’entreprise les nie, elles suscitent un dégoût considérable. De quoi s’agit-il exactement ?
Des données bureautiques utilisées pour la formation ?
Selon l’auteur du site Cyberciti.biz, surnommé nixCraft, l’une des fonctions de la suite MS Office pourrait collecter illégalement des données d’utilisateurs pour ensuite les utiliser pour entraîner l’intelligence artificielle. Je parle spécifiquement de l’option Connected Experiences, qui permet à plusieurs utilisateurs de travailler sur des documents en temps réel via Internet. Il s’avère que l’option est activée par défaut.
Cela peut signifier que tous les documents, feuilles de calcul et données qui y sont saisis peuvent potentiellement être traités par le service. Cela conduit à son tour à des situations dans lesquelles Microsoft peut les collecter et les fournir pour une formation en intelligence artificielle, par exemple pour le programme Copilot.
Du point de vue des utilisateurs européens, il est curieux que cette fonctionnalité soit activée par défaut. Cela est en contradiction avec les dispositions du RGPD, qui obligent les fabricants à désactiver les options qui traitent les données des utilisateurs par défaut.
En outre, l’auteur du texte affirme que le fabricant du système d’exploitation Windows n’informe pas suffisamment ses utilisateurs sur les droits dont ils disposent, et encore moins sur les actions entreprises par l’entreprise.
Microsoft nie, mais où est la vérité ?
Pourquoi Microsoft a-t-il besoin de ces données ? En alimentant ses modèles linguistiques, l’entreprise peut garantir la meilleure qualité possible de contenus d’apprentissage, qui sont par ailleurs quasiment illimités. Cela lui confère un énorme avantage sur les solutions concurrentes.
Bien entendu, Microsoft nie fermement cette information et souligne qu’il n’entraîne pas ses modèles sur la base des données des programmes Office ou Microsoft 365. La fonction mentionnée est activée, mais uniquement en raison de la possibilité de co-créer des documents décrite ci-dessus.
Quelle est la vérité au final ? Bien entendu, il est impossible de le dire clairement et il y a peu de chances que Microsoft admette soudainement avoir contourné la loi. En revanche, il n’existe aucune preuve concrète permettant de confirmer la culpabilité et il semble impossible de la prouver.
Cependant, cette situation montre à quel point la question de la vie privée est devenue récemment un problème, notamment lorsqu’il s’agit de formation en IA. Même si Microsoft n’est pas coupable en la matière, d’autres entreprises seront très heureuses d’utiliser nos données et nos réalisations pour former l’IA.
Cela peut-il être évité ? Bien entendu, il suffit de ne pas utiliser de programmes et d’applications d’entreprises spécifiques. Cependant, on se prive alors de certaines fonctionnalités. C’est donc une situation vraiment dans l’impasse…