Suite à l’accord avec Google et OpenAI, le PDG de Reddit, Steve Huffman, a déclaré à Microsoft et à d’autres qu’ils devront payer s’ils souhaitent continuer à récupérer les données du site.
« Sans ces accords, nous n’avons pas notre mot à dire ni aucune connaissance sur la manière dont nos données sont affichées et à quoi elles sont utilisées », a déclaré Huffman dans une interview cette semaine, ce qui nous a permis de bloquer ces personnes. « Nous les avons incluses. une position de refus de se mettre d’accord sur la manière dont nous voulons ou ne voulons pas utiliser leurs données. » Il a spécifiquement cité Microsoft, Anthropic et Perplexity pour avoir refusé de négocier, affirmant qu’« il est vraiment très difficile de bloquer ces entreprises ».
Reddit a intensifié sa lutte contre les robots d’exploration ces derniers mois. Début juillet, son fichier robots.txt a été mis à jour pour bloquer les robots d’exploration avec lesquels il n’a aucun accord. Ensuite, les gens ont commencé à remarquer que les résultats de Reddit n’apparaissaient que dans les résultats de Google – où Reddit est payé pour afficher ses données – et non dans d’autres moteurs de recherche comme Bing.
Huffman a déclaré que Microsoft utilisait les données de Reddit pour entraîner son IA et résumer son contenu dans les résultats Bing, « sans nous le dire », et partageait également les données de Reddit avec d’autres moteurs de recherche via l’API Bing. Dans l’interview, il a fait référence aux récents commentaires du PDG de Microsoft AI, Mustafa Suleiman, lors d’une conférence, selon lesquels les données publiques sur Internet sont des « logiciels gratuits ».
« Microsoft, Anthropic et Perplexity se comportent comme si tout le contenu sur Internet était gratuit pour eux », a déclaré Huffman. « C’est leur véritable position. »
En réponse à la récente disparition des résultats Reddit de Bing, le responsable de la recherche de Microsoft, Jordi Ribas, a déclaré : dit le x Que « Reddit a empêché Bing d’explorer son site pour les recherches, donnant ainsi la préférence aux autres moteurs de recherche et nuisant à la concurrence de Bing et des moteurs alimentés par Bing ». La porte-parole de Microsoft, Caitlin Rolston, a déclaré séparément le bord « Nous respectons les instructions données par les sites Web qui ne souhaitent pas que le contenu de leurs pages soit utilisé avec nos modèles d’IA générative », a-t-il déclaré la semaine dernière.
« L’échange de valeurs traditionnel a été remplacé par les moteurs de recherche. »
Huffman a souligné l’annonce récente d’OpenAI concernant SearchGPT, qui sera en mesure de fournir des résultats à Reddit grâce à un accord conclu entre les deux sociétés plus tôt cette année, comme un modèle qu’il souhaite reproduire. Selon le porte-parole Tim Rathschmidt, aucun des accords de licence de contenu conclus par Reddit à ce jour n’incluait de cas d’utilisation spécifiques pour ses données.
En appelant à des accords de licence, Reddit s’associe à des éditeurs de médias plus traditionnels (dont Le bord La société mère, Vox Media, a exigé un paiement pour alimenter son contenu en IA générative. « Je pense que l’échange de valeurs traditionnel a été modifié par les moteurs de recherche », a déclaré Huffman. « La recherche, la synthèse et la formation fusionnent, et l’échange de valeur de l’exploration en échange de trafic est en train de se gâcher. »
Les porte-parole de Microsoft, Anthropic et Perplexity n’avaient fait aucun commentaire au moment de la publication de cette histoire.