¿Tienes una página web? Entonces estás entrenando a la IA, te guste o no. ¿Quieres saber cómo evitarlo? Te lo cuento porque en español, #NadieExplicaMejor que EDteam.
La Inteligencia Artificial necesita datos, no importa si mejora su programación o arquitectura. Sin datos nuevos, no mejora.
Por eso hay una carrera loca de las empresas por hacerle scrapping a todos los sitios web, incluso brincándose leyes o términos de uso. Tú sabes, es mejor pedir perdón que pedir permiso. Y por supuesto, si quieres aprender a extraer datos con Web Scraping, puedes hacerlo en EDteam 👉 https://ed.team/cursos/webscraping-python-node
En teoría, editando el archivo robots.txt de tu sitio, bloqueas estos bots.
En teoría, porque lo ignoran descaradamente.
Por eso, Cloudflare dijo "hasta aquí" y lanzó una herramienta gratuita para bloquear estos bots. Con la que tendrás un panel para ver los que estás bloqueando y decidir si quieres permitir a alguno.
Lo mejor es que hay tantos bots de IA que Cloudflare se encargará de actualizar la lista por ti. Algo así como una base de datos de virus, pero de la IA. De locos.
Y prometen que, en el futuro, podrás cobrarle a la IA si quiere usar tus datos. ¿No te parece genial?
Y lo aprendiste en EDteam.