Está entrenando a la IA gratis - Y ni siquiera le da las gracias

Está entrenando a la IA de forma gratuita con cada solicitud. Imagen de un robot humanoide genérico. (Fuente de la imagen: Vjulien Tromeur - Unsplash)

Usted está entrenando a la IA de forma gratuita con cada consulta, clic y CAPTCHA. Así es como la retroalimentación humana está alimentando modelos de miles de millones de dólares... sin un gracias.

Darryl Linington, 👁 Notebookcheck (traducido por Ninh Duy), Publicado 07/22/2025 🇺🇸 🇵🇹 ...

AI Opinion / Kommentar

Opinión por Darryl Linington

Los puntos de vista, pensamientos y opiniones expresados en el texto pertenecen exclusivamente al autor.

¿Alguna vez ha tenido la sensación de que sus agujeros de conejo nocturnos en ChatGPT están haciendo más por Silicon Valley que su propia productividad impulsada por el insomnio? Eso es porque lo están haciendo. Si está utilizando herramientas de IA gratuitas, enhorabuena, ha sido reclutado para formar parte de una fuerza laboral global no remunerada, y nadie se ha molestado siquiera en darle una taza de cortesía.

Cómo funciona realmente (sí, usted forma parte de ello)

Corramos la cortina. La mayoría de los chatbots de IA gratuitos, como ChatGPT, Claude y Gemini, funcionan con modelos que mejoran con algo llamado Aprendizaje por Refuerzo a partir de la Retroalimentación Humana (RLHF). Suena complicado, pero ésta es la versión sencilla:

Usted hace una pregunta. La IA responde. Usted la valora con un pulgar hacia arriba o hacia abajo. Quizá prefiera una respuesta a otra. Felicidades... acaba de entrenar al modelo. Sus preferencias se registran y se crujen y, con el tiempo, el modelo se ajusta para ser más "útil"

Estas herramientas no sólo viven en la nube para divertirse. Aprenden de usted. De hecho, usted no sólo chatea; es un anotador de datos muy asequible (léase: no remunerado).

Sí, incluso los usuarios de pago ayudan a entrenar a los robots

¿Cree que se ha librado del molino de datos pagando por GPT-4? Piénselo de nuevo. A menos que haya optado explícitamente por no participar en la configuración de ChatGPT, sus interacciones se siguen utilizando para afinar el comportamiento de la IA. Así es. Está pagando 20 dólares al mes para contribuir al desarrollo del producto. A escala. Sin derechos de autor. Buen truco, ¿verdad?

OpenAI, por ejemplo, utiliza conversaciones de usuarios gratuitos y de pago para mejorar sus modelos, a menos que desactive el "historial de chat" ¿Géminis de Google? El mismo trato. ¿Claude de Anthropic? También recoge preferencias para mejorar sus modelos de alineación.

RLHF no es sólo magia tecnológica... Es una cinta transportadora humana

Detrás de cada acrónimo que suena extravagante como RLHF hay un proceso muy real y muy humano. Se contrata a contratistas para que clasifiquen las respuestas, señalen las alucinaciones y clasifiquen las indicaciones.

Empresas como Sama (vinculada en su día a OpenAI), Surge AI y Scale AI proporcionan esta mano de obra, a menudo a través de contratistas mal pagados que trabajan muchas horas, muchos en países en desarrollo. En 2023, los informes confirmaron que los etiquetadores de RLHF ganaban entre 2 y 15 dólares la hora, según la región y la función. Así que, sí, personas reales están pulsando "esta respuesta es mejor" una y otra vez. Y es ese bucle de retroalimentación el que alimenta a los robots.

Si usted está proporcionando el mismo tipo de retroalimentación a través de los pulgares hacia arriba, básicamente está haciendo una mini versión de su trabajo... gratis.

Cómo se utiliza esa retroalimentación

Aquí es donde se pone interesante. Su retroalimentación no entrena directamente al modelo principal. Alimenta a los modelos de recompensa, sistemas más pequeños que le dicen a la IA principal cómo comportarse. Así que cuando usted dice: "Me gusta más esta respuesta", está ayudando a construir la brújula interna que sigue el modelo principal. Una vez que suficientes personas lo hacen, la IA empieza a sentirse más humana, más educada, más servicial... o más como un columnista con problemas de límites.

¿Y su estilo de escritura?

La IA recuerda el tono. Cuando usted interactúa constantemente con ella en un estilo determinado -sarcástico, académico o brutalmente contundente-, el sistema aprende a responder del mismo modo. No está robando su voz de escritor y vendiéndosela a otros (todavía), pero sus patrones ayudan a formar parte de la experiencia colectiva de entrenamiento, especialmente si el robot ve que a otros les gusta su fraseo o su tono.

Se trata menos de clonarle a usted y más de replicar lo que funciona. Y lo que funciona a menudo proviene de alguien que nunca dio su consentimiento para replicar el estilo.

CAPTCHA ya no es sólo para bots

Ah, ¿y esos rompecabezas CAPTCHA que resuelve para demostrar que es humano? No sólo está pulsando semáforos y pasos de peatones para entrar en su correo electrónico. Está etiquetando datos para modelos de aprendizaje automático. Los reCAPTCHA de Google, los hCaptcha y los Turnstile de Cloudflare alimentan con datos visuales los canales de formación, ayudando a las IA a ver el mundo de una señal de tráfico borrosa cada vez.

Así que sí, incluso su verificación de seguridad forma parte ahora de la economía de la retroalimentación.

Miles de millones en valor... Cero reconocimiento

No se trata de una conspiración marginal. El mercado de los datos de formación está en auge. Según MarketsandMarkets, se prevé que el tamaño del mercado mundial de datos de entrenamiento crezca de 1.500 millones de dólares en 2023 a más de 4.600 millones en 2030. Y aunque eso incluye datos sintéticos y conjuntos de datos curados, el valor de los datos del mundo real etiquetados por humanos, es decir, los que usted proporciona casualmente cada día, está subiendo.

Sin embargo, la mayoría de los usuarios siguen pensando que su conversación con el chatbot desaparece en el éter. Spoiler: no es así. No a menos que haya desactivado explícitamente el registro (e incluso entonces... confíe, pero verifique).

Reflexión final: No está paranoico... sólo está implicado

Aquí está el truco. Usted es parte de la construcción de la misma cosa que eventualmente podría reemplazar su trabajo, superar su creatividad, o convertir sus tweets en muestras de productos. Eso no significa que deba dejar de utilizar la IA, pero debe saber a qué está contribuyendo. Y quizá, sólo quizá, pida un poco de transparencia a cambio.

Al fin y al cabo, si su trabajo gratuito es lo suficientemente bueno como para dar forma a la próxima generación de modelos de IA multimillonarios, lo menos que podrían hacer es darle las gracias.