La batalla por los datos continúa: OpenAI firma con Reddit
17 de Mayo de 2024 in Noticias de IA by Alejandro García
Mientras tanto, la batalla por los datos continúa. Ya he mencionado que la apertura de GPT-4 para todos es, ante todo, una caza de nuevos datos, datos para el entrenamiento. Los usuarios van a alimentar la inteligencia artificial con sus incansables prompts, imágenes, videos y diálogos.
Recientemente se informó que OpenAI se asoció con StackOverflow, un acuerdo beneficioso para ellos, ya que el tráfico en su sitio ha caído un 47% con la llegada de la IA que escribe código. Sin embargo, al igual que los artistas, algunos programadores humanos exclamaron: "¿Por qué esta estúpida IA se está entrenando con nuestro código? No aceptamos esto". Y empezaron a estropear su código en sus cuentas. En resumen, lo mismo de siempre.
Ahora, OpenAI ha firmado un acuerdo con Reddit. Al fin y al cabo, todo comenzó con Reddit, ya que sus primeros modelos GPT se entrenaron (extraoficialmente) con datos de Reddit. Reddit es un verdadero Klondike de datos: comunicación humana pura y sin censura.
Los datos son el nuevo petróleo, una frase ya tan usada que causa tedio, pero sigue siendo un hecho. Y son una fuente de grandes ingresos. ¿Quién habría pensado que todas esas tonterías que publicamos en la red, todas esas imágenes narcisistas y comentarios tontos serían tan valiosos en el mercado en 2024?
Actualización: Mientras tanto, Elon Musk ha llegado a 4Chan y se ha suscrito para usar todo ese caos en Grok.