rw-book-cover

Metadata

Highlights

  • En el primer día con Deep Research me queda claro que es un paso adelante. Es útil, valioso. Si este año en la inteligencia artificial se quiere dar el paso a los agentes inteligentes, éste es el primero que importa. Algunos días después de estar utilizando con Deep Research han aparecido los “sí, pero”. Le he pedido diez trabajos hasta ahora. Tres me han resultado excelentes. Otros cinco son bastante pasables. Uno es un tanto disparatado, lleno de inventos y alucinaciones. El último resulta discutible: para muchos entraría en los aprobados, pero en mi opinión refleja uno de sus grandes problemas. (View Highlight)
  • Mientras que lo que teníamos hasta ahora era una manera de procesar la búsqueda en internet (rápida, con un resumen superficial), lo que plantea OpenAI se orienta hacia la investigación: un análisis más profundo, más detallado, más trabajado y desarrollado. Deep Research no te devuelve un párrafo o dos, te responde con un documento de 10-15 páginas. Para los que seguimos la evolución técnica de la IA, hay un aspecto especialmente llamativo. La línea de los modelos razonadores que empezó con o1 (explicada más a fondo aquí) había demostrado mejoras en matemáticas, programación y otros dominios técnicos. Deep Research utiliza o3 (de nuevo, en profundidad en este episodio) y demuestra que la técnica empleada (aprendizaje por refuerzo que “busca” en los razonamientos humanos) puede dar buenos resultados en el procesamiento del conocimiento general. Por último, DR tiene varias características de los agentes inteligentes que esperamos para este 2025. Le pedimos un objetivo y elabora un plan paso a paso que ejecuta de manera autónoma hasta lograrlo. (View Highlight)
  • Le planteas el objetivo del análisis. DR te responde con varias preguntas (muy pertinentes siempre) para orientar bien el trabajo. Le respondes y empieza a trabajar durante varios minutos. Es algo transparente sobre lo que está haciendo. Qué fuentes está consultando, qué anda “razonando”. Un espectáculo con los que andamos maravillados con el avance de la IA. Tras varios minutos (en mis experimentos, entre cinco y quince) te devuelve mini ensayos de entre 2900 y 3800 palabras. Me atrevo a decir que la calidad de su primer informe es comparable a la de contar con un buen ayudante de investigación de nivel universitario y enviarle a realizar una tarea durante una semana o dos. Está plagado de citas muy bien integradas en el documento. Consigue conjugar y analizar datos e ideas entre ellas. Da ese paso extra que va del “resumo los textos que me dan” a “razono a partir de un montón de fuentes, ideas y datos”. El primer día con DR te hace arquear la ceja. Más si tu trabajo esencialmente consiste en procesar información, analizarla y conectar elementos dispersos en ella. (View Highlight)
  • Unos cuantos informes después, encontramos los límites a DR. Hay un trabajo que le pido sobre qué profesiones pueden ser completamente automatizadas por el modelo o3 de OpenAI. Se inventa que “verifica documentos de identidad” en una confusión torpe entre sistemas que automatizan y lo que hace esta IA en concreto (View Highlight)
  • No quiero dejar de insistir en lo bueno que es. En los mejores informes que me ha dado, ha superado los “reportajes en profunidad”, los discursos de expertos en la tele y también la investigación que uno podría hacer en temas en los que no es experto. La claridad y la explicación de los temas es sobresaliente. Hay alguna conexión muy interesante entre aspectos distanciados y para nada obvios dentro de los temas. La información era precisa, estaba actualizada e incluía montones y montones de fuentes citadas. Todo en menos de 10 minutos. Ahora bien, en el fondo de la tecnología de Deep Research sigue habiendo un “gran modelo de lenguaje”. Y ahí encontramos el pecado original de la invención, la alucinación, el error. Y es tan bueno que parece que no inventa o alucina, pero lo hace a veces. (View Highlight)
  • Pero hay otros límites. En un informe que le he pedido sobre el impacto de que nuestras vidas y sociedades “sucedan” en lo virtual, en digital, se puede detectar uno importante. Cuando analiza y genera el ensayo a partir de una tesis fuerte (en este caso, una visión muy crítica sobre internet), el resultado que devuelve Deep Research es muy de parte. (View Highlight)
  • No deja de ser, en el fondo, el sesgo más importante que tienen los grandes modelos de lenguaje. Curiosamente, el que menos se señala: el de clase. Hay un segmento ínfimo de la población que escriba y publique. Las ideas de ese grupo están sobrerepresentadas. Ahora una visión reaccionaria respecto a internet domina en medios, universidades y editoriales. Es la que nos va a devolver la IA, por mucho que investigue. Dejo anotada otra limitación. Hay un desequilibrio de calidad en muchos dominios entre lo que está en abierto en internet y lo que está tras muro de pago. Por ejemplo en investigación científica. Eso va a ser un límite al valor que nos puede dar Deep Research. (View Highlight)
  • En la presentación afirman que este agente puede gestionar el “15% de los proyectos de investigación de alto valor económico y el 9% de los de muy alto valor”. Sam Altman lo indicó también, Deep Research puede realizar “un porcentaje de un solo dígito de todas las tareas económicamente valiosas del mundo”. No explican cómo llegan a esta cifra, que creo que hay que tomar con mucha prudencia. Mi punto: al no ser rigurosa siempre, aunque alucine y se equivoque cada vez menos, la IA no es fiable nunca. (View Highlight)
  • Por tanto, aunque me de un informe en apariencia completo y solvente, tendré que repasar los puntos y conclusiones sobre los que vaya a tomar una decisión importante. Una de esas tareas “económicamente más valiosa”. Es decir, aunque a priori se me presente que tengo un investigador de nivel doctorado para mi, la ganancia de productividad no es equivalente: hay que sumar mi tiempo de revisión y supervisión incluso cuando el informe es muy bueno. (View Highlight)
  • Mis pruebas con Deep Research tienen un carácter especial: hasta cierto punto la herramienta se dedica a lo que hago yo. Investigar, leer, analizar, resumir, conectar temas y razonar a partir de todo ello es la base de mis escritos (de los públicos como este post y de mis informes para organizaciones). También de la información que imparto y de las conferencias, del guión y el desarrollo de mis podcasts. Como ciudadano curioso lo veo como un ensayista bajo demanda, que me va a crear una obra sobre cualquier tema que me interese. Ahí me gustaría que me la contara, que se convirtiera en audio y en una conversación (View Highlight)
  • Como analista creo que el sector de la IA ha dado un paso más en la dirección de su plan (automatizar millones de empleos de cuello blanco). Como profesional del conocimiento intento evaluar la situación de una manera dinámica. Ahora mismo Deep Research está empezando a andar tras un muro de 200 dólares. Lo previsible es que se abarate pronto, sea vía la propia OpenAI, sea vía proyectos open source que se vayan acercando al nivel de o3. Siendo así, creo que el valor de un profesional estará más en saber y decidir que hay que saber, que hay que preguntar. (View Highlight)