Mayo 2025
Número 10


Red Educativa Digital Descartes
Córdoba (España)
descartes@proyectodescartes.org
https://proyectodescartes.org

Boletín Novedades IA Generativas
https://proyectodescartes.org/descartescms/boletin-ia






Esta obra está bajo una licencia Creative Commons 4.0 internacional: Reconocimiento-No Comercial-Compartir Igual.

CONTENIDO


CONTENIDO

🌸🤖 IAGen Día de la Madre: Novedades Humanas en la IA Generativa 💐✨

Mayo es un mes que invita a la reflexión y al homenaje. En muchos países del mundo, se celebra el Día de la Madre, una fecha cargada de afecto, gratitud y reconocimiento hacia quienes nos dieron la vida y nos enseñaron a comprenderla. En este espíritu de celebración, presentamos nuestro boletín de Novedades en Inteligencia Artificial Generativa, con una temática dedicada a las madres y su influencia en nuestra forma de aprender, crear y cuidar.

Así como una madre nutre el desarrollo de sus hijos, la inteligencia artificial generativa continúa evolucionando, moldeada por la curiosidad humana, los desafíos del presente y las oportunidades del futuro. Este mes, exploramos las últimas innovaciones que redefinen los límites de lo posible en la generación de texto, imagen, audio y video, y cómo estas tecnologías pueden también inspirar nuevas formas de conexión, creatividad y apoyo emocional.

En este número, encontrarás avances recientes de plataformas como OpenAI, Google DeepMind, Anthropic y otros actores clave en el ecosistema de IA, así como aplicaciones sorprendentes que evocan la ternura, la memoria y el cuidado, cualidades que asociamos naturalmente con la figura materna.

¡Feliz Día de la Madre! Y bienvenidos a las novedades más humanas de la inteligencia artificial.

Boletín 10 Mayo 2025

3

Qwen3: Piensa más profundo, actúa más rápido

En el artículo "Qwen3: Think Deeper, Act Faster" se presenta Qwen3, la nueva generación de modelos de lenguaje desarrollados por Alibaba Cloud. Esta versión introduce avances significativos en rendimiento, eficiencia y capacidades multilingües.

Principales características de Qwen3

Modos de razonamiento híbrido: Qwen3 integra dos modos operativos:

  • Modo de pensamiento: para razonamientos complejos y detallados.
  • Modo sin pensamiento: para respuestas rápidas y contextuales.

Esta dualidad permite al modelo adaptarse dinámicamente según la complejidad de la tarea.

Presupuesto de pensamiento: Los usuarios pueden asignar recursos

Boletín 10 - Mayo 2025

4

computacionales de manera adaptativa durante la inferencia, equilibrando latencia y rendimiento según la complejidad de la tarea.

Amplio soporte multilingüe: Qwen3 amplía su compatibilidad de 29 a 119 idiomas y dialectos, mejorando la accesibilidad global y la comprensión multilingüe.

Modelos disponibles: La familia Qwen3 incluye modelos densos y de mezcla de expertos (MoE), con tamaños que van desde 0.6 hasta 235 mil millones de parámetros. Todos los modelos están disponibles bajo la licencia Apache 2.0.

Rendimiento competitivo: Qwen3 alcanza resultados de vanguardia en diversas evaluaciones, incluyendo generación de código, razonamiento matemático y tareas de agentes, siendo competitivo frente a modelos propietarios más grandes.

Qwen3 también genera buenas imágenes, como la que mostramos en la siguiente página, usando el modelo Qwen3-235B-A22B (235 mil millones de parámetros totales y 22 mil millones de parámetros activados).

Boletín 10 - Mayo 2025

5

Boletín 10 - Mayo 2025

6

Hemos optimizado los modelos Qwen3 para la codificación y las capacidades de agentes, y también hemos fortalecido el soporte de MCP1. A continuación, proporcionamos ejemplos para mostrar cómo Qwen3 piensa e interactúa con el entorno (Qwen).

Boletín 10 - Mayo 2025

7
MCP como Modelo de Predicción Continua en inteligencia artificial se refiere a un tipo de modelo diseñado para predecir valores continuos (no categóricos), es decir, regresión en lugar de clasificación.

Gemini 2.5, el pilar central de Google I/O 2025

Nuestro potente y eficiente modelo de trabajo, Gemini 2.5 Flash, ha sido increíblemente popular entre los desarrolladores que valoran su velocidad y bajo costo. Y el nuevo Flash 2.5 es superior en casi todos los aspectos, mejorando en indi- cadores clave de razonamiento, multimodalidad, código y contexto extenso. Ocupa el segundo lugar, solo superado por 2.5 Pro, en la clasificación de LMArena.

Mejoramos aún más la versión 2.5 Pro con un modo de razonamiento mejorado, llamado Deep Think (Google).

La integración con Canvas permite crear infografías dinámicas, cuestionarios e incluso podcasts en varios idiomas con un solo clic. Al modelo Gemini 2.5 Flash, lanzado el 20 de mayo, le pedimos:

Boletín 10 - Mayo 2025

8

"Genera una descripción detallada de la celebración del día de las madres en varias partes del mundo", cuya respuesta incluye 8 países, el primero agrupando a la mayoría de países de América y Europa. La introducción a la descripción fue la siguiente:

El Día de las Madres es una celebración global que, aunque comparte el propósito fundamental de honrar a las madres, se manifiesta de maneras muy diversas en diferentes culturas y regiones del mundo, variando en fechas, tradiciones y simbolismo.

Sólo por curiosidad, presentamos algunos apartes de dos países descritos:

Tailandia (12 de Agosto - Cumpleaños de la Reina Madre Sirikit). El Día de las Madres ("Wan Mae") es una celebración muy significativa que coincide con el cumpleaños de la Reina Madre Sirikit. Se estableció en 1976 para honrar a la Reina Sirikit, considerada la "madre de todos los tailandeses"...

Etiopía (Antrosht). La celebración etíope, conocida como "Antrosht" o "Día de las Madres", es una fiesta que dura varios días al final de la temporada de lluvias de otoño, y es una celebración de la familia y la regeneración.

Boletín 10 - Mayo 2025

9

En Google AI Studio, logramos desarrollar una APP generadora de cuestionarios de selección múltiple. Una de las ventajas de Gemini (para el usuario), a mayo de 2025, es que, por ser libre, permite una gran cantidad de mensajes, de tal forma que pueda obtener la aplicación deseada. El siguiente video, evidencia lo antes dicho:

En la siguiente página, presentamos la aplicación obtenida, incluyendo dos modelos de IA generativa de imagen: Flux .1 e Image de GPT.

Boletín 10 - Mayo 2025

10

Boletín 10 - Mayo 2025

11

Pero, Google AI Studio no solo ofrece el nuevo modelo Gemini 2.5 flash. En el boletín anterior del mes de abril, mostramos el generador de videos Veo 2. En mayo se lanza Veo 3 y el generador de imágenes Imagen 4, con el cual generamos la siguiente imagen (Usamos Vertex AI de Google Cloud, para acceder a Imagen 4):

Google I/O 2025

Las sorpresas de Google, en el mes de las madres, parecían no tener fin. En el evento Google I/O 2025, celebrado en los días 20 y 21 de mayo, Google presenta sus innovaciones y avances en inteligencia artificial. Pero, dejemos que sea Google el que nos informe sobre estas novedades, pues basta pedirle el resumen y en el canvas2. que nos genere una página interactiva ¡Hecho!, observa el resultado:

Boletín 10 - Mayo 2025

12
Recordemos que con la integración de Canvas podemos crear infografías dinámicas, páginas interactivas y podcasts.

Boletín 10 - Mayo 2025

13

Claude Opus 4 y Claude Sonnet 4 establecen nuevos estándares

El 22 de mayo, Anthropic Team nos envía un correo presentando a Claude 4. A continuación, transcribimos el correo:

Esto es lo que estamos lanzando en la API Anthropic:

  • Claude Opus 4: el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración y flujos de trabajo de agentes.
  • Claude Sonnet 4: una mejora significativa de Claude Sonnet 3.7, que supera a su predecesor en codificación y razonamiento y al mismo tiempo responde con mayor precisión a sus instrucciones.
  • Pensamiento extendido con uso de herramientas (beta): Ambos modelos pueden utilizar herramientas durante el pensamiento extendido, lo que permite a Claude alternar entre el razonamiento y el uso de herramientas para mejorar las respuestas.

Boletín 10 - Mayo 2025

14
  • Nuevas capacidades del modelo: Al acceder a archivos locales, ambos modelos pueden extraer y guardar información clave de las conversaciones en archivos de memoria locales, manteniendo la continuidad entre sesiones y generando conocimiento tácito a lo largo del tiempo. También hemos añadido el uso de herramientas en paralelo y mejorado el seguimiento de instrucciones.
  • Nuevas capacidades de API: Estamos lanzando cuatro nuevas capacidades en la API Anthropic que permiten a los desarrolladores crear agentes de IA más potentes: la herramienta de ejecución de código, el conector MCP, la API de archivos y la capacidad de almacenar en caché las indicaciones durante hasta una hora.
  • Nivel de prioridad: ahora puede comprar capacidad de API priorizada para una disponibilidad predecible durante períodos de alta demanda.

Claude Opus 4 y Claude Sonnet 4 ahora están disponibles en Anthropic API, Amazon Bedrock y Vertex AI de Google Cloud.

Boletín 10 - Mayo 2025

15

Al ingresar a Claude, nos encontramos con este aviso:

Para probar su capacidad de generar código, le pedimos:

Crea un chatbot experto en "zoología" y genera un código único HTML (HTML+CSS+JS). Incluye un selector de modelos de lenguaje con las siguientes opciones: mirexa, openai-large, llama, deepseek, gemini y mistral. Usa https://text.pollinations.ai/{prompt}? model={modelo}&system={sistema}, donde modelo es el modelo de lenguaje elegido y sistema es "Eres un experto en lectura de documentos PDF, guardas la memoria de chats anteriores y das respuestas según el PDF o de zoología", para generar la respuesta. No debes admitir preguntas fuera del tema o del PDF, incluye cuatro botones con preguntas frecuentes y un botón para cambiar el fondo a claro u oscuro. En el título incluye "Juan Guillermo Rivera Berrío". El diseño debe ser atractivo en sus colores y textos. Permite, además, que se puedan subir archivos PDF como base de conocimiento del chatbot."

Obteniendo el chatbot de la siguiente página (haz clic en el botón zoom para ver el chatbot en pantalla completa).

Boletín 10 - Mayo 2025

16

Boletín 10 - Mayo 2025

17

Microsoft lanza los modelos de
razonamiento Phi-4

"Phi-4-reasoning" es una familia de modelos de lenguaje desarrollados por Microsoft, diseñados para mejorar las capacidades de razonamiento complejo. El modelo principal, Phi-4-reasoning, cuenta con 14 mil millones de parámetros y se entrena mediante una combinación de afinamiento supervisado y aprendizaje por refuerzo.

Características clave

Afinamiento supervisado (SFT): Phi-4-reasoning se entrena con más de 1.4 millones de ejemplos cuidadosamente seleccionados, que incluyen demostra- ciones de razonamiento generadas por el modelo o3-mini. Estos ejemplos abarcan tareas en matemáticas, ciencias,

Boletín 10 - Mayo 2025

18

programación y seguridad .

Phi-4-reasoning-plus: Una variante mejorada que incorpora una fase breve de aprendizaje por refuerzo basado en resultados, utilizando aproximadamente 6,000 problemas matemáticos con soluciones verificables. Esto permite generar cadenas de razonamiento más largas y detalladas.

Rendimiento

Ambos modelos superan significativamente a modelos de mayor tamaño, como DeepSeek-R1-Distill-Llama-70B, en diversas tareas de razonamiento. En benchmarks como AIME 2025 y OmniMath, Phi-4-reasoning-plus muestra mejoras de más de 50 puntos porcentuales en precisión. En tareas de codificación, se observan mejoras de más de 25 puntos porcentuales (véase el reporte técnico en arXiv:2504.21318).

La curación de datos para entrenar los modelos de razonamiento Phi-4 se basó no solo en la cantidad, sino también en la calidad de los datos. Se seleccionaron específicamente los datos que se encontraban al límite de las capacidades del modelo. Esto garantizó que los datos

Boletín 10 - Mayo 2025

19

de entrenamiento fueran resolubles, pero no fáciles.

Los principales pasos involucrados en la construcción del conjunto de datos para los modelos Phi-4 fueron:

Base de datos de semillas: El equipo de Microsoft comenzó con conjuntos de datos públicos como AIME y GPQA. Estos conjuntos de datos abordaban problemas de álgebra y geometría que implicaban razonamiento de varios pasos.

Cadenas de razonamiento sintético: para obtener respuestas razonadas paso a paso, completas y detalladas para los problemas, el equipo de Microsoft se basó en el modelo o3-mini de OpenAI.

Figura 1. Rendimiento del razonamiento Phi-4 en parámetros de razonamiento representativos que abarcan los dominios matemático (HMMT, AIME 25, OmniMath), científico (GPQA) y de codificación (LiveCodeBench 8/24-1/25).

Selección de "Momentos de Aprendizaje": El equipo de desarrollo, conscientemente, optó por indicaciones que desafiaran el modelo base de Phi-4, a la vez que fueran solucionables. Estas incluían problemas en los que Phi-4 mostró inicialmente una precisión de alrededor del 50 %. Este enfoque garantizó que el proceso de entrenamiento evitara datos "fáciles" que simplemente reforzaban

Boletín 10 - Mayo 2025

20

patrones existentes, y se centrara más en el razonamiento estructurado (véase el reporte técnico en Sarayavalasaravikiran).

El modelo Phi-4-reasoning-plus, se puede probar en Hugging Face en uno de estos enlaces: VIDraft o NeoPy. En uno de ellos, hicimos la siguiente pregunta: "Si un prisma rectangular tiene una longitud de 6 cm, un ancho de 4 cm y una altura de 5 cm, ¿cuál es la longitud del segmento de línea más largo que se puede dibujar desde un vértice a otro?", obteniendo:

Para hallar la longitud del segmento de línea más largo que se puede dibujar en un prisma rectangular, debemos encontrar la diagonal espacial del prisma. Esta diagonal conecta dos vértices opuestos y se calcula con la fórmula:
d = √(l² + w² + h²)
donde l es la longitud, w el ancho y h la altura del prisma.

Dado que:
l = 6 cm
w = 4 cm
h = 5 cm

Calculemos:
d = √(6² + 4² + 5²)
= √(36 + 16 + 25)
= √77

Por lo tanto, la longitud del segmento de línea más largo es √77 cm, lo que aproximadamente equivale a 8.78 cm.

Boletín 10 - Mayo 2025

21

Manus AI al alcance de todos

En el mes de mayo, Manus nos presenta dos novedades, que describimos a continuación.

Acceso gratuito adicional a Manus

El 11 de mayo, se da acceso adicional a Manus y, además:

  • Disponible para todos sin lista de espera
  • Una tarea diaria gratuita para todos los usuarios (300 créditos)
  • Un bono único de 1,000 créditos para todos los usuarios

Más valor, más flexibilidad. ¡Disfruta tus créditos gratuitos e invita a tus amigos a probarlo!

Ya habíamos probado esta herramienta, en meses pasados, luego de obtener acceso desde la lista de espera. Inicialmente nos otorgó 1000 créditos, los cuales se agotaron con una sola solicitud, por lo que no hicimos promoción. Ahora, con esta primera

Boletín 10 - Mayo 2025

22

novedad, lo hemo vuelto a intentar con solicitudes más simples, las cuales compartimos a continuación.

Primera solicitud

"Consulta las últimas novedades de IA generativa y diseña una infografía con la información obtenida. La infografía debe estar en un archivo HTML5 con todos los códigos CSS y JS necesarios. Usa colores y textos llamativos."

Luego de 45 minutos de estar explorando la web, le pedimos a Manus que suspendiera y continuara con el siguiente paso.

Luego varios minutos, manifestó tener algunos problemas técnicos ofreciendo entregar el archivo en formato txt, lo cual aceptamos. El resultado obtenido, mostraba los últimos avances en IA generativa, entre ellas las de Google I/O 2025, lo cual se le abona; sin embargo, la página no fue interactiva, además de observar cómo se esfumaron los 1000 créditos otorgados ¡He ahí los problemas técnicos!

Lo cierto es que parece existir un algoritmo que obliga a consumir los 1000 créditos iniciales en una sola aplicación. Usando otra cuenta, para

Boletín 10 - Mayo 2025

23

genera un cuestionario de preguntas, consumió 760 créditos, sin lograr la aplicación con las correcciones pedidas.

Segunda solicitud

"Haz una página interactiva sobre el día de la madre en diferentes países, incluyendo Colombia, España, estados Unidos, México, Japón y países árabes. Al final me entregas un archivo HTML que incluya todos los códigos CSS y JS".

Se obtuvo la página sin problemas (ver siguiente página), consumiendo 309 créditos; es decir, los créditos diarios otorgados.

Generación de imágenes de Manus

El 16 de mayo, Manus anuncia su generador de imágenes. Lo probamos con el siguiente prompt: "Dibuja una escena del día de la madre". Nos generó la imagen de la derecha, bastante buena, tanto por la imagen como por el texto generado. Esta imagen consumió 20 créditos; es decir, podemos generar 15 imágenes diarias con los 300 créditos otorgados diariamente.

Manus está desarrollado por una startup china, Butterfly Effect, y se lanzó en marzo de 2025. Se presentó como una "IA general" (Jim Clyde Monge).

Boletín 10 - Mayo 2025

24

Boletín 10 - Mayo 2025

25

Lanzamiento de
Lovable 2.0

¡Estamos muy emocionados por lanzar Lovable 2.0 ! Se centra en la colaboración, la seguridad y en darte más control.

A finales del mes de abril, Lovable lanza su nueva versión, con las siguientes características:

  • Renovación de marca: Nuevo logotipo, colores más vibrantes y una interfaz de usuario mucho más limpia.
  • Equipos : Colaboración en tiempo real, permitiendo invitar a otros a coeditar aplicaciones o crear espacios de trabajo compartidos.
  • Análisis de seguridad: Lovable ahora busca vulnerabilidades al publicar (si estás conectado a Supabase). Es solo el comienzo para que la programación en Vibe sea más segura por defecto.
  • Modo de chat más inteligente: No realiza ediciones, ayuda a analizar problemas, planificar funciones, inspeccionar registros, consultar bases de datos y mucho más.

Boletín 10 - Mayo 2025

26

Un cambio importante es el nuevo Agente de Modo Chat. Este innovador asistente de IA no edita tu código directamente, sino que te ayuda a hacer preguntas, planificar tu proyecto y depurar problemas. Lo que hace especial al Agente de Modo Chat es que separa la planificación de la construcción (Ashen Thilakarathna).

Con el mismo prompt que usamos con Claude 4 (página 16), creamos un chatbot sobre estilos artísticos (haz clic sobre la imagen):

Para evitar las repuestas en formato MD, le pedimos: "Las respuestas en formato MD, preséntalas en un formato que muestre adecuadamente títulos, saltos de línea, viñetas, etc.".

Boletín 10 - Mayo 2025

27

NotebookLM ¡Podemos usar los pódcast en español!

Google ha anunciado una importante actualización para NotebookLM, su herramienta de inteligencia artificial diseñada para transformar documentos en resúmenes conversacionales al estilo podcast. A partir de ahora, la función de Resúmenes de Audio está disponible en más de 50 idiomas, incluido el español, lo que amplía significativamente su accesibilidad a nivel mundial.

Esta expansión permite a los usuarios convertir textos complejos en audios comprensibles en su idioma preferido. Por ejemplo, un estudiante puede cargar documentos en diferentes idiomas y generar un resumen en español, facilitando el aprendizaje y la comprensión.

Para utilizar esta función, simplemente accede a la configuración de NotebookLM y selecciona el "Idioma de salida" deseado. A partir de ese momento, los resúmenes de audio y las respuestas del chat se generarán en el idioma elegido.

Boletín 10 - Mayo 2025

28

Esta actualización representa un paso significativo hacia la democratización del acceso a la información, eliminando barreras lingüísticas y permitiendo que más personas aprovechen las capacidades de NotebookLM en su idioma nativo.

Boletín 10 - Mayo 2025

29

Herramientas de IA de la Red Educativa Digital Descartes

Que sea NotebookLM, quien nos de la introducción a este artículo:

Boletín 10 - Mayo 2025

30

Durante mayo de 2025, la Red Educativa Digital Descartes ha continuado su compromiso con la innovación educativa al incorporar nuevas herramientas de inteligencia artificial (IA) diseñadas para enriquecer la enseñanza y el aprendizaje. A continuación, se presentan algunas de estas novedades.

El 20 de mayo de 2025 se lanzó el Generador de cuestionarios de selección múltiple con Pollinations. Esta herramienta, diseñada con las API de Pollinations y tecnología Gemini 2.5 Pro, permite la intervención en el diseño, incluye soporte para MathJax para expresiones matemáticas, la posibilidad de regenerar imágenes y ofrece límites más amplios para el número de preguntas. Se han generado ejemplos sobre temas como animales y factorización de polinomios. También se encuentra disponible un video que muestra el procedimiento para generar cuestionarios.

Un día antes, el 19 de mayo de 2025, se presentó el Generador de juegos tipo scrambled. Este juego, que consiste en ordenar letras, palabras o frases mezcladas, permite generar actividades con palabras desordenadas, como nombres de animales, comidas o flores.

Boletín 10 - Mayo 2025

31

Fue diseñada utilizando la API de Pollinations y tecnología Gemini 2.5 Pro.

El 18 de mayo de 2025 se publicó el Diálogo inteligente de IA con Pollinations. Descrita como un poderoso asistente de chat con inteligencia artificial, puede responder preguntas, ofrecer sugerencias creativas, escribir textos y ayudar a resolver problemas complejos. Es de uso completamente gratuito e ilimitado, soporta 16 modelos de lenguaje y 13 personalidades de bot, y recuerda y guarda conversaciones en formato MD. La herramienta fue diseñada por el Laboratorio Azad (China) y traducida al español, utilizando la API de Pollinations.

Para educadores y creadores de contenido, el 17 de mayo de 2025 llegó el Generador de tutoriales interactivos. Esta herramienta facilita el diseño de tutoriales llamativos e interactivos con solo unos clics, simplemente ingresando el tema y el número de pasos. Permite configuraciones avanzadas como la elección entre 20 estilos artísticos para imágenes, la activación de MathJax para expresiones matemáticas, la selección entre 10 paletas de colores y la regeneración de imágenes antes de aprobar y descargar el tutorial. Ejemplos de tutoriales generados incluyen "producto de matrices", "las leyes de Newton" y "sistemas embebidos". Fue diseñada utilizando la API de Pollinations y la IA Gemini 2.5 Pro Preview.

Boletín 10 - Mayo 2025

32

Siguiendo con herramientas lúdicas y educativas, el 16 de mayo de 2025 se lanzó Crea tu juego Memoriza con Pollinations. Esta herramienta permite crear juegos tipo "Memoriza" o "Encuentra las parejas". El procedimiento es sencillo: ingresar el tema, elegir un estilo, hacer clic en "Generar" y luego descargar el juego. Su diseño se basa en la API de Pollinations y la IA Gemini 2.5 Pro Preview.

El 15 de mayo de 2025 se añadió el Generador de secuencias temporales. Esta herramienta ayuda a generar secuencias con tres o cuatro momentos. El usuario elige el número de momentos y el estilo artístico, incluye el tema o descripciones personalizadas, puede cambiar o aceptar las imágenes generadas, y finalmente genera y descarga la secuencia. Se presentan 10 ejemplos interactivos, incluyendo una secuencia sobre el amanecer. La herramienta fue diseñada utilizando la API de Pollinations y la IA Gemini 2.5 Pro Preview.

Mayo también trajo herramientas para crear puzles. El 14 de mayo de 2025 se publicó el Puzle de arrastre de piezas. Permite generar rompecabezas tipo arrastre de piezas a partir de una descripción de imagen ingresada por el usuario, con selección de estilo artístico. Ofrece cuatro modelos (2x2, 3x3, 4x4, 5x5) que se pueden descargar y compartir, destacando que las piezas tienen imán. Justo el día anterior, el 13 de mayo de 2025, se había lanzado el Puzle de intercambio de piezas, que genera rompecabezas tipo intercambio de

Boletín 10 - Mayo 2025

33

piezas a partir de una descripción de imagen. Ofrece dos modelos (3x3 y 4x4) que también se pueden descargar y compartir.

Para la creación de evaluaciones, el 12 de mayo de 2025 se presentó el Generador de evaluaciones tipo completar la frase. Permite generar este tipo de evaluaciones y descargarlas en formato HTML. Ofrece configuraciones por niveles, con un número variable de ejercicios y huecos en la frase. El botón de descarga se habilita en los niveles intermedio y experto una vez generados los ejercicios.

El 11 de mayo de 2025 se incorporó la herramienta Dibujos para colorear. Presenta una paleta de colores y permite al usuario generar o subir una imagen para colorear. Al seleccionar un color y hacer clic en un punto de la figura, se colorea la región circundante. El dibujo coloreado se puede descargar y compartir. Se menciona un applet similar creado en 2012 como antecedente.

Las herramientas de asociación también tuvieron su espacio en mayo. El 10 de mayo de 2025 se lanzó Asocia imágenes y textos con pollinations. A partir de un prompt del usuario (ej. pintores famosos, frutas), la herramienta genera un juego asociando 8 imágenes (con la API de Pollinations) y 8 palabras. Las palabras deben ser arrastradas a la imagen correspondiente. El juego se puede descargar en HTML. Existe una versión modificada que genera palabras en inglés para juegos de vocabulario.

Boletín 10 - Mayo 2025

34

En la línea de evaluaciones, el 9 de mayo de 2025 se lanzó el Clasificador de imágenes con pollinations. Permite generar evaluaciones tipo clasificación de imágenes ingresando tres categorías (ej. insectos, peces y aves) y seleccionando un estilo de imagen. Genera 10 imágenes, con opción a regenerarlas, y una vez aprobadas, se descarga el archivo HTML para compartir. Al día siguiente, el 8 de mayo de 2025, se presentó el Emparejamiento de imágenes y palabras. Con un tema ingresado, genera 5 palabras y 5 imágenes para emparejar, con un botón para generar nuevas palabras y otro para descargar el emparejamiento en formato HTML. Se sugieren temas que no se presten a la ambigüedad, como "Nombres de ciudades" en lugar de "ciudades", y se desaconsejan temas abstractos.

El 7 de mayo de 2025 se publicó el Clasificador de palabras con Pollinations. Permite generar evaluaciones tipo clasificación de palabras ingresando tres categorías (ej. países de Europa, África, América). Genera 12 palabras, con opción a regenerarlas, y permite descargar el archivo HTML. También ofrece la opción de modificar las palabras editando el archivo HTML generado.

Adentrándonos en asistentes virtuales, el 6 de mayo de 2025 se presentaron los Chatbots personalizados con Pollinations. Esta herramienta ofrece 12 chatbots especializados en áreas como Física, Cálculo, Cuarta revolución industrial, Álgebra, Arquitectura,

Boletín 10 - Mayo 2025

35

Métodos numéricos y Estática y resistencia de materiales. Fue diseñada utilizando las herramientas 39 y 46, y las imágenes de los botones se crearon con Ideogram.

Previo a eso, el 2 de mayo de 2025 se lanzó el Creador de páginas web con Pollinations. Descrita como ideal para diseñar y publicar páginas web profesionales de forma rápida e intuitiva sin necesidad de saber programar, genera plantillas, bloques visuales y funciones inteligentes. Algunos ejemplos incluyen crear un presentador de 10 diapositivas de felinos o un cuestionario interactivo de selección múltiple sobre insectos. La herramienta original fue diseñada por Logise.

Finalmente, para iniciar el mes, el 1 de mayo de 2025 se presentó Investigación profunda con Pollinations. Utilizando GPT-4o, esta herramienta busca información en fuentes públicas confiables como arXiv, PubMed, Semantic Scholar, CORE, entre otras, a partir de un tema o pregunta de investigación. Por defecto, entrega las fuentes consultadas y enlaces, y se verificó una alta confiabilidad en pruebas realizadas. Como valor agregado, genera una imagen relacionada con la pregunta. La herramienta original fue diseñada por Trey6383 en WebSim (en inglés).

En resumen, el mes de mayo fue un periodo de intensa actividad, con lanzamientos que abarcan desde generadores de cuestionarios y juegos, pasando por herramientas de diálogo y tutoriales, creadores de puzles y evaluaciones, hasta utilidades más especializadas como clasificadores, chatbot temáticos, un creador de páginas web y una herramienta para investigación profunda. La mayoría de estas herramientas se construyen sobre las API de Pollinations, frecuentemente combinadas con tecnología Gemini 2.5 Pro o DescartesJS. En la siguiente página, presentamos el chatbot "Investigación profunda".

Boletín 10 - Mayo 2025

36

Boletín 10 - Mayo 2025

37

DeepSeek Prover V2: experto demostración de teoremas
matemáticos

DeepSeek-Prover-V2 representa un hito en el campo de la inteligencia artificial aplicada a la demostración de teoremas. Este modelo de lenguaje, desarrollado por DeepSeek-AI, está diseñado específicamente para generar pruebas formales en Lean 4, un sistema de verificación matemática. Su innovación clave radica en su capacidad para unir el razonamiento informal —propio del lenguaje natural— con la rigurosidad lógica de las pruebas formales.

El proceso comienza con DeepSeek-V3, que descompone teoremas complejos en subobjetivos más manejables y redacta bosquejos de prueba en lenguaje natural. Luego, estos pasos se traducen a enunciados formales en Lean, marcando los detalles aún no demostrados con marcadores sorry. Un modelo de 7 mil millones de parámetros se encarga de completar esas partes, lo que permite resolver los subproblemas de forma recursiva y construir pruebas completas.

Boletín 10 - Mayo 2025

38

Gracias a esta estrategia, DeepSeek-Prover-V2 logra un 88.9% de precisión en el benchmark MiniF2F-test. Además, incorpora un nuevo conjunto de evaluación, ProverBench, con problemas de olimpiadas matemáticas como el AIME, donde ha resuelto 6 de 15 problemas formalizados.

El modelo demuestra que la brecha entre el razonamiento matemático informal y la verificación formal se está reduciendo rápidamente. Con un enfoque basado en aprendizaje por refuerzo y descomposición de metas, el modelo se posiciona como una herramienta de vanguardia para la automatización del razonamiento matemático.

DeepSeek Prover V2 se ha lanzado en dos versiones. Una de ellas es de 7.000 millones de parámetros y se basa en Prover V1.5-Base, mientras que la otra es de 671.000 millones de parámetros y su entrenamiento se ha concretado sobre DeepSeek V3-Base.

Es importante mencionar que, como se trata de una IA especiali- zada para una labor bastante específica, DeepSeek Prover V2 no se ha desarrollado para impulsar un chatbot convencional (Gabriel Erard).

Boletín 10 - Mayo 2025

39

Como ejercicio, le pedimos a DeepSeek-Prover-V2: "Demuestra el teorema del valor medio", a lo cual respondió:

El Teorema del Valor Medio es un resultado fundamental en el cálculo diferencial. Aquí está el teorema y su demostración:

Teorema del Valor Medio (Lagrange):

Si ff es una función continua en el intervalo cerrado [a,b][a, b] y derivable en el intervalo abierto (a,b)(a, b), entonces existe al menos un punto c(a,b) c \in (a, b) tal que:

f(c)=f(b)f(a)ba f'(c) = \frac{f(b) - f(a)}{b - a}

Interpretación Geométrica:

El teorema establece que existe un punto cc en el intervalo (a,b)(a, b) donde la tangente a la curva es paralela a la recta secante que une los puntos (a,f(a))(a, f(a)) y (b,f(b))(b, f(b)).

Demostración:

  1. Definición de una función auxiliar: Consideremos la función g(x)=f(x)(f(b)f(a)ba)(xa)g(x) = f(x) - \left( \frac{f(b) - f(a)}{b - a} \right) (x - a). Esta función representa la diferencia entre la función f(x)f(x) y la recta secante que pasa por (a,f(a))(a, f(a)) y (b,f(b))(b, f(b)).
  2. Propiedades de g(x)g(x): g(x)g(x) es continua en [a,b][a, b] porque f(x)f(x) es continua y la resta de una recta (que es continua) no afecta la continuidad. g(x)g(x) es derivable en (a,b)(a, b) porque f(x)f(x) es derivable y la recta es derivable.

Boletín 10 - Mayo 2025

40
  1. Evaluación de g(x)g(x) en los extremos:

    g(a)=f(a)(f(b)f(a)ba)(aa)=f(a)g(a) = f(a) - \left( \frac{f(b) - f(a)}{b - a} \right) (a - a) = f(a)

    g(b)=f(b)(f(b)f(a)ba)(ba)=f(b)(f(b)f(a))=f(a)g(b) = f(b) - \left( \frac{f(b) - f(a)}{b - a} \right) (b - a) = f(b) - (f(b) - f(a)) = f(a)

    Por tanto, g(a)=g(b) g(a) = g(b).
  2. Aplicación del Teorema de Rolle: Dado que g(x) g(x) cumple las hipótesis del Teorema de Rolle (continua en [a,b][a, b], derivable en (a,b)(a, b) y g(a)=g(b)g(a) = g(b)), existe al menos un punto c(a,b)c \in (a, b) tal que g(c)=0g'(c) = 0.
  3. Derivada de g(x)g(x): Derivando g(x) g(x): g(x)=f(x)f(b)f(a)ba g'(x) = f'(x) - \frac{f(b) - f(a)}{b - a}.
  4. Aplicación de g(c)=0g'(c) = 0: En x=cx = c, tenemos:

    g(c)=f(c)f(b)f(a)ba=0 g'(c) = f'(c) - \frac{f(b) - f(a)}{b - a} = 0 Por lo tanto:

    f(c)=f(b)f(a)ba f'(c) = \frac{f(b) - f(a)}{b - a}

Conclusión: Existe un punto cc en (a,b)(a, b) donde la derivada de ff es igual a la pendiente de la recta secante que une (a,f(a))(a, f(a)) y (b,f(b))(b, f(b)).

Esta es la demostración del Teorema del Valor Medio, utilizando el Teorema de Rolle como paso intermedio.

Boletín 10 - Mayo 2025

41

Doubao 1.5 Pro: modelo LLM chino de mezcla de expertos

Desarrollado por el equipo de Doubao, Doubao-1.5-pro es un modelo de lenguaje extenso de MoE (Mezcla de Expertos) disperso de alto rendimiento. Este modelo logra un excelente equilibrio entre el rendimiento del modelo y el rendimiento de la inferencia mediante un diseño integrado de entrenamiento e inferencia. Destaca en diversos puntos de referencia de evaluación pública, mostrando importantes ventajas en eficiencia de inferencia y capacidades multimodales. El modelo es adecuado para escenarios que requieren inferencia eficiente e interacción multimodal, como el procesamiento del lenguaje natural, el reconocimiento de imágenes y la interacción del habla. Su fundamento técnico se basa en la arquitectura de MoE de activación dispersa, que optimiza las proporciones de los parámetros de activación y los algoritmos de entrenamiento para lograr un mayor rendimiento que los modelos densos tradicionales. Además, admite el ajuste dinámico de parámetros para

Boletín 10 - Mayo 2025

42

adaptarse a diversos escenarios de aplicación y requisitos de coste (.

Probamos con la generación de un chatbot, pero fue todo un fiasco. Para no quedarnos si algún resultado, le pedimos que nos dibujar una persona discutiendo con un bot, luego de varias imágenes, bastante violentas, optamos por compartir la siguiente:

Boletín 10 - Mayo 2025

43

Reciclando videos de Mootion

No se trata de una novedad en esta herramienta, se trata de un descubrimiento. Buscando videos, en Mootion, sobre el día de la madre, encontramos uno titulado "The journey of love to mom". Nuestro descubrimiento es que podíamos usarlo, editarlo y publicarlo. Eso hicimos, obteniendo el video que mostramos en la siguiente página.

Recordemos que Mootion Storyteller es una plataforma de creación de videos impulsada por inteligencia artificial que permite transformar ideas en historias visuales de manera rápida y sencilla. Diseñada para usuarios sin experiencia técnica, ofrece herramientas intuitivas para generar contenido animado a partir de texto, audio o video.

Recordemos, también, que la plataforma permite editar cada escena individualmente, ajustando imágenes, texto y elementos visuales para lograr el resultado deseado, además de admitir más de 10 idiomas, incluyendo español; gracias a ello, logramos el video "El viaje del amor a mamá".

Boletín 10 - Mayo 2025

44

Boletín 10 - Mayo 2025

45

Generando código con Canva Code

Canva lanza su propio generador de aplicaciones. El generador de código es parte de la suite de IA más amplia de Canva, que incluye herramientas para escribir contenido, generar imágenes y crear diseños con indicaciones. Esta nueva incorporación se integra directamente en la interfaz de Canva, por lo que no necesitas instalar ni configurar nada.

La generación de código es súper lenta. Un código de 250 líneas tardaría más de un minuto en completarse. No puede crear una aplicación que funcione o esté completa de una sola vez. Los archivos no son accesibles para usted, por lo que no puede ver el código fuente (Jim Clyde Monge).

Inicialmente, intentamos creando un chatbot, cuyo resultado fue desastroso. Una segunda app fue un juego de ordenar fracciones, cuyo resultado fue bastante bueno. Finalmente, creamos una línea de tiempo, que compartimos en la siguiente página.

Boletín 10 - Mayo 2025

46

Boletín 10 - Mayo 2025

47

Novedades en modelos de generación de
imágenes y videos

En mayo de 2025, la inteligencia artificial generativa en imágenes y videos ha experimentado avances significativos, destacando especialmente las innovaciones presentadas por Google durante su evento Google I/O 2025.

Google presentó Veo 3, su modelo más avanzado de generación de video mediante IA. Este sistema es capaz de crear clips de alta definición que incluyen música, efectos de sonido y diálogos con sincronización labial precisa. Veo 3 interpreta entradas de texto e imágenes con gran precisión, permitiendo la creación de escenas que simulan películas o documentales reales. Sin embargo, está disponible solo para suscriptores del plan Ultra de la aplicación Gemini.

Google también introdujo Imagen 4, la última versión de su modelo de generación de imágenes. Este modelo mejora significativamente el realismo y nivel de detalle en elementos como agua, tejidos y pieles de animales, ofreciendo

Boletín 10 - Mayo 2025

48

imágenes de alta fidelidad a partir de descripciones textuales.

La siguiente imagen fue generada con Imagen 4 de Google:

Imagen 4 puede reproducir diversos estilos artísticos con mayor precisión, desde el fotorrealismo y el impresionismo hasta lo abstracto y la ilustración (Deepmind de Google).

A continuación, presentamos otras novedades de imagen y video lanzadas en este mes de mayo.

Boletín 10 - Mayo 2025

49

Freepik

La novedad que nos presenta esta popular herramienta, es el otorgamiento de 20 créditos diarios. En la generación de imágenes, ofrece los modelos classic, mystic, Ideogram 3, Imagen 3 y 4 de Google, Flux 1.0 y 1.1. Los créditos libres solo los podemos usar con los modelos classic y flux 1.0 fast.

Freepik incluye una gran cantidad de estilos, tanto de pago como para los créditos libres, además de otros parámetros como composición, efectos, personaje, entre otros.

DeviantArt

DeviantArt es la comunidad social en línea más grande para artistas y entusiastas del arte, lo que permite a las personas conectarse a través de la creación y el intercambio de arte. Entretenemos, inspiramos y empoderamos al artista que todos llevamos dentro.

La aplicación DeviantArt ofrece una variedad de contenido fresco y emocionante, desde arte digital, pixel art, anime y fan art hasta medios tradicionales de pintura, dibujo, fotografía, poesía y escultura. Explore innumerables flujos de contenido, envíe su propio trabajo y comuníquese con la comunidad en cualquier momento (Google Play).

Boletín 10 - Mayo 2025

50

La siguiente imagen, sobre la celebración del día de la madre, fue generada con DeviantArt y estilo fantasía.

LTX Studio

La plataforma de LTX Studio, impulsada por IA, está diseñada específicamente para el desarrollo de conceptos, el storyboard y la iteración. Diseñada para obtener resultados profesionales en publicidad, cine y contenido de marca, este diseño integral optimiza múltiples etapas del proceso creativo en una única solución.

Para la generación de movimiento ofrece tres modelos LTXV, LTXV Turbo y Veo 2, esta última disponible en los planes de pago. Hemos generado un video, usando la imagen de Imagen 4 de Google (página 49), el modelo LTXV Turbo y el prompt "Una mujer levanta su copa y brinda con los demás, obteniendo el video que presentamos en la siguiente página.

Boletín 10 - Mayo 2025

51

Podemos observar excelentes movimientos de las manos y lo gestos de las personas; sin embargo, al aparecer un objeto poco común en los videos (la copa de vino), se generan alucinaciones; por ejemplo, la copa de la mujer del fondo es levantada en un "acto de magia".

LTX-Video es el primer modelo de generación de video basado en DiT capaz de generar videos de alta calidad en tiempo real. Produce videos de 30 FPS con una resolución de 1216×704 más rápido de lo que se puede ver. Entrenado con un conjunto de datos a gran escala de videos diversos, el modelo genera videos de alta resolución con contenido realista y variado (Hugging Face).

Boletín 10 - Mayo 2025

52

AKOOL

La nueva herramienta Image-to-Video de Akool es una solución gratuita y basada en inteligencia artificial que permite transformar imágenes estáticas en videos animados de alta calidad, con resolución hasta 4K. El proceso es sencillo: sube una imagen y proporciona una descripción breve; la IA generará un video con movimientos faciales y expresiones realistas.

Con una imagen generada con el modelo Image de GPT, obtuvimos el siguiente video en Akool:

Boletín 10 - Mayo 2025

53

Búsqueda con hilos (threads) en Consensus

En sistemas como ChatGPT, un thread se refiere a una sesión de conversación continua. Cada "hilo" mantiene el contexto del diálogo entre el usuario y el modelo, lo cual permite respuestas más coherentes y adaptadas al historial de la conversación.

En el mes de mayo, Consensus incluye los threads, para facilitar la consulta de los investigadores.

En lugar de empezar de cero con cada nueva consulta, Threads conserva tu contexto para que puedas profundizar en la investigación. Es una forma más eficiente de buscar, ya que ahora puedes interactuar con la ciencia. Tu investigación se vuelve más rápida, natural y se ajusta mejor a tu forma de pensar y trabajar (Allison Elechko).

Cómo usar hilos en Consensus

  • Escribe una pregunta en la barra de búsqueda y envía tu búsqueda.

Boletín 10 - Mayo 2025

54
  • Haz clic en el cuadro "Solicitar un seguimiento..." en la parte inferior de la página (Ask a follow up...).
  • Ingresa tu próxima pregunta y aplica filtros si es necesario.
  • Envía tu búsqueda de seguimiento.

Beneficios de los Threads en Consensus para Investigadores

  • Procesamiento Paralelo y Eficiencia
  • Permiten ejecutar múltiples procesos de optimización y análisis en paralelo, acelerando tareas como la revisión de grandes volúmenes de datos.
  • El enfoque distribuido y asin- crónico de los threads elimina la necesidad de un coordinador central, facilitando la escalabilidad y reduciendo los cuellos de botella en proyectos colaborativos.
  • La colaboración humano-IA, facilitada por threads, puede reducir la carga de trabajo en tareas como la evaluación de evidencia científica, logrando resultados más precisos y eficientes que los procesos tradicionales solo humanos o solo IA.

Boletín 10 - Mayo 2025

55

Novedades de Hugging Face

A continuación, presentamos tres novedades de Hugging Face en el mes de mayo.

Generación de video de alta calidad con LTX Video 0.9.7 Distilled

LTX Video 0.9.7 Distilled es una versión optimizada del modelo de generación de video LTX-Video, desarrollado por Lightricks. Este modelo utiliza una arquitectura basada en Transformers Latentes Difusos (DiT) para generar videos de alta calidad en tiempo real.

Algunas características son: producción de videos de calidad cinematográfica con solo 4 a 8 pasos de inferencia, lo que permite una generación rápida y eficiente; la versión cuantizada (Q8) reduce los requisitos de memoria, permitiendo su ejecución en GPUs de gama media, como la NVIDIA RTX 3060 de 12 GB; generación de videos a 24 FPS con una resolución de 768x512 píxeles en tiempo real.

Boletín 10 - Mayo 2025

56

Usando la imagen de la herramienta 57 "Crea tu juego memoriza...", de nuestra caja de herramientas, obtuvimos un video de 5 segundos, que mostramos a continuación:

Boletín 10 - Mayo 2025

57

Seed1.5-VL Paper

Seed1.5-VL es una versión multimodal del modelo Seed, una arquitectura de modelo de lenguaje desarrollada por la empresa Tsinghua KEG Lab y Zhipu AI (los creadores de ChatGLM). El sufijo "VL" significa Vision-Language, lo que indica que el modelo puede procesar y generar tanto texto como imágenes.

Lo probamos subiendo la imagen anterior:

La imagen muestra un ambiente infantil acogedor donde una niña juega a un juego de memoria sobre una alfombra de colores vibrantes. La niña tiene el pelo recogido en dos moños sujetos con gomas rojas y lleva un vestido corto de manga azul claro, con un delantal púrpura decorado con puntos amarillos. Está sentada en el suelo, interactuando con un juego de mesa azul llamado "MEMORIZA" (con la leyenda "Encuentra las parejas" debajo), que tiene cuadrados con diferentes figuras coloreadas.

El fondo revela un salón infantil: a la izquierda, un sillón rosa con un cojín amarillo; detrás, un mueble verde con juguetes y objetos de colores; y una canasta de mimbre llena de juguetes. También se ven juguetes esparcidos por el suelo, como un juego de anillos apilados y bloques de colores. La iluminación es suave y natural, creando una atmósfera cálida y divertida, ideal para un espacio de juego infantil.

Boletín 10 - Mayo 2025

58

Seed1.5-VL Paper

ICEdit es una herramienta que evidencia un avance significativo en la edición de imágenes basada en instrucciones, ofreciendo un equilibrio entre precisión y eficiencia que podría tener aplicaciones prácticas en diversos campos, desde la educación hasta la creación de contenidos visuales.

Con la imagen anterior y el prompt "Pinta el cabello con color rosa y ponle gafas a la niña", obtuvimos:

Boletín 10 - Mayo 2025

59

Novedades Medium

Este nuevo apartado lo dedicaremos a artículos recientes, publicados por Medium, en la categoría IA generativa.

La nueva Imagen 4 de
Google ahora es
compatible con
Flux Labs AI

El artículo titulado "Google’s New Imagen 4 Is Now Supported In Flux Labs AI" por Jim Clyde Monge, anuncia la integración del modelo de generación de imágenes por IA más avanzado de Google, Imagen 4, en la plataforma Flux Labs AI. Esta incorporación permite a los usuarios aprovechar las capacidades mejoradas de Imagen 4 directamente desde Flux Labs AI.

La integración de Imagen 4 en Flux Labs AI brinda a los creadores y desarrolladores una herramienta poderosa para producir contenido visual de alta calidad, aprovechando las capacidades avanzadas del modelo de Google.

Boletín 10 - Mayo 2025

60

Google I/O fue una completa locura para los desarrolladores

Este artículo de Tari Ibaba destaca las principales novedades para desarrolladores presentadas en Google I/O 2025, centradas en herramientas de inteligencia artificial que transforman el flujo de trabajo de desarrollo.

Los puntos clave: Gemini Code Assist (asistente de codificación gratuito de Google), Stitch (herramienta de generación de interfaces de usuario), Gemini 2.5 Pro y Flash (modelos de IA mejorados con capacidades avanzadas de razonamiento y codificación, incluyendo el modo "Deep Think" para tareas complejas), Veo 3 (modelo de generación de video que produce contenido cinematográfico de alta resolución con audio sincronizado y realista).

Estas innovaciones reflejan el compromiso de Google con la integración de la inteligencia artificial en el desarrollo de software, ofreciendo herramientas que agilizan y enriquecen el proceso para los desarrolladores.

Boletín 10 - Mayo 2025

61

La mejor IA gratuita sin conexión para la generación de vídeos (¡Resultados increíbles!)

El artículo de GeekSociety destaca a VACE, una herramienta de código abierto desarrollada por Alibaba, como una de las mejores opciones gratuitas para la generación de videos con inteligencia artificial sin necesidad de conexión a internet.

Características principales de VACE

  • Funcionamiento local y gratuito: VACE se ejecuta directamente en computadoras personales sin requerir conexión a internet ni hardware de alto rendimiento, siendo ideal para usuarios con recursos limitados.
  • Basado en Wand 2.1: Utiliza el modelo Wand 2.1 de Alibaba, lo que permite generar videos de alta calidad a partir de descripciones en lenguaje natural.
  • Sin restricciones de contenido: A diferencia de otras herramientas, VACE no impone censura, brindando a los creadores libertad total para materializar sus ideas.

Experiencia del autor

El autor relata cómo, con una laptop de 16 GB de VRAM, logró crear videos como gatos bailando breakdance o chicas de anime luchando con espadas, todo sin conexión a internet. Destaca la facilidad de uso y la potencia de VACE para transformar ideas creativas en videos realistas sin depender de servicios en la nube o equipos costosos.

Boletín 10 - Mayo 2025

62

Boletín 10 - Mayo 2025

63