Septiembre - 2024
Número 2


Red Educativa Digital Descartes
Córdoba (España)
descartes@proyectodescartes.org
https://proyectodescartes.org

Revista Digital Red Descartes
https://proyectodescartes.org/revista/index.html






Esta obra está bajo una licencia Creative Commons 4.0 internacional: Reconocimiento-No Comercial-Compartir Igual.

CONTENIDO

CONTENIDO

OpenAI-o1 Mini y la bandeja paisa

Una nueva serie de modelos de razonamiento para resolver problemas difíciles. Disponible a partir del 9 de septiembre (OpenAI).

Con este anuncio, OpenAI pareciera que daba entrada a la tan cacareada strawberry; sin embargo, advierte que es un modelo preliminar, que no cuenta con muchas de las funciones que hacen que ChatGPT sea útil, tales como el navegar por la web en busca de información y cargar archivos e imágenes, recomendando GPT-4o para muchos casos comunes. Por otra parte, solo los usuarios de ChatGPT Plus y Team podrán acceder a estos modelos.

Acceso a los modelos en You.com en la versión paga

Pudimos probar la versión mini en Hugging Face, con la siguiente indicación:

¿Cuál es la comida típica colombiana más famosa? Haz una descripción de esta comida y genera una imagen

Nos dio como respuesta: "Una de las comidas típicas más famosas de Colombia es la bandeja paisa, originaria de la región de Antioquia, este plato es emblemático de la gastronomía colombiana y refleja la

Boletín 2 - septiembre 2024

riqueza y diversidad de sus ingredientes", haciendo una excelente descripción de los ingredientes; sin embargo, con la generación de la imagen, la advertencia de OpenAI fue comprobada, pues no fue generada. No obstante, en lugar de la imagen, presentó una excelente descripción, que usaremos en este boletín.

Imagina una amplia bandeja rectangular dispuesta con esmero: en un lado, una porción generosa de arroz blanco es acompañado por una cuenco de frijoles rojos humeantes. Al lado, se encuentran unas jugosas piezas de carne a la parrilla y chorizos dorados que desprenden un aroma irresistible. Una arepa dorada y esponjosa descansa junto a rodajas de aguacate verde y cremoso. En el centro, un huevo frito con la yema ligeramente líquida añade un toque delicado, mientras que los plátanos maduros fritos, caramelizados y dorados, aportan un contraste de sabor dulce. Finalmente, una pequeña taza de hogao se presenta como acompañamiento, completando la composición con su vibrante color rojo. La presentación es colorida, abundante y apetitosa, reflejando la riqueza cultural y culinaria de Colombia.

Tal como lo sugiere OpenAI, recurrimos a ChatGPT-4o, con la misma indicación anterior, obteniendo:

La comida típica colombiana más famosa es la bandeja paisa, un plato icónico de la región de Antioquia, aunque se disfruta en todo el país. Es una comida abundante y llena de sabor, ideal para quienes buscan una experiencia culinaria completa.


A continuación, nos da los ingredientes: Arroz blanco, frijoles rojos cocidos en caldo, carne molida o desmechada, chicharrón (panceta de cerdo frita), huevo frito, plátano maduro frito, arepa (pequeño pan de

Boletín 2 - septiembre 2024

maíz), chorizo antioqueño, aguacate en rodajas, hogao (salsa a base de tomate y cebolla). A veces, también incluye morcilla y tajadas de tomate.

Y, finalmente, genera una imagen. Pero, antes de mostrar la imagen generada por ChatGPT-4o, presentamos una foto real de la bandeja paisa, que sirva como referente para comparar con otras imágenes y videos de este boletín:

Bandeja paisa (foto real)

Siguiendo con ChatGPT-4o, nos dice: "aquí tienes una imagen de la bandeja paisa, uno de los platos más representativos de la

Boletín 2 - septiembre 2024

gastronomía colombiana. Como se puede apreciar, incluye una variedad de ingredientes tradicionales que hacen de este plato una experiencia deliciosa y nutritiva. ¡Espero que te guste!

Bandeja paisa (imagen generada por ChatGPT).

Una buena aproximación de ChatGPT-4o, en la que se observan los frijoles, el huevo frito, las arepas, el chorizo, el aguacate, el hogao y el arroz.

En un próximo boletín, esperamos que podamos presentar una imagen de la bandeja paisa, generada por OpenAI-o1.

Boletín 2 - septiembre 2024

Wildwest y la bandeja paisa

El diseño de páginas web con IA, es algo sencillo de realizar con una indicación sencilla. Por ejemplo, en Websim ingresamos el siguiente prompt: "Cree una página de destino responsiva para recetas de platos colombianos con un diseño moderno y minimalista. Incluya secciones para mejores platos, regiones y un formulario de contacto. Incluya, además, ventanas emergentes con información sobre ingredientes y preparación del plato, las ventanas emergentes aparecen al hacer clic en la imagen del plato", obteniendo (haz clic sobre la imagen):

Página web sobre platos típicos colombianos

Boletín 2 - septiembre 2024

Casualmente, nos topamos con otra herramienta de IA que, similar a WebSim y v0 de Vercel, crea páginas web. Se trata de wildwest.gg, un salvaje oeste que fue creado con un único objetivo: "crear juegos". Seguramente, los usuarios de la herramienta nos estén mirando con asombro, pues nos atrevimos a diseñar un cuestionario de epidemiología y una página web gastronómica sobre los "Sabores de Colombia" (ver resultado en la página siguiente), sobre las cuales ya hemos obtenido algunos pulgares hacia abajo.

Pero, más allá de la violación de este culto sagrado, observamos que obtener el diseño de una página web con WildWest es bastante sencillo, basta ingresar la indicación en el cuadro de texto, que dice:

Build a new game by describing your idea in detail...

Algo que hicimos con el prompt anterior: "Cree una página de destino responsiva para recetas de platos colombianos...". Lo curioso es que el primer plato que muestra, al igual que WebSim, es:

La bandeja paisa

La bandeja paisa es el plato insignia de la gastronomía antioqueña y uno de los platos más representativos de Colombia. Es propio de los departamentos de la región Paisa: Antioquia, Caldas, Risaralda y Quindío. Una de las características fundamentales de este plato es su abundancia, tanto en cantidad como en variedad de alimentos, de tal modo que la bandeja paisa completa solo cabe servirla en platos grandes llamados bandejas (Wikipedia).

Las imágenes mostradas en las páginas web generadas por WebSim y WildWest fueron obtenidas con Flux [Schnell] que, en algunos platos, difiere significativamente de los reales.

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

La mejor IA para crear videos

Minimax AI es una plataforma de inteligencia artificial desarrollada por la empresa china MiniMax . Ofrece herramientas impulsadas por IA, en particular para generar videos de alta resolución a partir de indicaciones de texto utilizando su modelo Video-01. La plataforma es accesible a nivel mundial y solo requiere el registro de un número de teléfono móvil.

La herramienta es parte de un ecosistema creciente de plataformas de creación de videos impulsadas por IA, similar a otras como Adobe Firefly, kling ai y vidu studio, que están orientadas a los creadores de contenido que buscan una producción de videos rápida y eficiente.


A la fecha (13/09/2024), Minimax AI Video-01 es totalmente gratuita, admitiendo indicaciones en inglés y chino. Actualmente admite videos de hasta seis segundos de duración y está previsto que se extiendan a diez segundos. Los videos se generan con una resolución de 1280 × 720 píxeles.

Los usuarios pueden crear una amplia variedad de contenidos, incluidos vídeos con personalidades conocidas, diferentes estilos artísticos e incluso superposiciones de texto. Sin embargo, el

Boletín 2 - septiembre 2024

contenido explícito está restringido y todos los vídeos generados incluyen una marca de agua.

Ingresamos el prompt que nos generó OpenAI-o1 Mini: "Imagina una amplia bandeja rectangular dispuesta con esmero: en un lado, una porción generosa de arroz blanco es acompañado por una cuenco de frijoles rojos...", tanto en inglés como en chino, obteniendo de este último, el siguiente video:

Vídeo
Bandeja paisa generada por Minimax AI Video-01.

Se destacan los siguientes ingredientes de la bandeja paisa: huevo frito, arroz blanco, chorizos y el aguacate, algunas imágenes tratan de mostrar una arepa y el hogao.

Boletín 2 - septiembre 2024

LLaMA 3.1 al ritmo de SambaNova

SambaNova Systems, proveedor de los chips y modelos de IA más rápidos y eficientes, ha anunciado SambaNova Cloud, el servicio de inferencia de IA más rápido del mundo habilitado por la velocidad de su chip SN40L AI. Los desarrolladores pueden conectarse hoy de forma gratuita a través de una API -sin lista de espera- y crear sus propias aplicaciones de IA generativa utilizando tanto el modelo más grande y capaz, Llama 3.1 405B, como el rapidísimo Llama 3.1 70B. SambaNova Cloud ejecuta Llama 3.1 70B a 461 tokens por segundo (t/s) y 405B a 132 t/s con total precisión (Masterbitz, 11/09/2024).


¡Realmente rápido! Hicimos una prueba con la siguiente indicación: "Dame la historia sobre el origen de 'La bandeja paisa', incluye referencias". LLaMA 3.1 8B dio la respuesta en 1.26 segundos y LLaMA 3.1 405B en 6.62 segundos; sin embargo, no quedamos satisfechos con las respuestas, las cuales coinciden en:

La bandeja paisa se cree que nació en la región de Antioquia, específicamente en la ciudad de Pereira, en el siglo XIX. En ese momento, la región era un importante centro comercial y agrícola, y la comida era una forma de unir a la gente y celebrar eventos importantes.

Existe una versión más aceptada, pero referida al nombre del plato, que tuvo su origen en 1950 en una reunión para crear el manual de platos típicos colombianos.

Boletín 2 - septiembre 2024

Este nombre nace en Bogotá en 1950 en una reunión de Cotelco (Asociación Hotelera y Turística de Colombia), cuando sus delegados creaban su manual de platos típicos colombianos y se encontraron con que en Antioquia aún no existía un plato típico, había uno llamado 'seco' y ellos decidieron llamarlo 'bandeja paisa' (Radio Nacional de Colombia).


En realidad, no es el "seco" el que da su origen, sino el envuelto antioqueño o "fiambre", que empacaban los campesinos para sus largas jornadas.

Fiambre o envuelto en hojas de plátano.

El ‘fiambre’ siempre ha estado incorporado al ADN del arriero antioqueño, del jornalero del campo o del recolector de café (Medellín turístico).

Boletín 2 - septiembre 2024

¡Reflection! El sokal de las IA

Un poco de contexto... sobre Sokal.

Alan Sokal.

El escándalo Sokal fue un famoso engaño logrado por el físico Alan Sokal para exponer al equipo editorial de la revista académica de humanidades Social Text, con el fin de poner de manifiesto la falta de rigor y evaluación que manejan este tipo de revistas a la hora de aceptar trabajos para su publicación.

En 1996, Sokal, profesor de física en la Universidad de Nueva York, envió un artículo pseudocientífico para que se publicase en la revista Social Text. Pretendía comprobar que una revista de humanidades «publicará un artículo plagado de sinsentidos, siempre y cuando: a) Suene bien; y b) Apoye los prejuicios ideológicos de los editores (contra las ciencias empíricas)».

El artículo «Transgressing the Boundaries: Towards a Transformative Hermeneutics of Quantum Gravity» («La transgresión de las fronteras: hacia una hermenéutica transformativa de la gravedad cuántica»), se publicó en el número de primavera/verano de 1996 de Social Text y sostenía la asombrosa tesis de que la gravedad cuántica era un constructo social; es decir, que la gravedad existe solamente porque la sociedad se comporta como si existiera, por lo tanto si no se creyera en ella no tendría efecto.

El mismo día de su publicación, Sokal anunciaba en otra revista, Lingua Franca, que el artículo era un engaño.

Boletín 2 - septiembre 2024

El 7 de septiembre tuve acceso al artículo ¡El mejor LLM del mundo ahora es de código abierto!", publicado por Medium, anunciando el nuevo modelo de lenguaje abierto "Reflection", creado a partir del modelo LLaMA 3.1 70B, superando a ChatGPT-4o, Claude 3.5 Sonnet y a Gemini 1.5 en varios puntos de referencia. A partir de esta información, publiqué el siguiente video:

Vídeo
Reflection - Llama 3.1-70B.

Realmente no se trata de una obra derivada de LLaMA 3.1 70B. Días después, se descubrió el engaño, pues Matt Shumer realmente usó Claude 3.5 Sonnet; sin embargo, pese al engaño, parece que el enfoque de Shumer y su equipo, puede tener un alto potencial.

En deepinfra, ya no se puede probar el modelo.

A veces tenemos que tomar la difícil decisión de descontinuar un modelo (deepinfra).

Boletín 2 - septiembre 2024

La mirada miope de LLaVA V1.5 7B versus la mirada profunda de ChatGPT-4o

Nos complace anunciar que LLaVA v1.5 7B (llava-v1.5-7b-4096-preview), un modelo visual de vanguardia, ya está disponible en la consola para desarrolladores de GroqCloud™. Esto marca un hito importante para GroqCloud, ya que ampliamos nuestro soporte a tres modalidades: imagen, audio y texto. Con LLaVA v1.5 7B, los desarrolladores y las empresas pueden aprovechar el enorme potencial de la IA multimodal, lo que permite aplicaciones innovadoras que combinan entradas visuales, auditivas y textuales (groq).

Es importante comprender, que LLaVA V1.5 7B es un modelo pequeño o corto (SML) que, obviamente, no compite con la visión computacional que tienen modelos largos como ChatGPT-4o; sin embargo, hicimos el ejercicio con la bandeja de la figura 6, pidiendo a LLaVA V1.5 7B que describiera el contenido de la bandeja, obteniendo:

La imagen muestra un plato de comida variada, que incluye carne, huevos, arroz, beans, y aguacate. Hay varios huevos, algunos de los cuales están fritos, y se encuentran en diferentes partes del plato. Además, hay un trozo de carne y arroz en el plato. La comida está servida en un plato grande y se encuentra en una mesa.

Podríamos concluir que tuvo una buena aproximación, pese a alucinar con huevos inexistentes.

Boletín 2 - septiembre 2024

Bandeja paisa en el municipio antioqueño de Guatapé.

Por su parte, ChatGPT-4o nos dio la siguiente descripción:

La imagen muestra un plato típico conocido como Bandeja Paisa, un plato tradicional de la región paisa en Colombia. El plato incluye los siguientes elementos: Fríjoles rojos en salsa, chicharrón (trozo de piel de cerdo frita), chorizo (embutido típico), carne molida, arroz blanco, sobre el cual hay un huevo frito, plátano maduro frito, arepa (una pequeña tortilla de maíz), aguacate (rodaja de aguacate), ensalada de repollo y zanahoria. Es una comida muy completa y tradicional, conocida por su abundancia y variedad de ingredientes.

¡Increíble! Por poco nos da el nombre del restaurante.

En la siguiente página, pusimos cinco platos, haz clic sobre las imágenes, para ver la descripción dada por ChatGPT.

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

Novedades en IA generadoras de imagen

Personaje consistente.

Novedades

  • Se agregó un modo de invitado, que permite el acceso directo sin iniciar sesión.
  • Se lanzó el modelo universal de alta calidad "SeaArt Infinity".
    Pruébelo rápidamente a través del Estudio o el Modo Fácil.
  • Se renovó el Estudio para brindar funciones más innovadoras.
  • Se agregó una función rápida de personaje de IA en la página de resultados de creación.
  • Se optimizó la interfaz de usuario para algunas interfaces.

SeaArt combina la creación y edición de imágenes en una, lo que le permite lograr creaciones de alta calidad sin esfuerzo.

Boletín 2 - septiembre 2024

Mage ha añadido 15 conceptos de IA divertidos y gratuitos.

Bandeja paisa según mage.

Mage es una herramienta poderosa y sin restricciones que da rienda suelta a tu creatividad. Es rápida, gratuita y utiliza inteligencia artificial de última generación para generar todo lo que puedas imaginar. Con una gama de modelos de IA como Stable Diffusion, Analog, DreamShaper y más, Mage ofrece fotorrealismo, arte 3D, fantasía y otras funcionalidades. Puedes ajustar configuraciones como la relación de aspecto, los pasos y la privacidad, lo que te da un control total.

Boletín 2 - septiembre 2024

AIEASE es una excelente herramienta para cambio de cara. Hemos usado el personaje consistente de SeaArt.ai, con diferentes estilos y escenarios, obteniendo:

Boletín 2 - septiembre 2024

Letz.AI es una herramienta impulsada por IA para crear imágenes que ha ganado popularidad en el campo del arte digital. Considérelo su propio artista de IA, capaz de ilustrar vívidamente sus ideas más imaginativas con unas pocas palabras simples (Filipa Kinomoto ).


Bandeja paisa, desde el modelo @gromperekichelcher.

En este mes, ha sido lanzado Letz.AI v3, incluyendo ahora compatibilidad con varios idiomas, mayor velocidad, mejor calidad de imágenes, oferta más amplia de estilos artísticos para elegir, consistencia con el estilo elegido y posibilidad de entrenar nuestro propio modelo. Para el ejercicio, usamos el modelo@gromperekichelcher y el prompt: "Retrato cinema- tográfico de @grompere- kichelcher con una amplia bandeja rectangular dispuesta con esmero: en un lado, una porción generosa de arroz blanco es acompañado por una cuenco de frijoles...", obteniendo una imagen en la que muestra bien los frijoles, el arroz, el huevo frito, los chorizos y el aguacate.

Boletín 2 - septiembre 2024

RenderNet es otra herramienta similar a AIEASE. Hemos usado una foto de un hijo de los colaboradores de este boletín, con diferentes estilos y escenarios, obteniendo:

Boletín 2 - septiembre 2024

A finales de agosto, Google anunciaba dos novedades. La primera de ellas, Gems, para usuarios de Gemini Advanced. La segunda, Imagen 3, aparece en el mes de septiembre, como el nuevo modelo de generación de imágenes, que se puede usar en Gemini (versión gratuita) y disponible en español.

Iniciamos la generación de imágenes con algunos prompts pero, para nuestra sorpresa, existen bastantes limitaciones y, en algunos casos, censura injustificada. Algunos mensajes obtenidos, fueron los siguientes:

Bandeja paisa, generada por Imagen 3.

Todavía estoy aprendiendo a generar algunos tipos de imágenes. Tampoco puedo crear imágenes que vayan en contra de mis directrices.

Pronto se podrán generar imágenes de personas en Gemini Advanced.

Con el prompt de la bandeja paisa, el resultado es bastante bueno para ingredientes como el arroz blanco, el cuenco de frijoles, las piezas de carne a la parrilla, los chorizos dorados, las arepas, faltando las rodajas de aguacate y el huevo frito, sorprende la imagen con los plátanos maduros fritos, caramelizados y dorados.

Boletín 2 - septiembre 2024

La aceptación del nuevo modelo de generación de imágenes Flux, desarrollado por Black Forest Labs, el equipo detrás de Stable Diffusion, sigue en aumento. Esta herramienta de inteligencia artificial de código abierto se destaca en la creación de imágenes detalladas y altamente realistas a partir de indicaciones de texto. Hay tres versiones del modelo, incluidas Flux Dev para experimentación, Flux Schnell para generación rápida de imágenes y Flux Pro para resultados de alta calidad. El cambio a Flux por diferentes herramientas de IA, viene creciendo, entre ellas Pickaxe, WebSim, KREA y Gamma.

En el siguiente video, presentamos algunos ejercicios, entre ellos, una comparación entre Flux y DALL-E 3.

Vídeo
Flux versus DALL-E 3.

Boletín 2 - septiembre 2024

¡Notaste el estilo particular de los títulos anteriores? Los hemos creado con una aplicación generada por WebSim: WebSim Logo Generator.

En el siguiente video, explicamos como usarla:

Boletín 2 - septiembre 2024

Kling AI le responde a Minimax


🎉¡Kling AI da la bienvenida a otra actualización de versión! ¡Se lanzó oficialmente el nuevo modelo Kling 1.5! 🎬¡Ahora admite la generación de videos HD de 1080p en modo profesional! ¡🏃♀️Presentamos la nueva función Motion Brush, que mejora la capacidad de control de sus imágenes! (@Kling_ai).


Esta nueva versión de Kling AI, solo funciona en el plan pago. En el siguiente objeto interactivo presentamos tres videos de Kling AI, los dos primeros con audio y el tercero generado con la versión 1.0:

Boletín 2 - septiembre 2024

Convierte tu blog en una infografía

Una novedad, de este mes, es el aumento de plantillas en la herramienta de IA: Infography. Generamos varias infografías a partir del blog "Rincón del riesgo" en la entrada Navegando entre los riesgos de la Internet, publicado en 2008. Los resultados se observan en la siguiente página (con la rueda del ratón se puede aumentar la imagen).

Dado que el plan libre se agota con un número muy limitado de infografías, recurrimos a WebSim con la misma información del blog, obteniendo una infografía interactiva:

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

Aprovechamos este modelo, con una ligera variación en el diseño, para una infografía de platos típicos colombianos:

Boletín 2 - septiembre 2024

La Revolución de la Inteligencia Artificial Generativa en China

En los últimos años, China ha emergido como un actor clave en la carrera por el desarrollo de inteligencia artificial (IA), y dentro de este ámbito, las IA generativas han ganado una relevancia particular. Con avances significativos impulsados tanto por el sector privado como por instituciones académicas, China ha lanzado modelos de IA generativa que compiten a nivel global, como WuDao de la Academia de Inteligencia Artificial de Pekín, Ernie Bot de Baidu y Pangu de Huawei. Estos modelos no solo están diseñados para procesar y generar lenguaje natural, sino también para integrarse en aplicaciones multimodales que abarcan desde la creación de contenido hasta la investigación científica y la interacción conversacional. En este mes se destacan las siguientes novedades:

El nuevo modelo "KLING 1.5, que incluye impresionantes videos HD de 1080p optimizados para pantallas grandes, un movimiento más natural y una mejor capacidad de respuesta del texto.

La nueva versión, lanzada en septiembre de 2024, DeepSeek-V2.5, es una versión mejorada de DeepSeek-V2 que integra las capacidades generales y de codificación de DeepSeek-V2-Chat y DeepSeek-Coder V2-Instruct.

🚀¡Ya lanzaron DeepSeek 2.5! Un poderoso MOE con 238B de parámetros con 160 expertos y 16B de parámetros activos (@deepseek_ai).

En la siguiente página, presentamos una infografía interactiva con las principales IA generativas chinas.

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

Nueva IA Automática para crear
HISTORIAS en YouTube

¡Estamos encantados de presentar Mootion Storyteller! Ahora puedes crear cualquier tipo de video atractivo sin esfuerzo. Usa indicaciones de texto o tu guion para generar guiones gráficos, elementos visuales y videos finales, todo a tu disposición (@Mootion_AI).

Mootion AI otorga a todos los usuarios plan gratuito para siempre con 200 créditos que se renuevan cada mes. En nuestros ejercicios con esta IA generadora de storytelling, hemos creado cinco videos sobre diferentes historias. Cada video consume 20 créditos, lo que significa que cada mes, podemos generar 10 videos gratuitamente.

Si bien Mootion puede generar prácticamente videos que cubran cualquier tema y sean adecuados para todas las plataformas de contenido principales, se sugieren algunas categorías como ficciones, datos curiosos, vídeo histórico, vídeo educativo, cuentos para dormir o historias de ciencia ficción.

Mootion Storyteller genera todas las piezas faltantes para las principales plataformas de contenido. Simplemente puedes copiar el resumen (descripción en YouTube), agregar hashtags generados con videos finales y hacer una publicación en un santiamén (Mootion AI).

A continuación, presentamos dos videos generados con Mootion Storyteller. Dada su duración, YouTube no los incluyó como shorts (menor de 60 segundos).

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

Boletín 2 - septiembre 2024

Hermes 3: primer modelo Llama 3.1 405B con ajuste fino (no es Reflection)

Hermes 3 contiene capacidades avanzadas de retención de contexto a largo plazo y conversación multi-turno, habilidades complejas de interpretación de roles y monólogo interno, y una función de llamada de agente mejorada. Nuestros datos de entrenamiento alientan agresivamente al modelo a seguir las indicaciones del sistema y las instrucciones de manera exacta y adaptativa. Hermes 3 fue creado mediante el ajuste fino de Llama 3.1 8B, 70B y 405B, y el entrenamiento en un conjunto de datos de respuestas generadas principalmente de manera sintética. El modelo cuenta con un rendimiento comparable y superior al de Llama 3.1, al tiempo que desbloquea capacidades más profundas en razonamiento y creatividad (Nous Research).

Los modelos optimizados para instrucciones (o “chat”) se han convertido en la forma principal en la que la mayoría de las personas interactúan con modelos de lenguaje grandes.

Hermes 3 de Nous Research es un gran avance en los modelos de instrucción generalistas, que ofrece avances en los modelos de lenguaje y capacidades versátiles de IA. Hermes 3 contiene retención de contexto a largo plazo avanzada y capacidad de conversación de múltiples turnos, juegos de roles complejos y habilidades de monólogo interno, como afirman los desarrolladores. Los datos de entrenamiento de Hermes 3 alientan agresivamente al modelo a seguir el sistema y las indicaciones de instrucción de manera exacta y adaptativa (Research Graph).

Este modelo lo podemos probar en Huggin Face o en Lamda ChatLambda es una empresa de infraestructura de IA que nació de las cenizas de una aplicación de reconocimiento facial de terceros para Google Glass, mientras que Nous Research es una startup de investigación de IA que se centra en la creación de "código abierto potente y modelos de lenguaje grandes y eficientes"..

Boletín 2 - septiembre 2024

Otra plataforma en la que podemos probar Hermes 3 es OpenRouterOpenRouter usa varios modelos a la vez, tanto libres como de pago, a la fecha (19 de septiembre de 2024), incluye Reflection-Llama-3.1-70B. En esta plataforma, le dimos varias indicaciones, tipo razonamiento, a Hermes 3. En el siguiente video, mostramos los resultados.

En ollama podemos descargar los modelos 8B (4.9 GB) y 70B (43GB) en diferentes cuantizaciones, para usarlos en local.

Boletín 2 - septiembre 2024

LoudMe: generador de música con inteligencia artificial gratuito

LoudMe es un generador de música que, a la fecha (19 de septiembre de 2024), es 100% gratuito. Además de generar música, permite la descarga de efectos de sonido; por ejemplo, los siguientes audios fueron descargados de LoudMe (haz clic en cada emoji):

LoudMe se basa en sofisticados algoritmos de inteligencia artificial capaces de interpretar indicaciones textuales para generar música que se ajuste a las preferencias de los usuarios. El ingenio de LoudMe radica en su capacidad para analizar estas indicaciones y crear música que no solo se ajuste a criterios específicos, sino que también tenga un toque personal único que a menudo falta en las composiciones generadas por computadora (Joey Geller).

Como ejercicio, le pedimos ChatGPT-4o que nos diera la letra de una canción sobre "Un hombre leyendo un boletín que muestra las últimas novedades de las IA generativas". Le dimos la letra a LoudMe y le pedimos estilo pop, obteniendo (haz clic sobre la imagen):

Boletín 2 - septiembre 2024

Dale play al audio, para que oigas y leas la canción.

Boletín 2 - septiembre 2024

Not Diamond: enrutador de modelos

Not Diamond AI es un enrutador que determina automáticamente qué LLM es el más adecuado para responder a cualquier consulta, mejorando la calidad de salida del LLM al combinar múltiples LLM en un metamodelo que aprende cuándo llamar a cada LLM (incluye el modo Arena. Hicimos 10 preguntas que mostramos en las siguientes tarjetas didácticas, con el modelo seleccionado por Not Diamond.

Boletín 2 - septiembre 2024

Novedades para investigadores

Para este mes, traemos dos novedades que serán útiles para los académicos investigadores.

Consensus ha incorporado Ask Paper, que permite chatear con artículos en formato PDF, haciendo preguntas aclaratorias sobre la metodología, gráficos específicos y mucho más. En el siguiente video, mostramos cómo usar esta característica.

Haz clic en el logo de Consensus, para chatear con algún artículo.

Chatea con

Boletín 2 - septiembre 2024

Paperguide ofrece un plan gratuito, que incluye: 10 generaciones de IA por día, 500 MB de almacenamiento, asistente de investigación de inteligencia artificial. gestor de referencias, resúmenes de IA, charla con artículos de acceso abierto, chat con la Biblioteca de Referencia, más de 1000 estilos de citas y chatear con PDF.

Paperguide es una plataforma impulsada por IA que agiliza el proceso de investigación. Ayuda a los usuarios a descubrir y leer artículos de investigación más rápido mediante chat y resúmenes, realizar revisiones bibliográficas exhaustivas, administrar y organizar referencias, mejorar la redacción académica (Hans Le Roy).

Posibilidad de chatear con varios archivos.

Herramienta Ask AI, similar a Consensus.

Boletín 2 - septiembre 2024

Los podcast realistas de NotebookLM

NotebookLM puede resumir documentos, responder a preguntas sobre ellos e incluso transformarlos en sesiones informativas, guías de estudio o podcasts (Data AI).


El 4 de junio de 2024, Google lanza su nuevo "NotebookLM" para más de 180 regiones donde está disponible la API de Gemini. El 11 de septiembre de 2024, presenta Audio Overview, una nueva forma de convertir tus documentos en interesantes debates en audio, en el que dos anfitriones de IA inician un debate en profundidad basado en las fuentes que hayamos subido en algún cuaderno. En el siguiente video lo explicamos:

Vídeo

Boletín 2 - septiembre 2024

Hicimos un ejercicio similar con el contenido del presente boletín, obteniendo un podcast cercano a los 8 minutos; sin embargo, en lugar de TurboScribe, usamos la herramienta de IA VEED, la cual nos transcribió el podcast en español, generando el siguiente video:

En el plan libre, pudimos incluir una onda sonora y la imagen de fondo que, obviamente, es la bandeja paisa.

Para terminar este boletín, presentamos algunos avances del boletín de octubre.

Boletín 2 - septiembre 2024

Cuatro novedades para octubre.

Boletín 2 - septiembre 2024