CONTENIDO
04 | Halloween con WebSim |
05 | Halloween con Bolt |
07 | Una historieta tenebrosa con LTX Studio |
09 | Cambiando la cara de la bruja con Vidwud |
11 | Un embrujado ensayo de Napkin |
13 | Los modelos de base líquida de una spin-off del MIT |
16 | En el mes de lo brujitos surge Flux 1.1 |
18 | Los brujitos con efectos alucinantes en Pika 1.5 |
CONTENIDO
19 | Búsqueda mundial de brujitos con Felo |
23 | Halloween con Pitch |
24 | Novedades en modelos de lenguaje: Pixtral y LLaMA 3.2 |
27 | Novedades en modelos de generación de imágenes y videos |
43 | DeepSeek-V2.5, el mejor LLM de código abierto del mundo |
46 | Embrujados con Pollinations.ai |
52 | Stability AI como ave Fenix se regenera con Stable Diffusion 3.5 |
54 | El nuevo Claude 3.5 Sonnet y Claude 3.5 Haiku |
Siguiendo con la idea de un boletín temático del boletín anterior, para este número hemos seleccionado como tema "la noche de los brujitos" o "Halloween". Para ello, le hemos pedido a ChatGPT4-o que nos generara el prompt, obteniendo:
An eerie, moonlit Halloween night in a haunted forest. A dark, twisted tree stands in the foreground, with ghostly figures swirling around its branches. In the distance, a glowing jack-o'-lantern sits on an ancient stone altar, casting a faint orange light. Bats swoop through the misty sky, and a mysterious witch on a broomstick flies across the full moon. The scene is shrouded in fog, with shadows creeping between gravestones and skeletons rising from the ground.
Prompt que traducido al español, sería:
Una inquietante noche de Halloween, iluminada por la luna, en un bosque embrujado. En primer plano se alza un árbol oscuro y retorcido, con figuras fantasmales que giran alrededor de sus ramas. A lo lejos, una calabaza resplandeciente se encuentra sobre un antiguo altar de piedra y proyecta una tenue luz anaranjada. Los murciélagos vuelan en picado por el cielo brumoso y una misteriosa bruja en una escoba vuela por encima de la luna llena. La escena está envuelta en niebla, con sombras que se arrastran entre las lápidas y esqueletos que se elevan desde el suelo.
El prompt es bastante descriptivo, el cual se puede incluir como un guión que nos permitirá generar diferentes contenidos, tales como historietas, imágenes, videos y algunas presentaciones de diapositivas. Iniciamos con dos presentaciones generadas por dos herramientas, la primera que ya hemos descrito en el primer boletín y la segunda que surge como novedad en este boletín.
Boletín 3 - Octubre 2024
WebSim presenta varias novedades para este mes; entre ellas, el aumento de 30 a 50 creaciones en el plan libre, incorporación de la IA o1 de OpenAi, cuadro de búsqueda y una vista de tipo interactivo. Usando nuestro prompt, generamos el siguiente presentador:
Boletín 3 - Octubre 2024
En la primera semana de octubre, StackBlitz lanzó Bolt.new, que se suma al creciente ecosistema de asistentes de codificación de IA y capta instantáneamente la atención de los desarrolladores de todo el mundo. En cuestión de días, Internet se inundó de artículos y videos que proclamaban a Bolt.new como el "asesino de cursor AICursor AI es una bifurcación de Visual Studio Code que integra capacidades avanzadas de IA. No lo hemos incluido en este boletín, porque solo incluye dos semanas de prueba, pero no significa que sea una mala opción, la exclusión obedece a que este boletín se centra en herramientas con planes libres más amplios, que permita una mayor generación de creaciones y poder tomar una decisión de pago a futuro. y v0 de Versel".
Boletín 3 - Octubre 2024
En lugar de limitarse a un solo archivo con vista previa, Bolt.new le permite crear y modificar proyectos completos, con dependencias y configuraciones incluidas. Puede implementar estos proyectos directamente en la plataforma StackBlitz, lo que agiliza el proceso desde el desarrollo hasta la producción (Carl Rannaberg).
He aquí una presentación de Halloween, generada por Bolt.new:
Boletín 3 - Octubre 2024
Mediante una combinación de bocetos e indicaciones, Canvas te permite dibujar tu visión y convertirla en un marco totalmente realizado en tu proyecto.
Esta nueva herramienta es lanzada en el mes de septiembre, tal como se muestra en la siguiente imagen:
Boletín 3 - Octubre 2024
La nueva herramienta es un poco más compleja de usar para nuestra historieta, pues hay que diseñar escena por escena. Recurrimos, entonces a suministrar el guion de ChatGPT, obteniendo la siguiente historieta:
Una de las características más destacadas de LTX Studio es su capacidad intuitiva para generar guiones gráficos completos y listas de tomas precisas directamente a partir de guiones de texto. Esta función agiliza el proceso de preproducción y reduce drásticamente el tiempo que tradicionalmente se dedica a la visualización conceptual (Matt Ryan Allen).
Boletín 3 - Octubre 2024
Creemos en un futuro en el que cualquier persona, desde diseñadores profesionales hasta entusiastas ocasionales, pueda aprovechar sin esfuerzo el poder de la IA para mejorar, personalizar y dar vida a su creatividad. Con esta fe, Vidwud ofrece un conjunto de herramientas de imagen y video de IA para la creación, mejora y otros fines de imágenes y videos. Desde la creación de contenido con IA hasta las opciones de edición avanzadas, da rienda suelta a tu creatividad con facilidad en Vidwud.
Esta nueva herramienta, permite cambiar las caras de una foto o de un video.
Boletín 3 - Octubre 2024
Hicimos el ejercicio, generando imágenes de brujas con NightCafé y, luego, cambiando la cara por la de la modelo Daniela Rivera. En el siguiente objeto interactivo, puedes ver cinco imágenes de brujas con cambio de cara con la foto de Daniela.
Boletín 3 - Octubre 2024
Napkin AI es una potente herramienta de inteligencia artificial diseñada para llevar tu proceso creativo al siguiente nivel. Esta aplicación se destaca por su capacidad para generar ideas innovadoras y documentos visualmente impactantes en cuestión de minutos. Ya sea que estés trabajando en un proyecto personal, académico o profesional, Napkin AI te ofrece las herramientas necesarias para integrar imágenes relevantes y mejorar la accesibilidad de tu contenido. Todo esto lo hace con una simplicidad asombrosa, permitiéndote enfocarte en lo que realmente importa: tu creatividad (IteraLAB).
A continuación, presentamos un ensayo generado por Napkin, a partir del prompt de ChatGPT.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
Anunciamos la primera serie de Liquid Foundation Models (LFM), una nueva generación de modelos de IA generativa que logran un rendimiento de última generación a todas las escalas, al tiempo que mantienen una huella de memoria más pequeña y una inferencia más eficiente (Liquid).
Los tres LFM 1.3B, LFM 3B y, en especial, el modelo LFM 40B MoE, en lugar de utilizar el mismo tipo de cerebro artificial que otros modelos de IA, utilizan algo llamado Red Neural Líquida. Este nuevo cerebro puede hacer el mismo trabajo con menos “células cerebrales” (llamadas neuronas) (Ashish Kumar Singh).
Estos modelos están en capacidad de:
El rendimiento de LFM-40B es comparable al de los modelos más grandes que él, mientras que su arquitectura MoE permite un mayor rendimiento e implementación en hardware más rentable (ver Figura 34).
Boletín 3 - Octubre 2024
Como ejercicio, probamos con la pregunta ¿Cuál es el origen del Halloween? en ChatGPT4-o, LFM-40B y en LLaMa 3 70B.
ChatGPT4-o El origen de Halloween se remonta a la antigua festividad celta de Samhain, celebrada el 31 de octubre para marcar el final del verano y el inicio del invierno en las culturas de Irlanda, Escocia y el norte de Francia. Los celtas creían que esa noche el velo entre el mundo de los vivos y el mundo de los muertos se volvía más delgado, permitiendo que los espíritus cruzaran al mundo terrenal. Para protegerse, encendían hogueras y usaban disfraces para ahuyentar a los espíritus malignos. Cuando el cristianismo llegó a estas tierras, la Iglesia Católica adaptó la festividad para que coincidiera con el Día de Todos los Santos o All Hallows' Day (1 de noviembre), lo que llevó a que la noche anterior se conociera como All Hallows' Eve, que más tarde se acortó a Halloween.
Con el tiempo, esta festividad se expandió, especialmente en Estados Unidos, donde se transformó en una celebración centrada en el disfrute infantil, el "truco o trato" (trick-or-treating), los disfraces, y otras actividades como tallar calabazas (jack-o'-lanterns). Hoy en día, Halloween es una festividad popular que mezcla elementos tradicionales y comerciales.
Boletín 3 - Octubre 2024
LFM-40B El origen de Halloween se remonta a la antigua festividad celta conocida como Samhain (pronunciado "sow-in"), que se celebraba en Irlanda, Escocia y Gales. Esta celebración marcaba el final del año celta, que comenzaba con el día de Samhain, alrededor del 1 de noviembre en el calendario actual. Los celtas creían que en la noche del 31 de octubre, los límites entre el mundo de los vivos y el mundo de los muertos se volvían borrosos, permitiendo a los espíritus de los muertos visitar la tierra. Creían que estos espíritus podían causar daño a las cosechas o a las personas, por lo que ofrecían sacrificios y hacían rituales para apaciguarlos.
Con la llegada del cristianismo a Europa, esta festividad fue adaptada y transformada en una celebración religiosa. En el siglo IX, la Iglesia estableció el Día de Todos los Santos el 1 de noviembre para honrar a todos los santos y mártires, tanto conocidos como desconocidos. La víspera de este día, el 31 de octubre, se convirtió en la celebración que conocemos hoy como Halloween.
LLaMa 3.1-70B El origen de Halloween se remonta a la antigua festividad celta de Samhain, que se celebraba el 31 de octubre. Samhain marcaba el final de la temporada de cosecha y el comienzo del invierno, que se consideraba un período de oscuridad y muerte. Los celtas creían que en esta noche, la frontera entre el mundo de los vivos y el de los muertos se volvía más delgada, y que los espíritus de los muertos regresaban a la tierra de los vivos.
Las tres respuestas son correctas. Sorprende una descripción más amplia del modelo LFM-40B comparada con la dada por LLaMa 3.1-70B.
Los enlaces donde se puede probar este modelo, son: Perplexety, Liquid y Lambda.
Nuestro objetivo es explorar formas de construir modelos de base más allá de los transformadores generativos preentrenados como GPT (Liquid)
Boletín 3 - Octubre 2024
FLUX 1.1 [pro] ofrece una generación seis veces más rápida que su predecesor FLUX.1 [pro] y, al mismo tiempo, mejora la calidad de la imagen, la adherencia rápida y la diversidad. Al mismo tiempo, actualizamos FLUX.1 [pro] para generar la misma salida que antes, pero dos veces más rápido (Black Forest Labs Inc.).
Son varias las herramientas de IA que están usando Flux 1.1, pero en planes de pago. A la fecha (15 de octubre), es posible usarlo gratuitamente en deepinfra, together.ai y en glif, en esta última con la posibilidad de generar 20 imágenes diarias; obviamente, es de esperar que esta gratuidad desaparezca o se reduzca, por los costos de generación. En la presentación de diapositivas de la página siguiente, usamos seis herramientas de IA: glif, together, CivitAI, Krea, Freepik y GoEnhance, algunas muy conocidas, excepto por Glif y GoEnhance, esta última incluyendo la herramienta de video a animación, como el ejemplo siguiente:
Boletín 3 - Octubre 2024
Se observa que las imágenes generadas con el modelo Flux.1 son, también, de muy buena calidad. La única diferencia, en este ejercicio, fue la velocidad en la generación de imágenes.
Boletín 3 - Octubre 2024
Pika 1.5 incluye 10 efectos especiales, de los cuales mostramos tres en los siguientes videos (pasa el puntero del ratón sobre ellos).
Derretir | Explotar |
---|---|
Aplastar | Sin efecto |
Pika, en su plan libre, permite el acceso a la versión 1.5, otorgando 150 créditos por mes.
Boletín 3 - Octubre 2024
Felo es el motor de búsqueda perfecto para cualquier persona que desee mantenerse al día con las últimas tendencias, tecnología e información sobre estilos de vida. Es una herramienta poderosa que permite a los usuarios acceder al conocimiento global sin esfuerzo. Su tecnología avanzada, capacidades multilingües e interfaz fácil de usar lo convierten en una herramienta confiable para investigadores, estudiantes y profesionales (Gao Dalie).
A Felo le pedimos responder la pregunta ¿Cómo se celebra el Halloween en México, Colombia, España, Rusia y China?, obteniendo como respuesta:
La celebración de Halloween varía significativamente entre México, Colombia, España, Rusia y China, reflejando las tradiciones culturales y las influencias locales. A continuación, se detalla cómo se celebra en cada uno de estos países (las imágenes fueron obtenidas por otras herramientas de IA):
México
En México, Halloween se celebra el 31 de octubre, pero comparte protagonismo con el Día de los Muertos, que se festeja el 2 de noviembre. Durante este periodo, las calles se llenan de altares, calaveras y decoraciones típicas. Las actividades incluyen:
Boletín 3 - Octubre 2024
Colombia
En Colombia, Halloween es principalmente una celebración para los niños. Las actividades incluyen:
España
En España, Halloween ha ganado popularidad en los últimos años, aunque no es una celebración tradicional. Las características incluyen:
Boletín 3 - Octubre 2024
Rusia
En Rusia, Halloween es considerado una celebración relativamente nueva y no tradicional. Las características son:
Boletín 3 - Octubre 2024
China
En China, Halloween no es una celebración tradicional. Sin embargo, algunas influencias occidentales han comenzado a aparecer:
Cada país tiene su propia forma de celebrar Halloween, influenciada por sus tradiciones culturales y la aceptación de costumbres extranjeras. En México, la celebración es vibrante y se entrelaza con el Día de los Muertos, mientras que en otros países como Rusia y China, Halloween es más una curiosidad comercial que una festividad arraigada.
Boletín 3 - Octubre 2024
Pitch es una herramienta de IA generativa de presentaciones. En su plan gratuito, permite la generación ilimitada de presentaciones (con marca de agua) y exportación a PDF (solo en el plan de pago, permite exportación PPTX).
Usando el prompt de ChatGPT4-o, obtuvimos una presentación de 11 diapositivas ge exportamos a PDF, la cual copiamos, diapositiva por diapositiva, a PowerPoint y, posteriormente, generamos el siguiente video (la música la descargamos de Pixabay, cuyo autor es Music by (AlexGrohl).
Boletín 3 - Octubre 2024
Para los modelos de lenguaje de este apartado, usaremos la siguiente imagen generada por Bing:
La imagen fue generada a partir del siguiente prompt: "El origen de Halloween se remonta a la antigua festividad celta conocida como Samhain (pronunciado "sow-in"), que se celebraba en Irlanda, Escocia y Gales. Esta celebración marcaba el final del año celta, que comenzaba con el día de Samhain, alrededor del 1 de noviembre en el calendario actual. Los celtas creían que en la noche del 31 de octubre, los límites entre el mundo de los vivos y el mundo de los muertos se volvían borrosos".
Boletín 3 - Octubre 2024
La startup francesa de inteligencia artificial Mistral ha lanzado su primer modelo que puede procesar imágenes y texto.
El modelo de 12 mil millones de parámetros, denominado Pixtral 12B, tiene un tamaño de aproximadamente 24 GB. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo.
Pixtral 12B está disponible a través de un enlace de torrent en GitHub y en la plataforma de desarrollo de inteligencia artificial y aprendizaje automático Hugging Face (TechCrunch).
Hemos accedido a la veresión de LE CHAT MISTRAL, obteniendo la siguiente descripción de la imagen:
La imagen presenta una escena de cementerio bajo una luna llena. El cementerio está lleno de cruces y calabazas talladas, lo que añade un ambiente festivo a la escena. En el centro de la imagen, hay una iglesia con una torre de reloj, que se alza alta contra el fondo de la luna. El cielo está lleno de nubes, y se pueden ver murciélagos volando, lo que aumenta el ambiente sombrío. La imagen está dominada por tonos naranjas y amarillos, que crean una atmósfera cálida y acogedora. A pesar de los elementos sombríos, la imagen tiene un sentido de tranquilidad y serenidad.
En la descripción no incluye las calaveras gigantes y, por otra parte, la imagen no tiene una torre de reloj.
Boletín 3 - Octubre 2024
Llama 3.2 es una colección de modelos de lenguaje grandes (LLM) preentrenados y ajustados en tamaños 1B y 3B que son solo texto multilingüe, y tamaños 11B y 90B que aceptan entradas de texto e imágenes y texto de salida (Meta).
Hemos usado la versión de 90B en OpenRouter, obteniendo la siguiente descripción de la imagen:
La imagen parece ser una ilustración de Halloween, ambientada en una noche de luna llena. En el centro se encuentra una iglesia pequeña y oscura, la cual está rodeada de tumbas y calaveras con grabados celtas. En el cielo, dos calaveras gigantes flotan en el aire, mirando hacia la luna. Un grupo de personas, vestidas con túnicas largas y con velos que cubren sus rostros, pueden verse observando la escena en el primer plano de la imagen. El fondo muestra las montañas y un pequeño lago, creando una sensación de misterio y magia relacionados con la festividad.
En este descripción se incluyen las dos calaveras gigantes, además de sorprender con el reconocimiento de los grabados celtas. No hizo descripción de los murciélagos y las calabazas talladas.
En general, se obtuvieron buenas descripciones de la imagen. Obviamente, habría que probar los dos modelos con otro tipo de preguntas; por ejemplo, el número de naranjas, fresas o bananos que hay en una cesta de frutas. Con respecto a la imagen anterior, Pixtral nos dice que hay dos calaveras, mientras que LLaMA 3.2-90B, dice que debido a la plataforma, no puedr proporcionar la cantidad de calaveras.
Boletín 3 - Octubre 2024
En octubre de 2024, las herramientas de IA generadoras de imágenes han alcanzado un nuevo nivel de sofisticación y accesibilidad, consolidando su papel clave en la creación de contenido visual. Este mes, han surgido innovaciones que optimizan la calidad, la personalización y la eficiencia en la generación de imágenes, permitiendo a usuarios desde creativos profesionales hasta principiantes aprovechar estas tecnologías. Entre las novedades más destacadas se incluyen nuevas plataformas que combinan múltiples modalidades, mejoras en la velocidad de procesamiento y la precisión de los resultados, además de herramientas que integran la IA generativa con otras áreas creativas como el video. A medida que avanzamos, estas tecnologías están redefiniendo los límites de la creación artística, brindando una experiencia más intuitiva y cercana a la visión del usuario (introducción generada por ChatGPT4-o).
Dreamina AI es una de las plataformas de generación de imágenes avanzadas desarrolladas por CapCut, diseñada para crear imágenes sorprendentes a partir de indicaciones de texto o imágenes existentes. Ofrece varias funciones que se adaptan a diferentes necesidades creativas, lo que lo hace adecuado para artistas, diseñadores y creadores de contenido (Dira).
A la fecha (16 de octubre de 2024), solo están habilitadas la función texto-imagen y la función lienzo, 100% gratuitas. Las generaciones de video y de música están en versión beta, no habilitadas.
Boletín 3 - Octubre 2024
La aplicación presenta dos modelos: Dreamina v1.4 y Dreamina XL Pro, con este segundo modelo obtuvimos cuatro imágenes, de las cuales presentamos la siguiente:
Imagen que se ajusta al promt dado, excepto por la falta de la bruja.
Con esta imagen como referencia, fuimos al lienzo con la siguiente indicación: "Figuras fantasmales caminan por el sendero del cementerio, rumbo a la iglesia", obteniendo otras cuatro imágenes, de las cuales seleccionamos la siguiente:
Boletín 3 - Octubre 2024
Se observa que se conserva, en parte, la imagen de referencia, incluyendo los nuevos elementos dados en la indicación, como las figuras fantasmales y la iglesia.
La imagen cargada en el lienzo, puede ser intervenida con otras funciones como el outpainting, el enhanced, inclusión de texto y la remoción de fondos.
En general, Dreamina AI se destaca como una herramienta poderosa para generar imágenes de alta calidad de manera rápida y eficiente, satisfaciendo una amplia gama de necesidades artísticas y comerciales (Dira).
Boletín 3 - Octubre 2024
PromeAI no es un generador de imágenes más. Prome AI es capaz de convertir un boceto en una imagen real, de mover elementos dentro de una foto o, incluso, de eliminar ciertos objetos de una instantánea. Por ello, se trata del generador de arte con IA preferido por los arquitectos (Euroinnova).
La novedad de octubre son las 35 herramientas que presenta PromeAI, entre ellas: Sketch Rendering, Region Rendering, Outpanting, imagen o texto a video, AI Architecture Generator, escalador, caricatura, ...
La siguiente imagen, muestra tres edificios generados por PromeAI a partir de un boceto.
Boletín 3 - Octubre 2024
Presentamos dos imágenes generadas usando el prompt de CharGPT4-o y dos videos.
Imagen 1 | Imagen 2 |
---|---|
Video 1 | Video 2 |
---|---|
Boletín 3 - Octubre 2024
Nos encontramos con esta excelente herramienta de IA, en nuestra búsqueda de cómo usar Flux 1.1 sin costo. Surgió, entonces, Glif que, además de generar imágenes gratuitas con Flux 1.1 con otros modelos, incluye otras utilidades, que se observan en la siguiente imagen (las creaciones gratuitas son 20 diarias):
Inicialmente, seleccionamos la opción Imagen Generators, apareciendo varios modelos que podemos usar o, mejor, remezclar (remix). Pero, si el deseo es usar un modelo Flux 1.1, escribimos la palabra Flux en el cuadro de búsqueda y seleccionamos un modelo Flux 1.1.
En la siguiente página, presentamos algunas imágenes obtenidas, usando el prompt de ChatGPT4-o y la descripción dada por LLaMA 3.2-90B. De las 12 imágenes, tres de ellas son animaciones a partir de una imagen y/o un prompt.
Boletín 3 - Octubre 2024
Glif AI ofrece una solución innovadora. Esta potente plataforma te permite crear memes, cómics y personajes con facilidad, sin necesidad de codificación (véase https://standout.digital/).
Boletín 3 - Octubre 2024
Superestudio
Un patio de juegos para acelerar la imaginación.
Una novedad interesente, en este mes de octubre, lo presenta Kaiber, al incluir herramientas como Flux Image y Luma video y, además, el uso de su lienzo (canvas), para crear colecciones, tal como lo explicamos en el siguiente video:
En su plan libre, Kaiber entrega 100 créditos.
En la siguiente página, presentamos dos imágenes y un video generados con Kaiber.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
Si necesitas una herramienta que pueda convertir imágenes estáticas en vídeos de aspecto profesional con un mínimo esfuerzo, Hailuo AI MiniMax es una herramienta que vale la pena probar. Es rápida, intuitiva y ofrece resultados de alta calidad (Jacob Ford).
En el boletín de septiembre, generamos videos a partir de un texto relacionado con la bandeja paisa. En dicho mes, la generación de videos era 100% gratis.
En el mes de octubre ya es posible generar videos a partir de una imagen. Como era de esperarse, surgen los planes de pago, con un mínimo de 10 dólares mensuales, en el plan libre, se otorgan 100 créditos diarios, suficientes para generar dos videos, pues cada uno de ellos consumen 40 créditos.
El generador de videos Hailuo AI está cambiando la creación de contenido al mejorar la eficiencia con tecnología avanzada impulsada por IA. Hailuo AI automatiza el proceso de producción de videos, lo que facilita la edición inteligente de videos. Con el aprendizaje automático, los creadores de videos con IA pueden analizar el contenido y producir rápidamente videos de alta calidad. Esto reduce el esfuerzo necesario para la edición de videos tradicional y garantiza resultados consistentes (https://hailuoai.video/doc/).
Boletín 3 - Octubre 2024
En el siguiente objeto interactivo, presentamos cuatro imágenes y los videos correspondientes, generados por Hailuo AI.
La cuarta imagen, la generamos con Meta AI.
Boletín 3 - Octubre 2024
En este mes Meta AI incluye funciones para crear imágenes y videos.
Boletín 3 - Octubre 2024
El 3 de octubre recibimos un post de X anunciando buenas noticias de Hedra:
¡El personaje-2 (Character-2) ya está aquí! Un nuevo salto generacional para los modelos básicos de audio a vídeo, y nuestro siguiente paso hacia un modelo de personaje completo capaz de inteligencia, emoción y mucho más. Aspectos destacados: Soporte panorámico y vertical: elimina las limitaciones en la relación de aspecto.
Un enorme aumento de la calidad: mayor claridad, más expresivo, sin sacrificar nuestra velocidad líder en su clase. Genera videos de 4 minutos de duración hoy.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
Haiper fue fundada por exalumnos de Google DeepMind, TikTok y los mejores laboratorios de investigación del mundo académico, Haiper aporta un aprendizaje automático de vanguardia y la convicción de que la creatividad debe ser divertida, sorprendente y compartible. En este mes de octubre, es lanzada la versión 2.0, con las siguientes herramientas:
Generamos un video (ver página siguiente), subiendo una imagen PNG (la resolución ideal para las imágenes, según Haiper, es 1280x720, aunque cualquier relación de aspecto funcionará y la imagen se escalará para adaptarse a la resolución.
Tus creaciones representan tu visión y tu voz. En nuestra plataforma, lo que creas es tuyo. Garantizamos que los derechos de propiedad intelectual son solo tuyos, lo que te da la tranquilidad de expresarte y compartir tu trabajo libremente como creas conveniente (Haiper).
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
En el boletín "Novedades de IA generativas" del mes de septiembre, destacamos la buena nueva:
🚀¡Ya lanzaron DeepSeek 2.5! Un poderoso MOE con 238B de parámetros con 160 expertos y 16B de parámetros activos (@deepseek_ai).
Maziyar Panahi, ingeniero principal de IA, ML y datos en el CNRS, reconoció públicamente la capacidad de DeepSeek para establecer referencias y lo posicionó como "el mejor LLM de código abierto del mundo". La nueva versión, lanzada en septiembre de 2024, DeepSeek-V2.5, es una versión mejorada de DeepSeek-V2 que integra las capacidades generales y de codificación de DeepSeek-V2-Chat y DeepSeek-Coder V2-Instruct.
Hemos realizado tres ejercicio, el primero con la indicación: "¿Cuál es el origen del Halloween?", obteniendo:
El origen del Halloween se remonta a la antigua festividad celta llamada Samhain, que se celebraba al final del verano y el comienzo del invierno, aproximadamente el 31 de octubre. Los celtas creían que en esta noche, el "velo" entre el mundo de los vivos y el de los muertos se hacía más delgado, permitiendo que los espíritus de los difuntos regresaran a la tierra.
Durante Samhain, los celtas encendían hogueras, llevaban máscaras y disfraces para ahuyentar a los espíritus malignos, y ofrecían sacrificios a sus dioses. Esta festividad también marcaba el final de la cosecha y el comienzo de un nuevo ciclo agrícola.
Boletín 3 - Octubre 2024
Con la llegada del cristianismo en Europa, los misioneros buscaron reemplazar las festividades paganas con celebraciones cristianas. En el siglo VIII, el Papa Gregorio III designó el 1 de noviembre como Día de Todos los Santos (All Saints' Day) para conmemorar a todos los santos y mártires. La noche anterior, el 31 de octubre, se convirtió en All Hallows' Eve, que más tarde se abreviaría a Halloween.
Con el tiempo, las tradiciones de Samhain y las festividades cristianas se fusionaron, dando lugar a las prácticas modernas de Halloween, como decorar casas con calabazas, disfrazarse, pedir dulces y contar historias de terror. Estas tradiciones se extendieron a América con la inmigración irlandesa y escocesa en el siglo XIX, y desde entonces, Halloween se ha convertido en una de las festividades más populares y comercializadas en todo el mundo.
Una descripción bastante parecida a la dada por ChatGPT4-o (ver
El segundo ejercicio fue con el prompt: "Crea 10 frases que terminen con la palabra manzana", a lo cual respondió:
Boletín 3 - Octubre 2024
Finalmente, le pedimos: "Dame el código HTML5 (HTML+CSS+JS) para un presentador de 10 diapositivas sobre Halloween, el archivo generado debe incluir el código CSS el de JS. Usa pollinations.ai para las imágenes!, obteniendo:
Boletín 3 - Octubre 2024
La plataforma de código abierto Pollinations.ai, ofrece una gran variedad de funcionalidades que la convierten en una valiosa herramienta, para la creación de aplicaciones fáciles de incorporar en páginas web, sin requerir la creación de cuentas.
Por ejemplo, si usamos el siguiente código:
Obtendríamos:
En este caso, usamos la raíz "https://pollinations.ai/p/", acompañada del prompt escrito entre llaves.
Una funcionalidad que podemos agregar es un estilo como comic, watercolor, wintage, Botero, entre muchos otros. Este estilo se
Boletín 3 - Octubre 2024
agrega después del prompt, asi: "https://pollinations.ai/p/ {prompt},estilo"; por ejemplo, para el estilo comic, usaríamos:
Pollinations, como novedad, ha incluido los modelos: flux, flux-realism, flux-cablyai, flux-anime, flux-3d, any-dark, flux-pro y turbo. Esta funcionalidad, además de la configuración de la relación de aspecto y mejora de la imagen, la podríamos escribir así: "https://pollinations.ai/p/ {prompt}, estilo? model=flux & width=300 & height=400 & enhance=true"
Para otras funcionalidades, véase https://github.com/. A continuación, presentamos una aplicación diseñada con estos y otros parámetros de Pollinations.ai y un presentador con algunas imágenes obtenidas, en diferentes estilos.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
Al igual que la aplicación anterior, existen otras herramientas que usan pollinations.ai, como WebSim, FLOW y DynaSpark.
DynaSpark AI es un proyecto innovador creado por Th3-C0der, ofreciendo una experiencia de asistencia personalizada y potente como nunca antes vista. Con una arquitectura avanzada y un conjunto de capacidades impresionantes, DynaSpark AI no se limita a responder preguntas con precisión, sino que también analiza imágenes, audio y archivos de diferentes tipos, genera imágenes a partir de descripciones textuales, proporciona explicaciones detalladas, adapta su estilo de comunicación y se adapta a diferentes tareas, desde la codificación hasta el análisis de datos.
DynaSpark AI utiliza la API de Pollinations.ai para su función de generación de imágenes "DynaSpark Image Generator". Pollinations.ai es una plataforma de código abierto que ofrece acceso a una amplia gama de modelos de IA para diversas tareas, incluyendo la generación de imágenes.
En la siguiente página, puedes practicar con DynaSpark, si deseas generar una imagen usa /image
y luego pones el prompt o, de otra forma, activas el micrófono y dices algo (gato azul, por ejemplo) . DynaSpark, como chatbot, usa Gemini 1.5 Flash.
También, puedes activar Th3-GPT, el cual usa la IA GPT3. En el caso de Jarvis, te sugerimos interactuar en este enlace, usa el micrófono y Jarvis te buscará en la Web, información reñlacionada con lo que le hayas dicho.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
El 22 de octubre, Stability AI presenta Stable Diffusion 3.5:
Hoy presentamos Stable Diffusion 3.5. Esta versión abierta incluye múltiples variantes de modelo, entre ellas Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo. Además, Stable Diffusion 3.5 Medium se lanzará el 29 de octubre (Stability AI).
En marzo de 2024, se daban noticias como "Crisis en Stability AI: Dimisión del CEO y fuga de talentos en la empresa detrás de Stable DiffusionFlux, por ejemplo, fue desarrollado por Black Forest Labs, un equipo formado por ex empleados de Stability AI" o mensajes como:
Stable Diffusion surgió a mediados de 2022 como uno de los principales modelos de LLM dedicado a convertir texto en imágenes. Con una valuación de US$1.000 millones, StabilityAI llegó a ser un unicornio en 2023. En 2024 está cerca de la quiebra (chattigo).
Luego de su fracaso con Stable Diffusio 3, lanzado en junio, Stability AI espera resurgir con esta versión abierta, cuyos modelos están disponibles en Hugging Face y el código de inferencia en GitHub. Nosotros hemos usado Shakker, obteniendo excelentes resultados, como los que se muestran en el objeto interactivo de la página siguiente La imagen de la portada de este boletín, la hemos diseñado con Stable Diffusion 3.5..
En el mismo objeto interactivo, incluimos 5 imágenes obtenidas con Fotor.
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024
También, el 22 de octubre, Anthrop\c anuncia el nuevo Claude 3.5 Sonnet y Claude 3.5 Haiku, presentando una nueva capacidad revolucionaria: uso de la computadora.
Dado lo reciente de esta nueva capacidad, dejamos para el boletín de noviembre su evaluación. Pero, con el nuevo Claude 3.5 Sonnet, hicimos dos ejercicios:
El primer ejercicio fue con el prompt: "Crea 10 frases que terminen con la palabra manzana", a lo cual respondió:
Con un 100% de acierto. En el segundo ejercicio, le pedimos el código para la presentación que mostramos en la siguiente página (la imágenes generadas por pollinations.ai).
Boletín 3 - Octubre 2024
Boletín 3 - Octubre 2024