Producción y Formación en Medios con IA | Música, Voz, Texto, Código, Juegos, Imagen, Video, Web, Foto y mucho más.
Inteligencia Artificial Generativa - IA en Teoría y Práctica
Hola, mi nombre es Johann Dirschl, director general de DIRSCHL.com GmbH, especializada en IA, medios audiovisuales y formación. En nuonu.com probamos IA generativa, es decir, modelos capaces de crear contenido nuevo. Distinguimos las siguientes áreas de IA generativa:
Aprende sobre Inteligencia Artificial a través de ejemplos prácticos y charlas en vivo
La Inteligencia Artificial Generativa ha llegado prácticamente a todas partes. Mi tarea es probarla, crear mis propios flujos de trabajo y desarrollar ejemplos prácticos y productos finales.
Muchos me conocen como programador, profesor o fotógrafo. Experimento, soy un entusiasta de la tecnología y siempre busco alternativas nuevas y mejores para acelerar los procesos de trabajo. El flujo de trabajo es clave y ha cambiado tanto en muchas áreas que, especialmente en la IA, el público en general puede manejarlo incluso sin conocimientos especializados.
Al principio, muchas personas odian cada técnica de IA porque no todos están dispuestos a aceptar las nuevas realidades. Luego sigue un período en el que el uso y la resistencia se acercan, y poco después, todos la usan. Al final, el conocimiento de la IA y cada automatización superarán con creces a los humanos. El momento de la IAG, es decir, el punto en el que habrá una Inteligencia Artificial General, ya ha llegado en muchas áreas sin que nadie se haya dado cuenta.
No te pierdas el momento, porque toda tu vida y la forma en que trabajarás dependen de ello.
Me alegra que estéis aquí.
Johann Dirschl, DIRSCHL.com GmbH

Música y Voz con IA: Revolución a través de la Inteligencia Artificial
La inteligencia artificial ha logrado enormes avances en los últimos años en el campo de la generación de música y audio. Las herramientas impulsadas por IA permiten generar piezas musicales de alta calidad o síntesis de voz realistas en cuestión de segundos. Tres de las plataformas más importantes en esta área son Suno, Udio y ElevenLabs.
Suno
Suno es una plataforma de música con IA que permite a los usuarios generar canciones completas con letra, melodía e instrumentación. Se basa en potentes modelos de lenguaje y es especialmente adecuada para aplicaciones creativas como la composición de canciones y el diseño de sonido. Suno se caracteriza por:
- Fácil de usar: La música se genera mediante una simple entrada de texto.
- Pistas completas: La IA no solo produce instrumentales, sino también voces.
- Flexibilidad: Los usuarios pueden influir en estilos y géneros.
Udio
Udio es otra plataforma avanzada de IA para la producción musical. A diferencia de Suno, Udio se enfoca especialmente en la calidad de sonido profesional y la libertad artística. Algunas de sus características principales son:
- Control preciso: Los usuarios pueden trabajar con más detalle en arreglos y mezclas.
- Salida de audio de alta calidad: Producción profesional sin necesidad de un estudio.
- Variedad de estilos: Desde música electrónica hasta piezas orquestales.
ElevenLabs
ElevenLabs es una plataforma de síntesis de voz impulsada por IA que puede generar voces con sonido natural. Es particularmente interesante para la narración de videos, podcasts y medios interactivos. Las características más importantes:
- Voces de IA realistas: Las voces suenan humanas y emocionales.
- Soporte multilingüe: Ideal para producciones internacionales.
- Voces individuales: Los usuarios pueden crear sus propios perfiles de voz.
Conclusión y Ejemplos
Principalmente creo música de todo tipo y, como músico, puedo decir que Suno, a octubre de 2025, es la mejor plataforma para música en el campo de la inteligencia artificial. Reconoce obras protegidas, permite títulos libres y puede manejar todos los idiomas, dialectos, ritmos, instrumentación, etc. Actualmente, también se pueden intercambiar fragmentos, crear portadas, definir personajes para asignar un estilo reconocible, un cantante... Reacciona a las indicaciones de BPM y también a las de tonalidad.
Con esto, funciona mejor que el 90% de todos los músicos. Estos pueden completar sus ideas con Suno o incluso entregar toda la composición a Suno.
He estado usando Suno desde la versión 2.5 y ya he creado muchos álbumes y temas musicales con él. Como buen ejemplo práctico, además de composiciones propias en alemán e inglés, también hay instrumentales, cortos y villancicos. Mi idea era recrear los antiguos villancicos ya libres de GEMA con la ayuda de la inteligencia artificial. En comparación, también intenté generar mis propios villancicos. La mayoría con letras de ChatGPT, que fueron adaptadas individualmente y cuyas ideas son mi base. Son "Nuevos Villancicos" con composiciones propias (tonalidad, velocidad, instrumentación, ambiente, indicaciones vocales...), es decir, no son letras ni melodías robadas. Para mercados navideños, etc., también basta con pura música de fondo navideña, que también he creado yo mismo o basándome en música navideña antigua libre de GEMA.
Con esto no solo te haces amigos, pero está claro que la IA es capaz de crear música de manera perfecta.
Legalmente, los explotadores intentan regular estas plataformas. Esto se debe a que también han utilizado piezas musicales conocidas para su entrenamiento. Frente a esto, está el principio de que los músicos también aprenden de otros músicos y la música no se reinventa. Sea como sea, no podremos evitar el tema de la inteligencia artificial en la música y probablemente ya hay muchas piezas musicales en las listas que los músicos han creado con la ayuda de estas herramientas.
Actualmente, necesito unas 3 horas para una canción propia con letra, masterización, portada y publicación. Mi objetivo principal es reconocer los cambios actuales en la inteligencia artificial a tiempo y adaptar mi flujo de trabajo una y otra vez. De esta manera, también se crea un pool de audio que puedo usar sin preocupaciones para presentaciones de fotos, fiestas navideñas, etc. Además de 140 obras musicales hechas a mano, que ofrecemos en https://www.vladimirsterzer.com junto con sus notaciones, ahora también hay más de 150 pistas con más de 5 horas de música con IA disponibles. Estas son un buen complemento, ya que son versátiles y se pueden adaptar individualmente a videos, etc., o generar de nuevo.
nuonu es el nombre de nuestra antigua banda, en la que tocaba la guitarra, el bajo, el sintetizador y también me encargaba de la grabación. Por eso me gusta definirme como músico, aunque las herramientas de hoy sean diferentes. Por costumbre, todos los títulos de IA también pasan por Logic conmigo. Sin embargo, desde las versiones más recientes, realmente no hay que hacer nada con los títulos. No obstante, la exportación de stems (pistas individuales) revive la antigua mezcla y masterización lúdica. Como mínimo, siempre cargo el WAV en Logic y subo el volumen a cero. Pero ya no hago cambios manuales. Sin embargo, dejo que se determinen la velocidad y el compás exactos, el fundido de entrada y salida, el volumen, el rebote de MP3 y WAV. Algunas pistas también recibieron un sonido de caja (Kakakakakaufen) y si el canto es demasiado bajo para mí, también trabajo con stems.
Pero el flujo de trabajo de producción musical sigue intacto y rara vez necesita adaptarse a nuevas posibilidades. Una pequeña página sobre la comercialización de música con IA muestra posibilidades que, sin embargo, son menos relevantes para mí. La música con IA debe, sobre todo, ser divertida, ahorrar tiempo, fomentar la propia creatividad, ayudar a los músicos en la composición y traer más música libre de derechos al mercado.
IA Generativa para Texto y Código
La Inteligencia Artificial revoluciona no solo la música y el audio, sino también la creación de textos y código. Los modelos de IA modernos pueden generar textos, crear resúmenes, escribir código e incluso resolver problemas complejos. Aquí están algunos de los modelos de IA más importantes para esta área:
ChatGPT
ChatGPT de OpenAI es uno de los modelos de lenguaje más conocidos, utilizado tanto para textos generales como para aplicaciones de programación. Sus características principales son:
- Capacidad conversacional: Ideal para diálogos, textos creativos y búsqueda de información.
- Generación de código: Soporta la programación de aplicaciones, sitios web y plugins.
Soy usuario desde el primer momento y lo uso a diario para textos, preguntas de todo tipo y para programar. Especialmente para resolver análisis complejos, por ejemplo, de código fuente web, SEO, etc., sigue siendo indispensable para mí. Con Chat, a menudo creo la primera versión básica de un plugin y luego, para aplicaciones más grandes, cambio a Cursor, que puede ver y gestionar proyectos completos. ¿Podría prescindir de la cuenta Plus? Sí, porque Cursor por sí solo apoyaría bien mis trabajos de desarrollo. También obtengo una segunda opinión de otros LLM. Para la mayoría de las aplicaciones, la versión gratuita de ChatGPT es suficiente.
Google Gemini
Gemini de Google es un modelo multimodal que puede procesar texto, imágenes e incluso audio. Se caracteriza por:
- Capacidades multimodales: Procesamiento de diferentes tipos de datos.
- Optimizado para la investigación: Ayuda en la búsqueda de información.
- Buen procesamiento de contexto: Ofrece respuestas bien pensadas con una estructura lógica.
- Uso gratuito de la API para desarrolladores: Permite la creación de programas propios con inteligencia artificial.
Por lo tanto, es actualmente más importante para mí que ChatGPT.
Grok
X.ai es grandioso cuando se trata de obtener contenido más honesto. Utiliza X como base de datos adicional, lo que permite estar especialmente cerca de la información actual y de la opinión de empresas y usuarios. La generación de imágenes y código también es muy buena.
Ya era bastante bueno en su primera versión y hasta el día de hoy se puede usar en una variante gratuita. Definitivamente vale la pena echar un vistazo.
Claude
Claude de Anthropic pone especial énfasis en los aspectos de seguridad y ética en el uso de la IA. Sus características más importantes son:
- Alta calidad de texto: Se enfoca en textos naturales y consistentes.
- Orientado a la seguridad: Reduce los riesgos de desinformación.
- Buena capacidad de memoria contextual: Puede captar y procesar conversaciones largas.
Es mi IA preferida en el área de código; Sonnet es prácticamente el estándar en Cursor. Claude Sonnet es súper rápido y de muy buena calidad.
DeepSeek
DeepSeek se hizo conocido por utilizar un hardware de IA diferente, lo que hizo que la velocidad de procesamiento y los costos del hardware fueran más eficientes. También fue la primera versión que instalé localmente en mi ordenador. También generó discusiones, ya que el contenido crítico chino en la versión en línea difiere del de los entornos instalados localmente.
Hoy ya no uso DeepSeek, pero demuestra que también en China se están produciendo grandes desarrollos de IA y que prácticamente todos los grandes actores como Baidu, Alibaba, etc., ya operan sus propios LLM.
Mistral
Mistral es un modelo de código abierto especialmente adecuado para aplicaciones de programación. Sus puntos fuertes son:
- Alta eficiencia: Optimizado para cálculos que ahorran recursos.
- Especialmente para desarrolladores: Buena generación y complemento de código.
- Enfoque de código abierto: Libremente disponible y adaptable.
Perplexity
Perplexity AI es un modelo de investigación e información impulsado por IA, especializado en la entrega eficiente de conocimiento. Ofrece:
- Rápida obtención de información: Ideal para investigaciones específicas.
- Respuestas compactas: Resume temas complejos de manera comprensible.
- Buena integración web: Accede a información actualizada.
Perplexity es mi reemplazo para Wikipedia y para todas las preguntas de conocimiento. Proporciona contextos políticos detallados y para mí también es un sustituto de la prensa. Perplexity recurre a innumerables fuentes y LLM y entrega en segundos todo lo que un usuario desea.
De hecho, Perplexity puede hacer de todo, es decir, también generar código, tareas y mucho más. Lo más interesante es que las respuestas son actuales y las fuentes están vinculadas.
IA Generativa para Imagen y Arte
La Inteligencia Artificial también ha transformado el mundo de las imágenes y el arte. Los modelos de IA pueden crear fotos realistas, obras de arte abstractas, gráficos vectoriales, renderizados 3D, logotipos y mucho más. La tecnología se utiliza en diversas áreas, incluyendo:
-
Generación de imágenes: Creación de imágenes a partir de descripciones de texto.
-
Edición de fotos: Mejoras y ajustes asistidos por IA.
-
Gráficos vectoriales: Creación y edición automática de imágenes vectoriales.
-
Modelado 3D: Soporte en la creación de objetos 3D complejos.
-
Diseño de logotipos: Generación de logotipos únicos basados en especificaciones.
-
Búsqueda de ideas: Apoyo a procesos creativos a través de inspiraciones generadas por IA.
-
Análisis de imágenes: Reconocimiento y clasificación de contenido en imágenes.
Midjourney
Midjourney es una plataforma de IA que genera imágenes artísticas impresionantes a partir de entradas de texto. Se caracteriza por:
- Imágenes creativas de alta calidad: Especialmente adecuadas para arte conceptual y diseño.
- Fácil de usar: Genera imágenes a través de comandos de Discord.
- Libertad artística: Fuerte énfasis en la diversidad de estilos.
DALL·E
https://openai.com/de-DE/index/dall-e-3/
DALL·E de OpenAI es una IA para la generación de imágenes que crea imágenes detalladas y realistas basadas en descripciones de texto. Características principales:
- Alta precisión de detalles: Generación de imágenes realistas y creativas.
- Vinculación de objetos: Combina diferentes elementos lógicamente en una imagen.
- Edición de imágenes: Permite variaciones y adiciones a imágenes existentes.
Actualmente, ya no uso DALL-E. Las funciones están integradas en los LLM o los resultados no difieren de Midjourney. Pero en el mundo de la IA, nunca se debe descartar a los grandes jugadores y la próxima actualización seguramente llegará.
Firefly
Firefly de Adobe es una plataforma impulsada por IA para la edición y creación de imágenes con un enfoque en el control creativo. Ventajas:
- Integración con productos Adobe: Perfecta para Photoshop e Illustrator.
- Edición no destructiva: Herramientas asistidas por IA para ajustes creativos.
- Fácil generación de texto a imagen: Crea imágenes a partir de especificaciones de texto.
Indispensable porque está integrado en los productos de Adobe. La generación de video me parece demasiado cara, pero eso también puede cambiar rápidamente. Quien trabaja con Premiere puede extender videos y los usuarios de Photoshop también pueden crear imágenes o realizar InPainting con contenido generativo. Súper fácil y de buena calidad.
Stable Diffusion
https://stability.ai/news/stable-diffusion-public-release
Stable Diffusion es un modelo de código abierto para la generación de imágenes, especialmente adecuado para personalizaciones individuales. Propiedades:
- Completamente personalizable: Se ejecuta localmente y se puede modificar.
- Estilos de imagen complejos: Permite gráficos detallados y realistas.
- Libertad de código abierto: Uso y expansión gratuitos.
Flux
https://flux-ai.io/de/flux-ai-image-generator/
Flux es una innovadora plataforma de IA para el arte de imágenes, que se distingue por su espíritu experimental y algoritmos creativos. Sus puntos fuertes son:
- Descubrir nuevos estilos: Genera imágenes poco convencionales y experimentales.
- Algoritmos potentes: Utiliza redes neuronales para efectos artísticos.
- Flujos de trabajo creativos: Fomenta nuevos enfoques para el arte digital.
Videos y 3D con IA Generativa
Los modelos de IA más recientes permiten no solo la creación de imágenes estáticas, sino también de videos realistas y animaciones 3D. Se utilizan en diversas áreas, incluyendo la producción cinematográfica, efectos visuales, diseño de juegos y realidad virtual. Las áreas de aplicación incluyen:
- Secuencias de video generadas por IA: Creación de videos realistas o estilizados a partir de descripciones de texto.
- Edición de video: Optimización automatizada de clips, correcciones de color y efectos.
- Animación 3D: Generación y control de modelos y animaciones 3D complejos.
- Creación de escenas: Creación de entornos completos para juegos, VR o simulaciones.
VEO 3
La mejor generación de video actual, incluyendo voz y música, produce videos absolutamente realistas que, con relativa seguridad, determinarán el próximo mercado cinematográfico. Al menos en parte, los efectos especiales, etc., se pueden crear de forma súper económica y profesional con ella.
Runway Gen-2
Runway Gen-2 es una potente herramienta de IA para la creación y edición de video. Características principales:
- Generación de texto a video: Crea videos basados en instrucciones de texto.
- Generación de imagen a video: Crea videos basados en datos de imagen cargados.
- Edición asistida por IA: Herramientas para corrección de color, rotoscopia y efectos.
- Fácil aplicación: Interfaz de usuario intuitiva para proyectos creativos.
Runway ofrece, después de registrarse, la posibilidad de crear alrededor de 20 secuencias de video de forma gratuita. Posteriormente, se puede elegir entre diferentes modelos de suscripción.
Adobe Firefly Video
Desde mediados de febrero de 2025, las capacidades de generación de imágenes en Adobe Firefly se han complementado con la IA generativa para video. El servicio funciona de manera similar a Runway y entrega videos basados en imágenes cargadas o un prompt. Firefly Video es una potente herramienta de IA para la generación de video. Características principales:
- Generación de texto a video: Crea videos basados en instrucciones de texto.
- Generación de imagen a video: Crea videos basados en datos de imagen cargados.
- Edición asistida por IA: Herramientas para corrección de color, rotoscopia y efectos.
- Fácil aplicación: Interfaz de usuario intuitiva para proyectos creativos.
Como suscriptor de Adobe CC, tuve la oportunidad de crear 2 videos antes de que se mostrara una solicitud de pago (suscripción para servicios de IA). Adobe intenta por primera vez monetizar sus servicios de IA adicionalmente. Según la oferta, esto incluye otras IA generativas de audio, video y también foto de Adobe.
Sora
Sora de OpenAI es una IA avanzada para la generación de video realista. Ofrece:
- Movimientos detallados: Genera videos con física compleja y movimiento realista.
- Creación de escenas: Crea entornos que parecen cinematográficos e inmersivos.
- Ajustes automáticos: Optimiza la luz, las sombras y las texturas para obtener mejores resultados.
Sora, a mediados de febrero de 2025, aún no está disponible en Alemania. Sin embargo, numerosos videos ya muestran lo potente que es la IA.
Pika Labs
Pika Labs es una plataforma innovadora para la edición y animación de video asistida por IA. Sus puntos fuertes son:
- Efectos automatizados: Generación de efectos visuales a partir de descripciones de texto.
- Control de animación: Control del movimiento y la dinámica de personajes y objetos.
- Funcionamiento intuitivo: Simplifica el proceso creativo mediante la automatización.
Flux
Flux es una plataforma de IA versátil para proyectos de video artísticos y experimentales, así como diseño 3D. Características especiales:
- Libertades artísticas: Genera efectos de video y animaciones poco convencionales.
- Modelado 3D: Crea objetos visualmente impresionantes y detallados.
- Algoritmos innovadores: Utiliza redes neuronales avanzadas para efectos dinámicos
Midjourney
Como suscriptor de Midjourney, me gusta usar la nueva opción de generar videos para fines de demostración. La calidad aquí aún no es tan buena como en otros, pero tampoco cuesta extra. Midjourney es algo más lento en su desarrollo que otros proveedores de IA. Por lo tanto, ya no lo recomiendo, pero dejaré que mi suscripción anual expire. Todas las portadas de álbumes de música y mucho más las he creado con él y hace un trabajo sólido. Pero para sitios web, etc., necesito más. Representaciones fotorrealistas y auténticas con altas resoluciones.
IA Generativa para Web, SEO, Plugins y WebApps
La Inteligencia Artificial está cambiando la forma en que se desarrollan, optimizan y gestionan los sitios web. Desde la creación automatizada de contenido hasta la optimización SEO y los plugins y WebApps inteligentes, la IA ofrece enormes ventajas a los desarrolladores web y creadores de contenido.
WordPress y Temas impulsados por IA
WordPress sigue siendo el sistema de gestión de contenidos (CMS) más utilizado en el mundo. Con la creciente integración de la IA en temas y plugins, el desarrollo web se vuelve más eficiente y creativo. Destaca especialmente DIVI 5, que establece nuevos estándares con sugerencias de diseño asistidas por IA, ajustes automáticos de diseño y análisis inteligente de contenido.
Optimización SEO automatizada con IA
El SEO sigue siendo un factor decisivo para la visibilidad de los sitios web. Los plugins SEO impulsados por IA como RankMath analizan automáticamente el contenido, sugieren palabras clave relevantes y ayudan a mejorar la optimización on-page en tiempo real. Google también utiliza algoritmos de IA como RankBrain para evaluar la relevancia de los resultados de búsqueda.
Plugins y WebApps impulsados por IA
Además del SEO y el diseño, existen numerosos plugins impulsados por IA que optimizan el flujo de trabajo:
-
WordLift: Utiliza IA para el análisis semántico y mejora el posicionamiento en buscadores mediante datos estructurados.
-
Chatbots con IA: Plugins como Tidio AI o integraciones de ChatGPT permiten interacciones inteligentes con los clientes.
-
Contenido generado por IA: Herramientas como ContentBot o Copymatic crean automáticamente atractivas publicaciones de blog y páginas de destino.
-
Optimización de imágenes y medios: Plugins como Imagify AI o Adobe Firefly para Web mejoran las imágenes automáticamente.
El futuro del desarrollo web con IA
El futuro pertenece a la automatización: la IA no solo puede hacer sugerencias de código a los desarrolladores web, sino incluso generar sitios web completos. Las WebApps se benefician de experiencias de usuario personalizadas, detección automática de errores y rendimiento optimizado.
Con la creciente integración de la IA en WordPress, SEO y WebApps, se abren nuevas posibilidades para elevar la eficiencia y calidad del desarrollo web a un nuevo nivel.
IA en Fotografía y Edición de Imágenes
La Inteligencia Artificial tiene una enorme influencia en la fotografía y la edición de imágenes. Desde funciones inteligentes en cámaras modernas hasta el procesamiento RAW automatizado con programas especializados, la IA ahorra tiempo y optimiza los resultados.
IA en cámaras modernas
Muchas cámaras actuales integran tecnologías basadas en IA que ayudan a los fotógrafos:
- Reconocimiento automático de escenas: Las cámaras analizan escenas en tiempo real y seleccionan los ajustes óptimos para retratos, paisajes o tomas de acción.
- Sistemas de autoenfoque asistidos por IA: Detección de rostros, ojos e incluso objetos específicos para imágenes nítidas.
- Reducción de ruido y técnicas HDR: La IA mejora la calidad de la imagen ya durante la captura.
IA en el desarrollo RAW y Culling
El postprocesamiento de fotos a menudo consume mucho tiempo. El software asistido por IA revoluciona este proceso:
- Aftershoot: Automatiza el Culling (preselección de imágenes), detecta fotos duplicadas o borrosas y ofrece funciones de edición rápidas.
- Adobe Lightroom: Presets asistidos por IA, mejoras automáticas de imagen y ediciones selectivas con un clic.
- Topaz Labs (Gigapixel, Sharpen, DeNoise): Amplía las posibilidades de optimización de imágenes con reducción de ruido de alta gama, nitidez y escalado.
Edición de imágenes avanzada con IA
Además del desarrollo RAW y la clasificación, existen muchas otras funciones de IA:
- Adobe Photoshop: Herramientas de IA como Relleno Generativo, recorte automático y retoque basado en contenido.
- Luminar Neo: Filtros de IA para intercambio de cielo, mejora de piel y optimización de escenas.
- Neurapix: Correcciones de color automatizadas basadas en estilos de edición individuales.
El futuro de la IA en la fotografía
La IA seguirá revolucionando la fotografía al:
- Desarrollar aún más las funciones inteligentes de la cámara.
- Hacer los procesos de selección y edición aún más eficientes.
- Abrir nuevas posibilidades creativas a través de manipulaciones de imagen avanzadas asistidas por IA.
Con soluciones basadas en IA, los flujos de trabajo se pueden optimizar, de modo que los fotógrafos tengan más tiempo para la creatividad y menos para la edición manual.




