Producción de Medios y Formación en IA | Música, Voz, Texto, Código, Imagen, Vídeo, Web, Foto y mucho más.

Inteligencia Artificial Generativa - IA en Teoría y Práctica

Hola, mi nombre es Johann Dirschl, director general de DIRSCHL.com GmbH, especializada en IA, medios audiovisuales y formación. En nuonu.com probamos la IA generativa, es decir, modelos capaces de crear nuevos contenidos. Distinguimos las siguientes áreas de IA generativa:

Web & Plugins

Desarrollo de Plugins y Web con IA para WordPress y DIVI, Webapps, DIRSCHL.com GmbH, IA generativa

Sitios Web, SEO, Accesibilidad, Plugins, WebApps, Pagespeed y mucho más.

Aprende sobre Inteligencia Artificial a través de ejemplos prácticos y ponencias en vivo

La Inteligencia Artificial Generativa ha llegado prácticamente a todas partes. Mi tarea es probarla, crear mis propios flujos de trabajo y desarrollar ejemplos prácticos y productos finales. Dado que creamos todos los plugins y el contenido mismo con diferentes sistemas de IA, el alcance del contenido de las páginas seguramente seguirá creciendo. Muchos me conocen de formaciones o proyectos fotográficos profesionales. También allí, la IA ha sido una compañera constante durante unos 2 años, lo que ofrece ventajas tanto para los clientes como para mí. La selección y edición automáticas basadas en proyectos anteriores las ofrece, por ejemplo, Aftershoot. El proyecto de la fotografía es muy específico, pero también se reflejará aquí. Por ahora, se documentarán otras áreas de IA, por lo que algunos enlaces remiten a la web de nuestra empresa.

A continuación, nos centraremos en las áreas individuales que quiero presentar con más detalle aquí:

Música y Voz con IA: Revolución a través de la Inteligencia Artificial

La inteligencia artificial ha logrado enormes avances en los últimos años en el campo de la generación de música y audio. Las herramientas impulsadas por IA permiten generar piezas musicales de alta calidad o síntesis de voz realistas en cuestión de segundos. Tres de las plataformas más importantes actualmente en este ámbito son Suno, Udio y ElevenLabs.

Suno

Suno es una plataforma de música con IA que permite a los usuarios generar canciones completas con letra, melodía e instrumentación. Se basa en potentes modelos de lenguaje y es especialmente adecuada para aplicaciones creativas como la composición de canciones y el diseño de sonido. Suno se caracteriza por:

  • Fácil de usar: La música se genera mediante una simple entrada de texto.
  • Pistas completas: La IA genera no solo instrumentales, sino también voces.
  • Flexibilidad: Los usuarios pueden influir en estilos y géneros.

Udio

Udio es otra plataforma avanzada de IA para la producción musical. A diferencia de Suno, Udio se centra especialmente en la calidad de sonido profesional y la libertad artística. Algunas de sus características principales son:

  • Control preciso: Los usuarios pueden trabajar con más detalle en arreglos y mezclas.
  • Salida de audio de alta calidad: Producción profesional sin necesidad de un estudio.
  • Diversidad de estilos: Desde música electrónica hasta piezas orquestales.

ElevenLabs

ElevenLabs es una plataforma de síntesis de voz impulsada por IA que puede generar voces con sonido natural. Es especialmente interesante para la sonorización de vídeos, podcasts y medios interactivos. Las características más importantes son:

  • Voces de IA realistas: Las voces suenan humanas y emocionales.
  • Soporte multilingüe: Ideal para producciones internacionales.
  • Voces individuales: Los usuarios pueden crear sus propios perfiles de voz.

Conclusión y Ejemplos

Principalmente creo música de todo tipo y, como músico, puedo decir que Suno, a octubre de 2025, es la mejor plataforma de música en el campo de la inteligencia artificial. Reconoce obras protegidas, permite títulos libres y puede manejar todos los idiomas, dialectos, ritmos, instrumentación, etc. Además, ahora se pueden intercambiar fragmentos, crear portadas, establecer personajes para asignar un estilo, cantante... reconocible. Responde a indicaciones de BPM y también a indicaciones de tonalidad.

Con esto, funciona mejor que el 90% de todos los músicos. Estos pueden completar sus ideas con Suno o incluso encargar toda la composición a Suno.

Ya estoy con Suno desde la versión 2.5 y he creado muchos álbumes y temas musicales con él. Como buen ejemplo práctico, además de composiciones propias alemanas e inglesas, también hay instrumentales, cortos y villancicos. Mi idea era recrear los antiguos villancicos ya libres de GEMA con la ayuda de la inteligencia artificial. En comparación, también he intentado generar mis propios villancicos. La mayoría con textos de ChatGPT, que fueron adaptados individualmente y cuyas ideas son mi base. Son "Nuevos Villancicos" con composiciones propias (tonalidad, velocidad, instrumentación, ambiente, indicaciones vocales...), es decir, no son textos ni melodías robadas. Para mercados navideños, etc., también basta con pura música de fondo navideña, que también he creado yo mismo o basándome en antigua música navideña libre de GEMA.

Con esto no solo te haces amigos, pero está claro que la IA es capaz de crear música de manera perfecta.

Legalmente, los explotadores intentan regular estas plataformas, ya que también han utilizado piezas musicales conocidas para el entrenamiento. Frente a esto, está el principio de que los músicos también aprenden de otros músicos y la música no se reinventa. Sea como sea, no podremos evitar el tema de la inteligencia artificial en la música y probablemente ya hay muchas piezas musicales en las listas de éxitos que los músicos han creado con la ayuda de estas herramientas.

Actualmente, necesito aproximadamente 3 horas para una canción propia con letra propia, masterización, portada y publicación. Mi objetivo principal es reconocer los cambios actuales en la inteligencia artificial a tiempo y adaptar mi flujo de trabajo una y otra vez. De esta manera, también se crea un pool de audio que puedo usar sin problemas para presentaciones de fotos, celebraciones navideñas, etc. Además de 140 obras musicales hechas a mano que ofrecemos en https://www.vladimirsterzer.com junto con sus notaciones, ahora también hay más de 150 pistas con más de 5 horas de música con IA disponibles. Estas son un buen complemento, ya que son versátiles y se pueden adaptar individualmente a vídeos, etc., o generarse de nuevo.

nuonu es el nombre de nuestra antigua banda, en la que tocaba la guitarra, el bajo, el sintetizador y también me encargaba de la grabación. Por eso me gusta definirme como músico, aunque las herramientas de hoy sean diferentes. Por costumbre, todos los temas de IA también pasan por Logic conmigo. Sin embargo, con las versiones más recientes, ya no hay que hacer nada con los temas. No obstante, la exportación de stems (pistas individuales), la antigua mezcla y masterización lúdica reviven. Como mínimo, siempre cargo el WAV en Logic y subo el volumen a cero. Pero ya no hago cambios manuales. Sin embargo, dejo que se determinen la velocidad y el compás exactos, el fundido de entrada y salida, el volumen, el bounce de MP3 y WAV. Algunos temas también recibieron un sonido de caja (Kakakakakaufen) y si la voz es demasiado baja para mí, a veces trabajo con stems.

Sin embargo, el flujo de trabajo de producción musical sigue intacto y rara vez necesita adaptarse a nuevas posibilidades. Una pequeña página sobre la comercialización de música con IA muestra posibilidades que, sin embargo, son menos relevantes para mí. La música con IA debe, sobre todo, ser divertida, ahorrar tiempo, fomentar la propia creatividad, ayudar a los músicos en la composición y lanzar más música libre de derechos al mercado.

 

IA Generativa para Texto y Código

La inteligencia artificial no solo revoluciona la música y el audio, sino también la creación de textos y código. Los modelos de IA modernos pueden generar textos, crear resúmenes, escribir código e incluso resolver problemas complejos. Aquí están algunos de los modelos de IA más importantes para esta área:

ChatGPT

https://chatgpt.com/

ChatGPT de OpenAI es uno de los modelos de lenguaje más conocidos, utilizado tanto para textos generales como para aplicaciones de programación. Sus características principales son:

  • Capacidad conversacional: Ideal para diálogos, textos creativos y búsqueda de información.
  • Generación de código: Soporta la programación de aplicaciones, sitios web y plugins.

Soy usuario desde el primer momento y lo utilizo a diario para textos, preguntas de todo tipo y para programar. Especialmente para resolver análisis complejos, por ejemplo, de código fuente web, SEO, etc., sigue siendo indispensable para mí hoy en día. A menudo creo la primera versión básica de un plugin con Chat y luego, para aplicaciones más grandes, paso a Cursor, que puede ver y gestionar proyectos completos. ¿Podría prescindir de la cuenta Plus? Sí, porque Cursor por sí solo apoyaría bien mi trabajo de desarrollo. También obtengo una segunda opinión de otros LLM. Para la mayoría de las aplicaciones, la versión gratuita de ChatGPT es suficiente.

Google Gemini

https://gemini.google.com/

Gemini de Google es un modelo multimodal que puede procesar texto, imágenes e incluso audio. Se caracteriza por:

  • Capacidades multimodales: Procesamiento de diferentes tipos de datos.
  • Optimizado para la investigación: Ayuda en la búsqueda de información.
  • Buen procesamiento de contexto: Ofrece respuestas bien pensadas con una estructura lógica.
  • Uso gratuito de la API para desarrolladores: Permite la creación de programas propios con inteligencia artificial.

Por lo tanto, para mí es actualmente más importante que ChatGPT.

Grok

https://grok.com/

X.ai es genial cuando se trata de obtener contenido más honesto. Utiliza X como base de datos adicional, lo que te permite estar especialmente cerca de la información actual y de la opinión de empresas y usuarios. La generación de imágenes y código también es muy buena.

Ya era bastante bueno en su primera versión y todavía se puede usar en una variante gratuita. Definitivamente vale la pena echarle un vistazo.

Claude

https://claude.ai/

Claude de Anthropic pone especial énfasis en los aspectos de seguridad y ética en el uso de la IA. Sus características más importantes son:

  • Alta calidad de texto: Se centra en textos naturales y consistentes.
  • Orientado a la seguridad: Reduce los riesgos de desinformación.
  • Buena capacidad de memoria contextual: Puede captar y procesar conversaciones largas.

Es mi IA preferida en el ámbito del código, Sonnet es prácticamente el estándar en Cursor. Claude Sonnet es súper rápido y de muy buena calidad.

DeepSeek

https://www.deepseek.com/

DeepSeek se hizo conocido por utilizar un hardware de IA diferente y por la eficiencia en la velocidad de procesamiento y los costos del hardware. También generó debates, ya que el contenido crítico en chino en la versión en línea difiere del de los entornos instalados localmente.

Hoy ya no utilizo DeepSeek, pero demuestra que también en China se están produciendo grandes desarrollos de IA y que prácticamente todos los grandes actores como Baidu, Alibaba, etc., ya operan sus propios LLM.

    Mistral

    https://mistral.ai/

    Mistral es un modelo de código abierto especialmente adecuado para aplicaciones de programación. Sus puntos fuertes son:

    • Alta eficiencia: Optimizado para cálculos que ahorran recursos.
    • Especialmente para desarrolladores: Buena generación y complemento de código.
    • Enfoque de código abierto: Libremente disponible y adaptable.

      Perplexity

      https://www.perplexity.ai/

      Perplexity AI es un modelo de investigación e información impulsado por IA, especializado en la provisión eficiente de conocimiento. Ofrece:

      • Rápida obtención de información: Ideal para investigaciones específicas.
      • Respuestas concisas: Resume temas complejos de forma comprensible.
      • Buena integración web: Accede a información actualizada.

      Perplexity es mi sustituto de Wikipedia y para todas las preguntas de conocimiento. Proporciona contextos políticos detallados y para mí también es un sustituto de la prensa. Perplexity recurre a innumerables fuentes y LLM y entrega en segundos todo lo que un usuario desea.

      De hecho, Perplexity puede hacer de todo, es decir, también generar código, tareas y mucho más. Lo más interesante es que las respuestas son actuales y las fuentes están vinculadas.

      IA Generativa para Imagen y Arte

      La inteligencia artificial también ha transformado el mundo de las imágenes y el arte. Los modelos de IA pueden crear fotos realistas, obras de arte abstractas, gráficos vectoriales, renderizados 3D, logotipos y mucho más. La tecnología se utiliza en diversas áreas, incluyendo:

      • Generación de imágenes: Creación de imágenes a partir de descripciones de texto.

      • Edición de fotos: Mejoras y ajustes asistidos por IA.

      • Gráficos vectoriales: Creación y edición automática de imágenes vectoriales.

      • Modelado 3D: Soporte en la creación de objetos 3D complejos.

      • Diseño de logotipos: Generación de logotipos únicos basados en especificaciones.

      • Generación de ideas: Apoyo a procesos creativos mediante inspiraciones generadas por IA.

      • Análisis de imágenes: Reconocimiento y clasificación de contenido en imágenes.

      Midjourney

      https://www.midjourney.com/

      Midjourney es una plataforma de IA que genera imágenes artísticas impresionantes a partir de entradas de texto. Se caracteriza por:

      • Imágenes creativas de alta calidad: Especialmente adecuadas para arte conceptual y diseño.
      • Fácil de usar: Genera imágenes mediante comandos de Discord.
      • Libertad artística: Fuerte énfasis en la diversidad de estilos.

      DALL·E

      https://openai.com/de-DE/index/dall-e-3/

      DALL·E de OpenAI es una IA para la generación de imágenes que crea imágenes detalladas y realistas basadas en descripciones de texto. Características principales:

      • Alta precisión de detalles: Generación de imágenes realistas y creativas.
      • Vinculación de objetos: Combina lógicamente diferentes elementos en una imagen.
      • Edición de imágenes: Permite variaciones y adiciones a imágenes existentes.

      Actualmente, ya no utilizo DALL-E. Las funciones están integradas en los LLM o los resultados no difieren de Midjourney. Pero en el mundo de la IA, nunca se debe descartar a los grandes actores y la próxima actualización seguramente llegará.

       

      Firefly

      https://firefly.adobe.com/

      Firefly de Adobe es una plataforma de edición y generación de imágenes impulsada por IA con un enfoque en el control creativo. Ventajas:

      • Integración con productos Adobe: Perfecta para Photoshop e Illustrator.
      • Edición no destructiva: Herramientas asistidas por IA para ajustes creativos.
      • Fácil generación de texto a imagen: Crea imágenes a partir de indicaciones de texto.

      Indispensable porque está integrado en los productos de Adobe. La generación de vídeo me parece demasiado cara, pero eso también puede cambiar rápidamente. Quien trabaja con Premiere puede extender vídeos y los usuarios de Photoshop también pueden crear imágenes o realizar InPainting con contenido generativo. Súper fácil y de buena calidad.

       

      Stable Diffusion

      https://stability.ai/news/stable-diffusion-public-release

      Stable Diffusion es un modelo de código abierto para la generación de imágenes, especialmente adecuado para personalizaciones individuales. Características:

      • Totalmente personalizable: Se ejecuta localmente y puede modificarse.
      • Estilos de imagen complejos: Permite gráficos detallados y realistas.
      • Libertad de código abierto: Uso y expansión gratuitos.

      Flux

      https://flux-ai.io/de/flux-ai-image-generator/

      Flux es una plataforma de IA innovadora para el arte de la imagen, que se distingue por su espíritu experimental y sus algoritmos creativos. Sus puntos fuertes son:

      • Descubrir nuevos estilos: Genera imágenes poco convencionales y experimentales.
      • Algoritmos potentes: Utiliza redes neuronales para efectos artísticos.
      • Flujos de trabajo creativos: Fomenta nuevos enfoques para el arte digital.

      IA Generativa para Vídeos y 3D

      Los últimos modelos de IA permiten no solo la creación de imágenes estáticas, sino también de vídeos realistas y animaciones 3D. Se utilizan en diversas áreas, incluyendo la producción cinematográfica, efectos visuales, diseño de juegos y realidad virtual. Las áreas de aplicación incluyen:

      • Secuencias de vídeo generadas por IA: Creación de vídeos realistas o estilizados a partir de descripciones de texto.
      • Edición de vídeo: Optimización automatizada de clips, correcciones de color y efectos.
      • Animación 3D: Generación y control de modelos y animaciones 3D complejos.
      • Creación de escenas: Creación de entornos completos para juegos, VR o simulaciones.

      VEO 3

      La mejor generación de vídeo actual, incluyendo voz y música, produce vídeos absolutamente realistas que, con relativa seguridad, determinarán el próximo mercado cinematográfico. Al menos en parte, los efectos especiales, etc., se pueden crear de forma súper económica y profesional con ella.

      Runway Gen-2

      Runway Gen-2 es una potente herramienta de IA para la creación y edición de vídeo. Características principales:

      • Generación de texto a vídeo: Crea vídeos basados en instrucciones de texto.
      • Generación de imagen a vídeo: Crea vídeos basados en datos de imagen cargados.
      • Edición asistida por IA: Herramientas para corrección de color, rotoscopia y efectos.
      • Fácil aplicación: Interfaz de usuario intuitiva para proyectos creativos.

      Runway ofrece, después de registrarse, la posibilidad de crear gratuitamente unas 20 secuencias de vídeo. Posteriormente, se pueden elegir entre diferentes modelos de suscripción.

      Adobe Firefly Video

      Desde mediados de febrero de 2025, las capacidades de generación de imágenes en Adobe Firefly se han complementado con la IA generativa para vídeo. El servicio funciona de manera similar a Runway y entrega vídeos basados en imágenes cargadas o un prompt. Firefly Video es una potente herramienta de IA para la generación de vídeo. Características principales:

      • Generación de texto a vídeo: Crea vídeos basados en instrucciones de texto.
      • Generación de imagen a vídeo: Crea vídeos basados en datos de imagen cargados.
      • Edición asistida por IA: Herramientas para corrección de color, rotoscopia y efectos.
      • Fácil aplicación: Interfaz de usuario intuitiva para proyectos creativos.

      Como suscriptor de Adobe CC, tuve la oportunidad de crear 2 vídeos antes de que apareciera una solicitud de pago (suscripción a servicios de IA). Adobe está intentando por primera vez monetizar sus servicios de IA de forma adicional. Según la oferta, esto también incluye otras IA generativas de audio, vídeo y fotografía de Adobe.

      Sora

      Sora de OpenAI es una IA avanzada para la generación de vídeo realista. Ofrece:

      • Movimientos detallados: Genera vídeos con física compleja y movimiento realista.
      • Creación de escenas: Crea entornos que parecen cinematográficos e inmersivos.
      • Ajustes automáticos: Optimiza la luz, las sombras y las texturas para obtener mejores resultados.

      Sora aún no está disponible en Alemania a mediados de febrero de 2025. Sin embargo, numerosos vídeos ya muestran lo potente que es la IA.

      Pika Labs

      Pika Labs es una plataforma innovadora para la edición y animación de vídeo asistida por IA. Sus puntos fuertes son:

      • Efectos automatizados: Generación de efectos visuales a partir de descripciones de texto.
      • Control de animación: Control del movimiento y la dinámica de personajes y objetos.
      • Manejo intuitivo: Simplifica el proceso creativo mediante la automatización.

      Flux

      Flux es una plataforma de IA versátil para proyectos de vídeo artísticos y experimentales, así como para diseño 3D. Características especiales:

      • Libertades artísticas: Genera efectos de vídeo y animaciones poco convencionales.
      • Modelado 3D: Crea objetos visualmente impresionantes y detallados.
      • Algoritmos innovadores: Utiliza redes neuronales avanzadas para efectos dinámicos 

      Midjourney

      Como suscriptor de Midjourney, me gusta usar la nueva función para generar vídeos con fines de demostración. La calidad aún no es tan buena como la de otros, pero tampoco cuesta extra. Midjourney es algo más lento en su desarrollo que otros proveedores de IA. Por lo tanto, ya no lo recomiendo, pero dejaré que mi suscripción anual expire. He creado todas las portadas de álbumes de música y mucho más con él, y hace un trabajo sólido. Sin embargo, para sitios web, etc., necesito más representaciones fotorrealistas y auténticas con altas resoluciones.

      IA Generativa para Web, SEO, Plugins y WebApps

      La inteligencia artificial está cambiando la forma en que se desarrollan, optimizan y gestionan los sitios web. Desde la creación automatizada de contenido hasta la optimización SEO, pasando por plugins inteligentes y WebApps, la IA ofrece enormes ventajas a los desarrolladores web y creadores de contenido.

      WordPress y Temas impulsados por IA

      WordPress sigue siendo el sistema de gestión de contenidos (CMS) más utilizado en el mundo. Con la creciente integración de la IA en temas y plugins, el desarrollo web se vuelve más eficiente y creativo. Destaca especialmente DIVI 5, que establece nuevos estándares con sugerencias de diseño asistidas por IA, ajustes automáticos de diseño y análisis inteligente de contenido.

      Optimización SEO Automatizada con IA

      El SEO sigue siendo un factor decisivo para la visibilidad de los sitios web. Los plugins SEO asistidos por IA como RankMath analizan automáticamente el contenido, sugieren palabras clave relevantes y ayudan a mejorar la optimización on-page en tiempo real. Google también utiliza algoritmos de IA como RankBrain para evaluar la relevancia de los resultados de búsqueda.

      Plugins y WebApps impulsados por IA

      Además de SEO y diseño, existen numerosos plugins impulsados por IA que optimizan el flujo de trabajo:

      • WordLift: Utiliza IA para el análisis semántico y mejora el posicionamiento en buscadores mediante datos estructurados.

      • Chatbots con IA: Plugins como Tidio AI o integraciones de ChatGPT permiten interacciones inteligentes con los clientes.

      • Contenido generado por IA: Herramientas como ContentBot o Copymatic crean automáticamente atractivas entradas de blog y páginas de destino.

      • Optimización de imágenes y medios: Plugins como Imagify AI o Adobe Firefly para Web mejoran las imágenes automáticamente.

      El Futuro del Desarrollo Web con IA

      El futuro pertenece a la automatización: la IA no solo puede sugerir código a los desarrolladores web, sino incluso generar sitios web completos. Las WebApps se benefician de experiencias de usuario personalizadas, detección automática de errores y un rendimiento optimizado.

      Con la creciente integración de la IA en WordPress, SEO y WebApps, se abren nuevas posibilidades para elevar la eficiencia y calidad del desarrollo web a un nuevo nivel.

      IA en Fotografía y Edición de Imágenes

      La inteligencia artificial tiene una enorme influencia en la fotografía y la edición de imágenes. Desde funciones inteligentes en cámaras modernas hasta el procesamiento RAW automatizado con programas especializados, la IA ahorra tiempo y optimiza los resultados.

      IA en Cámaras Modernas

      Muchas cámaras actuales integran tecnologías basadas en IA que ayudan a los fotógrafos:

      • Reconocimiento automático de escenas: Las cámaras analizan escenas en tiempo real y seleccionan los ajustes óptimos para retratos, paisajes o tomas de acción.
      • Sistemas de autoenfoque asistidos por IA: Detección de rostros, ojos e incluso objetos específicos para imágenes nítidas.
      • Reducción de ruido y técnicas HDR: La IA mejora la calidad de la imagen ya durante la captura.

      IA en el Desarrollo RAW y Culling

      El postprocesamiento de fotos a menudo consume mucho tiempo. El software asistido por IA revoluciona este proceso:

      • Aftershoot: Automatiza el culling (preselección de imágenes), detecta fotos duplicadas o borrosas y ofrece funciones de edición rápidas.
      • Adobe Lightroom: Presets asistidos por IA, mejoras automáticas de imagen y ediciones selectivas con un clic.
      • Topaz Labs (Gigapixel, Sharpen, DeNoise): Amplía las posibilidades de optimización de imagen con reducción de ruido de alta gama, nitidez y escalado.

      Edición Avanzada de Imágenes con IA

      Además del desarrollo RAW y la clasificación, existen muchas otras funciones de IA:

      • Adobe Photoshop: Herramientas de IA como Relleno Generativo, recorte automático y retoque basado en contenido.
      • Luminar Neo: Filtros de IA para reemplazo de cielo, mejora de piel y optimización de escenas.
      • Neurapix: Correcciones de color automatizadas basadas en estilos de edición individuales.

      El Futuro de la IA en la Fotografía

      La IA seguirá revolucionando la fotografía al:

      • Desarrollar aún más las funciones inteligentes de la cámara.
      • Hacer que los procesos de selección y edición sean aún más eficientes.
      • Abrir nuevas posibilidades creativas mediante manipulaciones de imagen avanzadas asistidas por IA.

      Con las soluciones basadas en IA, los flujos de trabajo se pueden optimizar, de modo que los fotógrafos tengan más tiempo para la creatividad y menos para la edición manual.