Tendencias candentes para la IA en 2024
En este nuevo artículo, vamos a adentrarnos en las cuatro tendencias más emocionantes que la IA tiene para ofrecer en el año 2024. El mundo de la inteligencia artificial está en constante evolución, y es importante mantenerse al tanto de las últimas novedades y avances. Así que, sin más preámbulos, echemos un vistazo a lo que nos depara el futuro de la IA.
Tendencia 1: Chatbots personalizados
Uno de los desarrollos más emocionantes en el mundo de la IA es la creación de chatbots personalizados. En 2024, las empresas de tecnología que han invertido fuertemente en IA generativa se enfrentarán a la presión de demostrar que pueden ganar dinero con sus productos. Para lograrlo, gigantes de la IA como Google y OpenAI están apostando por hacerse más pequeños. Ambos están desarrollando plataformas amigables para el usuario que permiten a las personas personalizar modelos de lenguaje poderosos y crear sus propios chatbots personalizados que se adapten a sus necesidades específicas, sin necesidad de habilidades de programación. Ambos han lanzado herramientas basadas en la web que permiten a cualquiera convertirse en desarrollador de aplicaciones de IA generativa.
Esta tendencia podría hacer que la IA generativa sea realmente útil para la persona promedio en 2024, y veremos a más personas experimentando con una gran cantidad de modelos de IA. Modelos de IA de última generación, como GPT-4 y Gemini, son multimodales, lo que significa que pueden procesar no solo texto, sino también imágenes e incluso videos. Esta nueva capacidad podría desbloquear una serie de nuevas aplicaciones. Por ejemplo, un agente de bienes raíces puede cargar texto de listados anteriores, ajustar un modelo poderoso para generar texto similar con solo un clic, cargar videos y fotos de nuevos listados y simplemente pedir al IA personalizado que genere una descripción de la propiedad.
Sin embargo, el éxito de este plan depende de si estos modelos funcionan de manera confiable. Los modelos de lenguaje a menudo inventan cosas y los modelos generativos están llenos de sesgos. También son fáciles de piratear, especialmente si se les permite navegar por la web. Las empresas de tecnología aún no han resuelto ninguno de estos problemas. Cuando la novedad se desgaste, tendrán que ofrecer a sus clientes formas de lidiar con estos problemas.
Tendencia 2: La segunda ola de la IA generativa será en video
Es sorprendente lo rápido que lo fantástico se vuelve familiar. Los primeros modelos generativos que producían imágenes fotorrealistas se hicieron populares en 2022 y pronto se volvieron comunes. Herramientas como DALL-E de OpenAI, Stable Diffusion de Stability AI y Firefly de Adobe inundaron Internet con imágenes asombrosas de todo, desde el papa en Balenciaga hasta obras de arte premiadas. Pero no todo es diversión: por cada pug agitando pompones, hay otra pieza de arte de fantasía falsificada o estereotipo sexual sexista.
La nueva frontera es el texto a video. Espere que tome todo lo bueno, lo malo o lo feo del texto a imagen y lo amplíe.
Hace un año, vimos por primera vez lo que podían hacer los modelos generativos cuando se entrenaban para unir varias imágenes fijas en clips de unos pocos segundos. Los resultados eran distorsionados y bruscos. Pero la tecnología ha mejorado rápidamente.
Runway, una startup que crea modelos generativos de video (y la empresa que co-creó Stable Diffusion), lanza nuevas versiones de sus herramientas cada pocos meses. Su último modelo, llamado Gen-2, aún genera videos de solo unos pocos segundos de duración, pero la calidad es sorprendente. Los mejores clips no están lejos de lo que Pixar podría producir.
Runway ha creado un festival anual de cine de IA que muestra películas experimentales hechas con una variedad de herramientas de IA. El festival de este año tiene un premio de $60,000 y las 10 mejores películas se proyectarán en Nueva York y Los Ángeles.
No es sorprendente que los grandes estudios estén prestando atención. Gigantes del cine, como Paramount y Disney, están explorando el uso de la IA generativa en toda su cadena de producción. La tecnología se utiliza para sincronizar labios de actores con doblajes en múltiples idiomas extranjeros. Y está reinventando lo que es posible con efectos especiales. En 2023, Indiana Jones y el Dial del Destino presentó a un rejuvenecido Harrison Ford hecho con deepfake. Esto es solo el comienzo.
Fuera de la gran pantalla, la tecnología deepfake para fines de marketing o entrenamiento también está despegando. Por ejemplo, la empresa con sede en el Reino Unido, Synthesia, crea herramientas que pueden convertir una actuación única de un actor en un flujo interminable de avatares deepfake, recitando cualquier guión que se les dé con solo presionar un botón. Según la empresa, su tecnología ahora es utilizada por el 44% de las empresas Fortune 100.
La capacidad de hacer tanto con tan poco plantea serias preguntas para los actores. Las preocupaciones sobre el uso y el abuso de la IA por parte de los estudios fueron el centro de las huelgas de SAG-AFTRA el año pasado. Pero el verdadero impacto de la tecnología apenas comienza a hacerse evidente. «La artesanía del cine está cambiando fundamentalmente», dice Souki Mehdaoui, cineasta independiente y cofundador de Bell & Whistle, una consultora especializada en tecnologías creativas.
Tendencia 3: La desinformación electoral generada por IA estará en todas partes
Si las elecciones recientes sirven de ejemplo, la desinformación electoral generada por IA y los deepfakes serán un gran problema a medida que un número récord de personas marche a las urnas en 2024. Ya estamos viendo cómo los políticos están utilizando estas herramientas. En Argentina, dos candidatos presidenciales crearon imágenes y videos generados por IA de sus oponentes para atacarlos. En Eslovaquia, los deepfakes de un líder de un partido liberal proeuropeo amenazando con aumentar el precio de la cerveza y haciendo chistes sobre la pornografía infantil se propagaron como un reguero de pólvora durante las elecciones del país. Y en Estados Unidos, Donald Trump ha alentado a un grupo que utiliza la IA para generar memes con estereotipos racistas y sexistas.
Si bien es difícil decir cuánto han influido estos ejemplos en los resultados de las elecciones, su proliferación es una tendencia preocupante. Será más difícil que nunca reconocer lo que es real en línea. En un clima político ya inflamado y polarizado, esto podría tener graves consecuencias.
Hace solo unos años, crear un deepfake requeriría habilidades técnicas avanzadas, pero la IA generativa lo ha hecho ridículamente fácil y accesible, y los resultados son cada vez más realistas. Incluso fuentes respetables podrían ser engañadas por contenido generado por IA. Por ejemplo, imágenes generadas por IA presentadas por usuarios que pretenden representar la crisis de Israel y Gaza inundaron los mercados de imágenes de archivo como Adobe.
El próximo año será crucial para quienes luchan contra la proliferación de dicho contenido. Las técnicas para rastrear y mitigar este contenido todavía están en las primeras etapas de desarrollo. Las marcas de agua, como SynthID de Google DeepMind, todavía son en su mayoría voluntarias y no completamente infalibles. Y las plataformas de redes sociales son notoriamente lentas para eliminar la desinformación. Prepárense para un experimento en tiempo real para desacreditar las noticias falsas generadas por IA.
Tendencia 4: Robots que hacen varias tareas
Inspirados en algunas de las técnicas fundamentales detrás del auge actual de la IA generativa, los robóticos están comenzando a construir robots de propósito más general que pueden realizar una amplia gama de tareas.
Los últimos años en IA han visto un cambio de usar múltiples modelos pequeños, cada uno entrenado para hacer tareas diferentes: identificar imágenes, dibujarlas, titularlas, hacia modelos monolíticos entrenados para hacer todas estas cosas y más. Al mostrarle a GPT-3 de OpenAI algunos ejemplos adicionales (conocidos como ajuste fino), los investigadores pueden entrenarlo para resolver problemas de codificación, escribir guiones de películas, pasar exámenes de biología de secundaria, y más. Los modelos multimodales, como GPT-4 y Gemini de Google DeepMind, pueden resolver tareas visuales además de lingüísticas.
El mismo enfoque puede funcionar para los robots, por lo que no sería necesario entrenar uno para hacer panqueques y otro para abrir puertas: un modelo único podría dar a los robots la capacidad de hacer varias tareas. En 2023, surgieron varios ejemplos de trabajo en esta área.
En junio, DeepMind lanzó Robocat (una actualización del Gato del año pasado), que genera sus propios datos a partir de la prueba y error para aprender a controlar muchos brazos de robot diferentes (en lugar de un brazo específico, que es más típico).
En octubre, la compañía lanzó otro modelo de propósito general para robots, llamado RT-X, y un gran conjunto de datos de entrenamiento de propósito general, en colaboración con 33 laboratorios universitarios. Otros equipos de investigación de primer nivel, como RAIL (Robotic Artificial Intelligence and Learning) en la Universidad de California, Berkeley, están investigando tecnología similar.
El problema es la falta de datos. La IA generativa se basa en un conjunto de datos de texto e imágenes del tamaño de Internet. En comparación, los robots tienen muy pocas fuentes de datos sólidas para ayudarlos a aprender a hacer muchas de las tareas industriales o domésticas que queremos que hagan.
Lerrel Pinto de la Universidad de Nueva York lidera un equipo que aborda ese problema. Él y sus colegas están desarrollando técnicas que permiten a los robots aprender mediante ensayo y error, generando sus propios datos de entrenamiento a medida que avanzan. En un proyecto aún más discreto, Pinto ha reclutado voluntarios para recopilar datos de video de sus hogares utilizando una cámara de iPhone montada en un recogedor de basura. Las grandes empresas también han comenzado a liberar grandes conjuntos de datos para entrenar robots en los últimos años, como Ego4D de Meta.
Este enfoque ya está mostrando resultados prometedores en los autos sin conductor. Startups como Wayve, Waabi y Ghost están liderando una nueva ola de IA para la conducción autónoma que utiliza un solo modelo grande para controlar un vehículo en lugar de múltiples modelos más pequeños para controlar tareas de conducción específicas. Esto ha permitido que las pequeñas empresas alcancen a gigantes como Cruise y Waymo. Wayve está probando sus autos sin conductor en las estrechas y concurridas calles de Londres. Los robots en todas partes están a punto de recibir un impulso similar.
Estas son las cuatro tendencias candentes que debemos seguir de cerca en 2024 en el mundo de la inteligencia artificial. La IA sigue evolucionando y sorprendiéndonos con sus avances. Mantenerse actualizado con estas tendencias es esencial para comprender cómo está dando forma al futuro de la tecnología y la sociedad.
HASHTAGS:
#IA #InteligenciaArtificial #Tecnología #Innovación #Deepfakes #Chatbots #Robots #Tendencias #2024