ChatGPT y otras IA: imaginarnos preguntas diferentes
Las inteligencias artificiales generativas como ChatGPT y Midjourney han impactado en diversas industrias y están redefiniendo el mercado laboral gracias a la rapidez con que producen imágenes y escriben textos. A medida que la IA se convierte en una aliada creativa de los seres humanos, es necesario comprender sus alcances y limitaciones.
A prueba y error, después de refinar las instrucciones en la interfaz de Midjourney, una inteligencia artificial (IA) de generación de imágenes, el fotógrafo Jvdas Berra consiguió lo que estaba buscando: recrear una imagen de su cantante favorito, Harry Styles, vestido de Gucci, mientras sostiene unas manzanas, en un atardecer junto al mar. De calidad fotográfica, este retrato no difiere mucho de las capturas que Berra suele realizar, para las cuales ha tenido bajo su cámara a modelos de distintas complexiones en los escenarios más diversos. En su portafolio aparecen modelos ataviados con vestidos vaporosos o abrigos de colores intensos que armonizan con locaciones como las aguas rosas de Las Coloradas, en Yucatán, o las ruinas boscosas del castillo de Alt-Bechburg, en Suiza. Berra, de 35 años, nacido en Veracruz, pero residente en Milán, define su trabajo como maximalista, barroco y “surrealista mexicano”. Una combinación de estilos con los que ahora entrena a la IA para generar imágenes que, dice, solo estaban antes en su imaginación.
Midjourney, cuyo enfoque es la utilización de IA para generar contenido a partir de las instrucciones de los usuarios, es solo uno de los múltiples servicios que han irrumpido en el último par de años. El programa dibuja imágenes hiperrealistas, con estilo de anime, en acuarela o cualquier técnica que se solicite. Cada IA tiene un método distinto para recibir instrucciones. Midjourney, por ejemplo, funciona con un chat en Discord, una plataforma en la que es posible interactuar con usuarios de intereses comunes. Así fue como Berra aprendió a dictar comandos. El programa responde en forma de imágenes hasta que el usuario queda satisfecho con el resultado. En su versión más reciente, puede generar una secuencia de fotogramas con solo alejar la imagen. Así, cuando el enfoque se expande, aparecen elementos antes imperceptibles: Harry Styles con un traje de pirata, bajo olas que rompen en acantilados, frente a un campo de rosas, observa todo desde una bola de cristal. “Para mí [usar IA] es increíble, es lo más, me da opciones infinitas. Si antes con Photoshop ya sentía que contaba con un poder de creación casi ilimitado, ahora con la IA ya no tengo límites”, dice Berra.
El motor de búsqueda de Google, la interfaz de las cámaras en los smartphones, la voz de Alexa en Amazon son ejemplos de IA en acción. Pero recientemente hemos visto un mayor impacto de las IA que pueden generar contenido en forma de texto, sonido, imagen y video, lo que ha permeado sobre todo a las industrias que usan estas formas de comunicación.
Midjourney, con foco en las imágenes, tiene más de trece millones de usuarios. Surgió en julio de 2022 en el laboratorio tecnológico homónimo, con sede en San Francisco. Adobe Firefly, su competencia, presentó en marzo pasado su fase beta. ChatGPT, un bot de texto creado por la empresa OpenAI, llegó a cien millones de usuarios solo dos meses después de su lanzamiento. La misma compañía también desarrolló Dall-E, que genera cuatro millones de imágenes por día y ahora está integrado en el buscador Microsoft Bing. Por su parte, Google declaró “código rojo” en diciembre pasado —una alerta de emergencia dentro de la empresa, según The New York Times— y estableció como prioridad central el desarrollo de Bard, para hacerle frente a ChatGPT. Desde febrero de 2023, el nuevo chat ya está disponible, con capacidad de comprender cuarenta idiomas.
Las IA “funcionan un poco como el cerebro humano, que consiste en nodos y neuronas interconectados en un sistema muy complejo, que les permite la habilidad de crear contenido a partir de una enorme cantidad de datos disponibles con que fueron entrenadas”, dice Chau Tong, científica social computacional de la Universidad Cornell e investigadora de la escuela de Ciencia de Datos de la Universidad de Misuri.
La carrera tecnológica de la IA robó la atención pública. Apenas en marzo de 2022, Mark Zuckerberg, CEO de Meta, hablaba del metaverso como el futuro no solo de Facebook, sino de todo el internet, y empresas como Nvidia, Epic Games o Microsoft invertían millones de dólares en su desarrollo.
Pero la perspectiva de mundos montados en realidad virtual como relevo de la navegación tradicional por internet todavía está lejos de cumplirse. Lo explica Carlos Alarcón, director de la Escuela de Ciencia de Datos en Platzi. “Para el metaverso necesitamos hardware específico, la tecnología está aún muy joven y las aplicaciones son muy limitadas”, apunta. Cuando le pregunto sobre la popular adopción de chats de IA, dice que no solo jugó a favor el hecho de que los usuarios puedan acceder a ellos desde cualquier dispositivo con acceso a internet, sino su utilidad para industrias como salud (analizar datos médicos), desarrollo de software (corregir y predecir código), marketing (escribir mails y textos comerciales), diseño gráfico (generación de elementos), entre otras. “Básicamente cualquier nicho de nuestra economía va a ser impactado con la IA”, enfatiza.
«[Usar IA] es increíble, me da opciones infinitas. Si antes con Photoshop ya sentía que contaba con un poder de creación casi ilimitado, ahora con la IA ya no tengo límites».
En la mente de la IA
Guillermo Fontes, de 52 años, se enteró hace unos meses, por las noticias, de la existencia de chats que usan IA para generar contenido. “Primero me pareció una amenaza. Dije: ‘Se acabaron los escritores’”, recuerda desde Campana, Argentina, donde reside. Autor de libros de cuentos y poemas, se decidió a probar ChatGPT. Le pidió generar un relato de Navidad para el cual no tenía ninguna idea. “Me tiró un cuento muy básico, que era como para un chico de cuatro años”, dice. Pero después de intentar cuatro o cinco veces más, con ajustes a la instrucción, surgió lo que Fontes consideraba una narración más o menos plausible. Desde entonces, usa el sistema como un disparador de ideas sobre cuentos de terror o de cualquier género para el que necesite sugerencias. Dice que es su asistente creativo, a partir del cual desarrolla tramas y personajes. “Esto nos va a dar más trabajo, porque puede facilitarnos disparar nuestra creatividad. No va a reemplazar nuestra creatividad, sino que va a abrirnos la mente”, sentencia.
ChatGPT está construido bajo un modelo grande de lenguaje (LLM, por sus siglas en inglés) que aprovecha la red neuronal de donde obtiene su información. “El modelo aprende complejos patrones estadísticos y relaciones entre palabras de un idioma para predecir cuál va a ser la siguiente secuencia de palabras, una a la vez”, dice Chau Tong. Sin embargo, agrega Fontes, “no utiliza recursos literarios avanzados, solo describe situaciones en un formato lógico y entendible. No he podido desarrollar buenas metáforas que tengan una concordancia literaria”. El chat no ha logrado generar imitaciones de estilos literarios ni proponerle poemas que expresen experiencias, emociones o sentimientos complejos. Por eso, lo ve como un aliado para pensar ideas.
Las IA como ChatGPT son propensas a “alucinaciones” cuando están 100% seguras de lo que responden, aunque no sea verdadero lo que dicen, explica Carlos Alarcón. “No planean lo que van a decir, simplemente por probabilidad y estadística te dan una definición de qué palabras deberían ir para suplir una necesidad”. Además, los chats solo pueden estar tan actualizados como las bases de datos sobre las que se entrenaron. “Mis respuestas están limitadas al conocimiento disponible hasta mi más reciente actualización”, contesta ChatGPT a la pregunta sobre el origen de su base de datos.
Tong utiliza servicios montados en la tecnología de ChatGPT para optimizar sus tareas de investigación y académicas. Por ejemplo, HeyGPT, que puede transcribir audio, escuchar voz, leer documentos, entre otras funciones. “Puedo pedir: ‘Escríbeme un resumen de este artículo y sus principales hallazgos’”, cuenta sobre cómo se mantiene actualizada en lo más reciente de la investigación científica. También lo utiliza para encontrar artículos similares o para ayudar a redactar y corregir sus textos en inglés, que es su segunda lengua, como hablante materna de vietnamita. Y como profesora, agrega, ella y otros colegas ya están integrando la IA en las tareas que encargan a sus estudiantes, después del pánico inicial que generó en la educación. “Los estudiantes tienen que reportar cómo usaron las herramientas y cómo les ayudaron en sus tareas, y adjuntar una transcripción de su interacción con el chat”, dice. Parte de la evaluación incluye la creatividad en las peticiones, así como la revisión de plagio. “Soy transparente con ellos acerca de cómo queremos que usen la IA y de cómo serán recompensados por usarla adecuadamente, o amonestados en caso contrario”.
Un modelo contaminado
En la industria, la irrupción de la IA generativa está sirviendo para mejorar el funcionamiento de chats de texto y voz de servicio al cliente, predecir y mejorar el “código fuente” escrito por desarrolladores de software, acelerar la creación de apps y suplir carencias en puestos de trabajo especializados. “La IA va a jugar un papel importante en la habilitación de profesionales de software, para llenar el gap entre el talento y los desarrolladores que está demandando el mercado”, dice Diego Herrera, gerente comercial de OutSystems en México. La empresa se dedica a la construcción de aplicaciones de alto rendimiento a través de una metodología llamada low code, en la que los desarrolladores se apoyan en sistemas inteligentes para completar gran parte de su trabajo.
En la actual infancia de las IA, usuarios e investigadores por igual han encontrado que estas pueden sacar lo mejor y también lo peor de internet. “Lastimosamente internet tiene sesgos raciales, de género o religión, y esto muchas veces lo aprenden los modelos de IA”, dice Carlos Alarcón. En la carrera tecnológica por lanzar sus propios modelos de lenguaje, las empresas necesitan acceder a enormes bases de datos que contengan texto e imágenes, pero que pueden estar contaminadas. “Si tienes datos de entrada problemáticos, con información tóxica, con propaganda política, prejuicios, discurso de odio, va a afectar enormemente al modelo”, dice Chau Tong. Para contrarrestar estos problemas, los laboratorios detrás de su desarrollo añaden filtros de moderación o recurren a bases de datos especializadas. “Equipos como el de Midjourney utilizan bases de datos de altísima calidad, privados, a los que no tenemos acceso, que son muy artísticos; por eso cuando pedimos una imagen casi siempre la pinta a más resolución”, dice Alarcón.
También está el tipo de contenido que generan los usuarios, entre el plagio y la desinformación. En marzo de 2022 se viralizaron imágenes del papa Francisco vestido con ropa moderna de marcas de lujo, incluyendo tenis y chamarras. Fueron generadas con la IA de Midjourney y, como respuesta, la empresa cerró el acceso gratuito a su servicio. Ahora cuesta desde diez dólares por tres horas y media de uso al mes, que usuarios como Jvdas Berra no tienen problema en pagar. “Cada quien deberá discernir entre lo real y lo ficticio —dice el fotógrafo—. Hay que saber que existe la IA y que se están creando imágenes, videos, música”. En su experiencia, las reglas impiden procesar instrucciones que incluyan palabras como “sangre”, “desnudo”, entre otras peticiones ofensivas o violentas.
“Si tienes datos de entrada problemáticos, con información tóxica, con propaganda política, prejuicios, discurso de odio, va a afectar enormemente al modelo”.
Puestos de trabajo en creación
En marzo de 2022, OpenAI publicó un artículo sobre el impacto de ChatGPT en el mercado laboral de Estados Unidos. La conclusión de los autores del texto “GPTs are GPTs: an early look at the labor market impact potential of large language models” fue que, para 80% de la fuerza laboral, la IA alterará al menos 10% de sus tareas, y que hasta 19% de los empleados verá la mitad de sus tareas afectadas de una u otra forma por esta tecnología. Traductores, contadores, matemáticos, desarrolladores de software, periodistas aparecieron entre los profesionales más impactados. Pero, aunque algunos medios ya han reportado pérdidas de empleos por la llegada de la IA, como The Washington Post, al hablar de profesionales de creación de contenido que fueron despedidos o perdieron clientes por esta razón, Chau Tong considera que el papel humano no dejará de ser importante.
Las labores más inmediatas serán, primero, seguir entrenando los modelos que requieren enormes cantidades de información, y segundo, validar el contenido que generan, lo que en sí mismo es un nuevo género de empleo. “Se necesita un tipo de razonamiento humano para estas tareas, ya que los modelos actuales simplemente no son buenos, y no creo que sea algo que vaya a cambiar en el futuro”, dice Tong. Según Upwork, una plataforma de contratación de trabajadores remotos, 49% de los líderes de empresas estadounidenses planean contratar a más empleados de tiempo completo y freelancers como resultado de la IA generativa. “Contrario al pesimismo de algunos titulares que presagian una reducción de la fuerza laboral debido a la IA generativa, los directivos de empresas lo ven como una razón para contratar”, dice Kelly Monahan, directora del Upwork Research Institute, en la encuesta realizada por esta empresa entre más de 1 400 líderes de compañías en Estados Unidos. Las categorías de desarrollo e informática, así como los servicios de IA, ahora son la mayor tendencia de búsqueda de talento en Upwork.
“No hay que negar que muchos de los hitos históricos a nivel de tecnología de la sociedad llevan consigo a que otros empleos acaben”, dice Carlos Alarcón. Pone como ejemplo el reemplazo del trabajo de los elevadoristas, una vez que se popularizaron los ascensores automáticos. En el futuro cercano, ve desaparecer tareas como el análisis humano de radiografías en los hospitales, pues la IA puede encargarse de examinar fracturas y otros problemas de salud en estas imágenes. “Entre más necesites entender emociones humanas, menos va a ser reemplazado tu trabajo”, anticipa.
Muchas de las aplicaciones de IA en la industria médica no están necesariamente conectadas con ChatGPT para dar consultas, sino con empresas especializadas que atienden esta industria. Por ejemplo, Quibim, en Valencia, tiene productos con IA entrenados para analizar imagen por resonancia magnética y detectar tumores cerebrales o de próstata. Las investigaciones ahora están usando redes neuronales artificiales para predecir condiciones que puedan llevar a fallas cardiacas difíciles de detectar.
Gatopardo encontró el caso de investigación de Amira Amin, de veintiocho años, originaria de El Cairo, Egipto, y actual estudiante del doctorado en Ingeniería Biomédica en la Universidad de Arkansas. Si para entrenar a ChatGPT se usan grandes bases de datos de texto, o para Midjourney se echa mano de millones de imágenes, para capacitar a una IA en medicina es necesario el gran banco de información proveniente de miles y miles de pruebas realizadas por décadas en la ciencia médica, explica. “La IA y el aprendizaje automático son herramientas de procesamiento que nos permiten analizar todos esos datos con una nueva perspectiva y hacernos preguntas diferentes, ya sea en práctica clínica, biología molecular, inmunología, etc.”, dice Amin desde Fayetteville, Arkansas.
Platzi lanzó en marzo pasado un curso para capacitarse sobre cómo interactuar con las IA generativas. Alarcón dice que las vacantes de empleos pronto comenzarán a requerir el dominio de ChatGPT y otros LLM específicos, de la misma manera en que ahora se solicita el uso de Excel o navegadores web. “Que manejen IA no es que sepan la estadística, álgebra, Python, cómo funciona su arquitectura, sino que solo sepan utilizar estas herramientas para su día a día”. Sobre cuánto tiempo falta para que impacte todas las áreas de trabajo, Alarcón responde: “El suficiente para que nos podamos formar y saber cómo encajar en la sociedad”.
JOSÉ LUIS ADRIANO. Tiene una maestría en Data Journalism por la Universidad de Misuri y es licenciado en Periodismo por la Universidad de Guadalajara. Actualmente es periodista de tecnología freelance; colabora para medios como TecReview, Gatopardo y Expansión, y es reportero de datos en The Dallas Morning News. Ha cubierto eventos sobre tecnología en España, Brasil, Argentina, Corea del Sur y Estados Unidos, y asistió a ferias como el Mobile World Congress o el Consumer Electronics Show, cuando fue reportero y después editor en la sección de tecnología de Reforma. Ha escrito sobre ciberseguridad, tecnología de consumo, redes sociales y big data, entre otros temas relacionados con la ciencia y la tecnología. En esta edición escribió sobre el impacto de las IA y ChatGPT.
Recomendaciones Gatopardo
Más historias que podrían interesarte.