El martes pasado, el laboratorio de investigación de inteligencia artificial OpenAl lanzó la nueva actualización de su sistema de lenguaje software, el GPT-4. Se trata de una herramienta de avanzada para analizar imágenes e imitar el habla de los seres humanos.
ChatGPT es el antecesor más reciente del nuevo software. Tuvo la capacidad de cautivar e inquietar al público con su habilidad de generar una escritura formal e informal, siendo útil para elaborar ensayos universitarios, guiones y conversaciones. Su limitación era esa, solo podía generar textos.
GPT-4 por el contrario, es un sistema de última generación capaz de crear no solamente palabras, sino también de describir imágenes en respuesta a los comandos escritos simples de una persona. Cuando aparece la foto de un guante de boxeo colgando sobre un balancín de madera con una pelota en un lado, por ejemplo, una persona puede preguntar qué sucederá si el guante se cae. GPT-4 responderá automáticamente que golpearía al objeto y haría volar a la pelota.
Los desarrolladores prometieron, a través de una publicación el martes pasado, que la tecnología podría revolucionar aún más el trabajo y la vida. Pero estas promesas alimentaron también la ansiedad sobre cómo las personas podrán competir por trabajos subcontratados a máquinas altamente refinadas, o mismo confiar en la precisión de lo que ven en línea.
Los funcionarios del laboratorio de San Francisco declararon que el entrenamiento “multimodal” de GPT-4 en texto e imágenes, le permitiría escapar del cuadro de chat y emular de forma más completa a un mundo de color e imágenes, superando a ChatGPT en sus “capacidades de razonamiento avanzadas”. Actualmente, una persona puede enviar una imagen a GPT-4 y éste la subtitulará.
Los rápidos avances de la IA, junto a la enorme popularidad del ChatGPT, impulsaron una carrera armamentista multimillonaria sobre el futuro del dominio de la IA, transformando de a poco a los nuevos lanzamientos de software en grandes espectáculos.
OpenAI y Microsoft lanzaron, a fines del año pasado, un chatbot impulsado por GPT en su herramienta de búsqueda Bing, el cual tuvo como fin contrarrestar a Google y a otros pioneros de la IA con la idea de que estas herramientas podrían resultar fundamentalmente cruciales para las industrias futuras.
Pero el frenesí también trajo algunas críticas, expresando que las empresas que se apresuran a explotar una tecnología no probada, no regulada e impredecible que podría engañar a la gente, terminan socavando el trabajo de los artistas y provocan daños en el mundo real.
Los modelos de lenguaje de IA a menudo ofrecen respuestas incorrectas con confianza porque están diseñados para escupir frases convincentes, no hechos reales. Y debido a que han sido capacitados en texto e imágenes de Internet, también han aprendido a emular los prejuicios humanos de raza, género, religión y clase.
Dichos sistemas inspiraron un optimismo ilimitado alrededor del potencial de esta tecnología. Y algunos ven en sus respuestas, incluso, una sensación de inteligencia o sensibilidad casi a la par de los humanos. Sin embargo, los sistemas, como los críticos y los investigadores de IA se apresuran a señalar, simplemente repiten patrones y asociaciones que se encuentran en sus datos de entrenamiento sin una comprensión real de lo que está diciendo, sin importar si está bien o mal.
A pesar de su falta de fiabilidad, Silicon Valley ve un enorme potencial económico en este tipo de IA debido a la facilidad de uso de estos modelos. Cualquiera puede escribir lo que se conoce como un “mensaje” en inglés simple en un cuadro de chat, lo que permite a las personas que no saben cómo escribir en código, comunicarse con las máquinas de la misma manera que lo han hecho los programadores de computadoras durante décadas.
GPT-4, el cuarto “transformador preentrenado generativo” desde el primer lanzamiento de OpenAI en 2018, consiste en una técnica de red neuronal innovadora en 2017, conocida como el transformador que avanzó rápidamente en la forma en que los sistemas de IA pueden analizar patrones en el habla y en las imágenes humanas.