Una de las áreas de investigación mas prometedoras de la ultima década es sin duda la inteligencia artificial. No solamente reúne una increíble cantidad de regiones del conocimiento que, superficialmente, son demasiado dispares (tales como la filosofía de la mente, la psicología, la biología, la robótica, la lógica pura, entre muchas otras), sino que también los resultados de sus publicaciones se vuelven relevantes de forma retroactiva para las áreas de la ciencia de cuya historia se nutre. El estudio y la utilización de las redes neuronales y el aprendizaje automático (o machine learning) ha demostrado ser increíblemente útil no solamente a la hora de realizar investigaciones regulares con estas técnicas, sino también para crear nuevas herramientas de simulación y experimentación, tanto para uso científico como el particular o comercial.

Aunque el machine learning aun tiene sus problemas y misterios por resolver, ya como area de investigación ha producido muchos hallazgos y descubrimientos de increíble importancia para la ingeniería de sistemas y demás áreas relacionadas con la informática. Ya para aquellos que trabajan día a día haciendo experimentos con librerías tales como TensorFlow se vuelve una cuestión de suma importancia el andar pendiente de que nuevos artículos se publican o que nuevas aplicaciones se descubren para el machine learning, por no decir de que nuevas e increíbles mejoras se podrían realizar a proyectos anteriores, tales como los llamados ‘deep fake‘.

Muchas de las herramientas desarrolladas con inteligencia artificial poseen código fuente y bases de datos libremente disponibles para el publico. Ya sea para fines comerciales o simplemente como demostración, estan aquellas que a su vez poseen una aplicación web mediante la cual puedes interactuar con los scripts de una forma directa, realizando manipulación y generación de audio, imágenes o demás de una forma directa y sencilla, pero no por eso menos eficaz. De esta manera los usuarios pueden ver el funcionamiento del programa sin necesidad de compilarlo o de que el autor cree demostraciones, además que ayuda a difundir el proyecto si se permite la creación de contenidos independientes.

Tacotron 2: Generación de audios donde se leen textos con las voces de personas reales

Tacotron 2 se trata de una implementación por TensorFlow de una arquitectura de redes neuronales profunda que busca sintetizar habla a partir de texto. Enlazada a un modelo generativo de formas de ondas llamado WaveNet, el cual fue utilizado anteriormente para el mismo propósito, Tacotron 2 entrena la red neuronal utilizando una base de datos de voces anteriormente grabadas para crear espectrogramas en la escala Mel, lo cual a su vez permite su utilización para emular las voces de personas vivas o inclusive ya muertas, dado que tengan la suficiente cantidad de grabaciones disponibles. Los resultados son impresionantes, y se pueden ver, por ejemplo, en el canal de YouTube llamado Vocal Synthesis, donde se leen copypastas y demás textos con las voces de Ronald Reagan, The Notorious B.I.G., Ayn Rand, o inclusive la Reina Elizabeth, o en el sitio fifteen.ai, donde se pueden generar audios con las voces de personajes de series animadas.

Animación de imágenes a partir de un video

En un paper escrito por Siarohin et al. en el 2019, se demostró un framework que permite la creación de animaciones a partir de una imagen base «fuente» y un video que «conduce» la animación, mediante el entrenamiento de una red neuronal con vídeos de una misma ‘categoría’. Lo que esto permite es realizar cosas tales como cambiar las caras de las personas presentes en una grabación por las de otras, alterar el estilo de una animación, cambiar la ropa que tiene puesta una persona en un vídeo, entre otras. Como te podrás imaginar, esto permite la creación tanto de deepfakes o vídeos promocionales ‘falsos’ como de otras alteraciones (dar vida a la Mona Lisa, por ejemplo), y es increíblemente convincente con la edición adecuada, como se puede observar en el video suplementario que muestran.

MuseNet: Una red neuronal que ‘continua’ tu música

MuseNet es un proyecto muy simple: se trata simplemente de una red neuronal profunda que fue creada con el propósito de crear música. Sus creadores afirman que es capaz de crear piezas de 4 minutos con 10 instrumentos distintos, «y que puede combinar estilos desde el country hasta inclusive Mozart o los Beetles». Ya que ha sido entrenada a encontrar «patrones de armonía, ritmo y estilo aprendiendo a predecir el siguiente token en cientos de miles de archivos MIDI», se le puede pedir que, por ejemplo, utilice las primeras 6 notas de un Nocturno de Chopin para generar una pieza con una instrumentación pop rock, el cual es un ejemplo que se ve en la pagina. Además, OpenAI permite que cualquiera pruebe la generación de audio mediante esta red desde la pagina del proyecto para que cualquiera cree nuevas composiciones.

Una inteligencia artificial que ‘mira’ a traves de las paredes mediante señales WiFi

En este paper publicado por Zhao et al. se presenta una aplicación llamada RF-Pose que analiza las señales radio en las frecuencias WiFi, aprovechándose que estas señales inalámbricas traspasan las paredes y se reflejan del cuerpo humano, para estimar poses 2D. Para estimar la pose, únicamente es necesaria la señal inalámbrica, siendo aspectos relevantes del individuo tales como altura o anchura predichos a partir de esta. Por lo tanto, aunque sea igualmente eficaz para predecir poses 2D como lo es la visión humana, la diferencia radica en que es capaz de predecir estas inclusive si su ‘visión’ esta siendo interferida por un obstáculo, tal como una pared. Los resultados llegan a ser asombrosos, y a la vez, algo perturbadores.

Detección de cancer de seno mediante un sistema de inteligencia artificial

La mamografía es la principal herramienta que tienen los médicos a mano para identificar y prevenir el cancer de mama antes de que síntomas mas serios ocurran. Sin embargo, exige que hayan expertos que identifiquen y interpreten dentro de las imágenes generadas por este proceso ciertas anormalidades, lo cual esta sujeto al error humano y, por lo tanto, sufre de tasas subóptimas de falsos positivos y negativos. Por lo tanto, en este paper publicado por Etemadi et al. en el 2020 se buscó crear un sistema que utilizara la inteligencia artificial para ayudar a los médicos a identificarlo, y sorprendentemente, se encontró que el sistema no solamente funcionaba, sino que reducía los errores de manera significativa, aunque obviamente no era inmune a ellos. También, los autores creen que con este tipo de sistemas se podrían realizar de una forma mucho mas eficaz esta detección en los paises que no posean los recursos necesarios para realizarla en números mayores.

Deja una respuesta