Soluciones de inteligencia artificial para voz, imagenes, y texto de Amazon

Palabras clave

Amazon
Autor:
La compañía presentó Amazon Lex, Amazon Polly, y Amazon Rekognition
IA con Amazon

Amazon Web Services (AWS) anunció tres servicios de inteligencia artificial, construidas por expertos en aprendizaje profundo y machine learning, que facilitan la construcción a cualquier desarrollador y liberándolo de procesos complicados, pues las soluciones, además de escalables y rentables, no brindan algoritmos para construir, ya que son servicios administrados, que evitan entrenamientos, compromisos iniciales, e inversiones de infraestructura.

INFORMACION

Amazon Lex, uno de los servicios, permite crear interfaces conversacionales utilizando la voz y el texto que está construido sobre la misma tecnología de reconocimiento de voz automático (ASR) y la comprensión del lenguaje natural (NLU) que Amazon Alexa.

Lex lleva fácilmente sofisticadas capacidades de lenguaje natural a casi cualquier aplicación, de voz o de texto, en dispositivos móviles o conectados, desde las cuales los usuarios pueden pedir, por ejemplo, reservar un vuelo. Lex construye el modelo de lenguaje y hace las preguntas de seguimiento necesarias.

Con Amazon Polly se puede añadir capacidades de voz con sonido natural a aplicaciones existentes, como lectores de noticias o plataformas de e-learning, desde aplicaciones o apps móviles. Los desarrolladores pueden enviar texto a Polly usando el SDK o desde AWS Management Console y Polly devuelve una secuencia de audio que se puede reproducir o almacenar. Cuenta con 47 voces realistas en 24 idiomas (con variedad de acentos), con voces masculinas y femeninas.

Por último, Amazon Rekognition es un servicio que permite crear rápida y fácilmente aplicaciones que analizan imágenes y reconocen rostros, objetos y escenas. La solución usa tecnologías de aprendizaje profundo para identificación automática, y permite etiquetar imágenes para que los usuarios busquen material específico utilizando palabras clave.

Además de poder detectar atributos en los rostros, como si una persona está sonriendo, también tiene funcionalidades avanzadas de análisis faciales, como comparación y búsqueda facial. Rekognition elimina la complejidad y la sobrecarga requerida para desarrollar y administrar tuberías costosas de procesamiento de imágenes.

Los tres servicios son autoescalables y, los desarrolladores sólo pagan por las llamadas realizadas, los textos convertidos, las imágenes analizadas, y los vectores de características faciales almacenados. En Virginia del Norte, Oregon, y Dublín ya están disponibles Amazon Relognition y Polly, éste último también se encuentra en Oregon.

AWS anunció también que está invirtiendo en MXNet, un framework de aprendizaje profundo, distribuido de código abierto, que permitirá construir modelos escalables de aprendizaje profundo para reducir el tiempo de entrenamiento para sus aplicaciones.

Contenido relacionado:

¡ Déjanos un comentario !