¿Qué es el reconocimiento de voz?

Mensajería, VoIP

VALORACIÓN DEL ARTÍCULO:

 5/5

El reconocimiento de voz es una tecnología que permite la entrada de voz en los sistemas. Usted le habla a su computadora, teléfono o dispositivo y utiliza lo que usted dijo como entrada para activar alguna acción. La tecnología se está utilizando para reemplazar otros métodos de entrada como escribir, hacer clic o seleccionar de otras maneras. Es un medio para hacer que los dispositivos y el software sean más fáciles de usar y para aumentar la productividad.

Existen muchas aplicaciones y áreas en las que el reconocimiento de voz se utiliza, incluso en el ámbito militar, como ayuda para personas discapacitadas (imagínese a una persona con las manos o los dedos lisiados o sin ellos), en el campo médico, en robótica, etc. En un futuro próximo, casi todo el mundo estará expuesto al reconocimiento de voz debido a su propagación entre dispositivos comunes como ordenadores y teléfonos móviles.

Algunos teléfonos inteligentes están haciendo un uso interesante del reconocimiento de voz. Los dispositivos iPhone y Android son ejemplos de ello. A través de ellos, usted puede iniciar una llamada a un contacto simplemente recibiendo instrucciones habladas como «Call office». Otros comandos también pueden ser entretenidos, como «Activar Bluetooth».

Problemas con el reconocimiento de voz

El reconocimiento de voz, en su versión conocida como Speech to Text (STT), también se ha utilizado durante mucho tiempo para traducir palabras habladas en texto. «Tú hablas, él escribe», como diría ViaVoice en su caja. Pero hay un problema con el STT tal como lo conocemos. ViaVoice es uno de los mejores de la industria, así que imagínese el resto. La tecnología ha madurado y mejorado, pero el habla a texto todavía hace que la gente haga preguntas. Una de sus principales dificultades son las inmensas variaciones entre las personas en la pronunciación de las palabras.

No todos los idiomas se suponen en el reconocimiento de voz, y los que lo hacen a menudo no están tan bien soportados como el inglés. Como resultado, la mayoría de los dispositivos que ejecutan software de reconocimiento de voz funcionan razonablemente sólo en inglés.

Un conjunto de requisitos de hardware hace que el reconocimiento de voz sea difícil de implementar en ciertos casos. Necesita un micrófono que sea lo suficientemente inteligente para filtrar el ruido de fondo, pero al mismo tiempo lo suficientemente potente para captar la voz de forma natural.

Hablando de ruido de fondo, puede causar que todo un sistema falle. Como resultado, el reconocimiento de voz falla en muchos casos debido a ruidos que están fuera del control del usuario.

El reconocimiento de voz está demostrando ser mejor como un método de entrada para nuevos teléfonos y tecnologías de comunicación como VoIP, que como una herramienta de productividad para la entrada masiva de texto.

Aplicaciones del reconocimiento de voz

La tecnología está ganando popularidad en muchas áreas y ha tenido éxito en las siguientes:

Control de dispositivos . El simple hecho de decir «OK Google» a un teléfono Android enciende un sistema que es todo oídos para tus comandos de voz.
Sistemas Bluetooth para automóviles . Muchos coches están equipados con un sistema que conecta su mecanismo de radio a su smartphone a través de Bluetooth. Puede hacer y recibir llamadas sin tocar su smartphone, e incluso puede marcar números con sólo decirlos.
Transcripción de voz . En áreas donde la gente tiene que escribir mucho, un software inteligente captura sus palabras habladas y las transcribe en texto. Esto es actual en ciertos programas de procesamiento de texto. La transcripción de voz también funciona con el correo de voz visual.

Las 7 mejores grabadoras de voz para comprar en 2019

TAMBIÉN TE INTERESA

impacto-a-la-IA-Generativa-en-el-cloud-privado

El impacto de la IA Generativa en el Cloud Privado

En este artículo indagamos sobre un término que está muy de moda en estos días: la IA Generativa. Además de describir qué y cuál es su potencial, lo vamos a relacionar con el Cloud Privado, ya que estos entornos pueden dar un gran paso adelante gracias a la capacidad de procesamiento y generación de datos

La mitad de las pymes comete, al menos, uno de estos 9 errores graves en la web

Parece mentira, pero en mitad del año 2024 siguen abundando errores graves en la web de muchas instituciones. Concretamente, el sector de las pequeñas y medianas empresas es el que más trabajo tiene por delante porque los expertos de BeeDIGITAL AI mantienen que el 50% de los negocios comete, al menos, uno de los varios

Conviértete en todo un chef con las recetas de cocina de Alexa

El famoso asistente de voz de Amazon puede hacer casi de todo lo que le pidas, incluidas las recetas de cocina de Alexa. Tras cinco años de vida en España, algo más en Estados Unidos, los datos que maneja la compañía indican que muchas personas recurren a Alexa como su ayudante en la cocina, ya

El nuevo OPPO Reno11 F 5G tiene batería para rato (y te puede llevar a la final de la Champions)

El nuevo OPPO Reno11 F 5G es un smartphone que destaca en todos los aspectos, desde su diseño y construcción hasta su rendimiento y características multimedia. Con un precio atractivo de 399€ y una variedad de ofertas exclusivas disponibles hasta el 30 de abril, este nuevo dispositivo de la marca es una opción a la

TikTok vs. Google: la red social planta cara al buscador rey

Las búsquedas en Internet viven su particular Juego de Tronos. Google siempre ha estado sentado en el Trono de Hierro pero cada vez más familias están pujando por destronar al rey. Sin duda, Microsoft se ha postulado como un digno rival con su navegador Edge y la puesta en marcha de la IA en esta

Zoom Workplace, la plataforma de trabajo que ha ideado Zoom con base en la IA

En cuestión de cuatro años, Zoom ha pasado de ser una gran desconocida a toda una referencia en el mundo de las comunicaciones. De emerger como herramienta de videollamadas en la pandemia, hoy Zoom se ha convertido en toda una solución multiusos para la vida diaria y el trabajo, cuya culminación se ha traducido con