¿Qué es el reconocimiento de voz?

¿Qué es el reconocimiento de voz?

¿Qué es el reconocimiento de voz?

VALORACIÓN DEL ARTÍCULO:
5/5


El reconocimiento de voz es una tecnología que permite la entrada de voz en los sistemas. Usted le habla a su computadora, teléfono o dispositivo y utiliza lo que usted dijo como entrada para activar alguna acción. La tecnología se está utilizando para reemplazar otros métodos de entrada como escribir, hacer clic o seleccionar de otras maneras. Es un medio para hacer que los dispositivos y el software sean más fáciles de usar y para aumentar la productividad.

Existen muchas aplicaciones y áreas en las que el reconocimiento de voz se utiliza, incluso en el ámbito militar, como ayuda para personas discapacitadas (imagínese a una persona con las manos o los dedos lisiados o sin ellos), en el campo médico, en robótica, etc. En un futuro próximo, casi todo el mundo estará expuesto al reconocimiento de voz debido a su propagación entre dispositivos comunes como ordenadores y teléfonos móviles.

Algunos teléfonos inteligentes están haciendo un uso interesante del reconocimiento de voz. Los dispositivos iPhone y Android son ejemplos de ello. A través de ellos, usted puede iniciar una llamada a un contacto simplemente recibiendo instrucciones habladas como «Call office». Otros comandos también pueden ser entretenidos, como «Activar Bluetooth».

Problemas con el reconocimiento de voz

El reconocimiento de voz, en su versión conocida como Speech to Text (STT), también se ha utilizado durante mucho tiempo para traducir palabras habladas en texto. «Tú hablas, él escribe», como diría ViaVoice en su caja. Pero hay un problema con el STT tal como lo conocemos. ViaVoice es uno de los mejores de la industria, así que imagínese el resto. La tecnología ha madurado y mejorado, pero el habla a texto todavía hace que la gente haga preguntas. Una de sus principales dificultades son las inmensas variaciones entre las personas en la pronunciación de las palabras.

No todos los idiomas se suponen en el reconocimiento de voz, y los que lo hacen a menudo no están tan bien soportados como el inglés. Como resultado, la mayoría de los dispositivos que ejecutan software de reconocimiento de voz funcionan razonablemente sólo en inglés.

Un conjunto de requisitos de hardware hace que el reconocimiento de voz sea difícil de implementar en ciertos casos. Necesita un micrófono que sea lo suficientemente inteligente para filtrar el ruido de fondo, pero al mismo tiempo lo suficientemente potente para captar la voz de forma natural.

Hablando de ruido de fondo, puede causar que todo un sistema falle. Como resultado, el reconocimiento de voz falla en muchos casos debido a ruidos que están fuera del control del usuario.

El reconocimiento de voz está demostrando ser mejor como un método de entrada para nuevos teléfonos y tecnologías de comunicación como VoIP, que como una herramienta de productividad para la entrada masiva de texto.

Aplicaciones del reconocimiento de voz

La tecnología está ganando popularidad en muchas áreas y ha tenido éxito en las siguientes:

  • Control de dispositivos . El simple hecho de decir «OK Google» a un teléfono Android enciende un sistema que es todo oídos para tus comandos de voz.
  • Sistemas Bluetooth para automóviles . Muchos coches están equipados con un sistema que conecta su mecanismo de radio a su smartphone a través de Bluetooth. Puede hacer y recibir llamadas sin tocar su smartphone, e incluso puede marcar números con sólo decirlos.
  • Transcripción de voz . En áreas donde la gente tiene que escribir mucho, un software inteligente captura sus palabras habladas y las transcribe en texto. Esto es actual en ciertos programas de procesamiento de texto. La transcripción de voz también funciona con el correo de voz visual.

Las 7 mejores grabadoras de voz para comprar en 2019

TAMBIÉN TE INTERESA

la estafa más habitual de España

Así es la estafa más habitual: WhatsApp, Telegram, oferta de empleo y un troyano…

Está arrasando. La estafa más habitual que circula por España lo tiene todo: ingeniería social, plataformas de mensajería, el señuelo del un empleo irreal y un troyano que tienes cuando ya has caído. Los expertos en ciberseguridad como Secure&IT se han hecho eco de multitud de robos de estas características. Describiendo la estafa más habitual

planificar un viaje con ChatGPT

Planificar un viaje con ChatGPT: todo lo que debes saber

Planificar un viaje con ChatGPT es una de las muchas cosas que se pueden hacer con esta popular herramienta. Destinos, restaurantes, precios, parkings donde dejar el coche, itinerarios… Se puede hacer de todo con la IA, pero hasta cierto punto. Y es que hay límites y riesgos que hay que tener en cuenta. Lo analizamos

nuevas funciones de Apple Intelligence

Traducción en Vivo y las nuevas funciones que llegan a Apple Intelligence

Apple ha anunciado nuevas funciones de Apple Intelligence que mejoran la experiencia del usuario en iPhone, iPad, Mac, Apple Watch y Apple Vision Pro. Es decir todo el ecosistema de Apple. Entre lo más destacado, llega Traducción en Vivo, si bien también hablaremos de otras mejoras en inteligencia visual o las novedades en Image Playground

webs con accesibilidad digital

Webs con accesibilidad: problema y asignatura pendiente en España

Aunque pueda parecer perfecta, Internet tiene carencias, especialmente para las personas con discapacidad. En lo que comprende a España, el país tiene una asignatura pendiente en la inclusión digital, puesto que las webs con accesibilidad digital son minoría. Este ha sido del tema de debate de la jornada “Accesibilidad Digital: Un futuro inclusivo”, organizada por