Este auricular de traducción te permite tener una conversación con alguien que habla un idioma que no entiendes


Este auricular de traducción le permite tener una conversación con alguien que habla un idioma que no comprende - Nuestro sitio

Usamos cookies para comprender cómo usa nuestro sitio y mejorar su experiencia. Esto incluye la personalización de contenido y publicidad. Para obtener más información sobre cómo utilizamos las cookies, consulte nuestra Política de privacidad revisada y los Términos de servicio.


Encontrar el pez de Babel: un traductor en tu oído

Uno de los rasgos animales más básicos es la comunicación. Los seres humanos han desarrollado esta habilidad a un alto nivel, transfiriendo información compleja de manera rápida y bastante eficiente a través del lenguaje hablado. El problema es que no todos hablamos el mismo idioma, lo que crea una barrera sólida para la comunicación.

Los escritores de ciencia ficción resolvieron el problema de comunicarse con las especies interestelares en una serie de formas de "agitar la mano hacia el problema". "Star Trek" tiene su "traductor universal", que se basa en leer las ondas cerebrales para comprender el habla de la otra criatura. Quizás la solución más intrigante de todas fue creada por Douglas Adams en su novela "La guía del autoestopista galáctico". El "pez de Babel" es una criatura simbiótica que te pones dentro de la oreja, tras lo cual traduce todos los demás idiomas.

¿No sería fantástico si pudieras ponerte algo en la oreja, aunque tal vez no sea una criatura viviente, que te traduzca todos los idiomas en tiempo real?

El auge de los "audibles" digitales

La revolución de la electrónica digital finalmente nos ha acercado a un pez Babel de la vida real. Los avances en el procesamiento de señales digitales, los arreglos de micrófonos con dirección de haz y las comunicaciones inalámbricas han llevado al desarrollo de dispositivos internos que hacen más que solo ayudar a las personas con problemas de audición. Puede contestar su teléfono, medir su frecuencia cardíaca y escuchar música. Los investigadores incluso han creado unos auriculares que brindan a los usuarios con discapacidad visual instrucciones verbales para navegar a través de edificios y otros entornos complejos.

Pero, ¿pueden estos dispositivos digitales traducir conversaciones habladas en tiempo real? La respuesta es, algo así.

Para comprender el problema de los dispositivos portátiles (o incluso móviles) para la traducción de idiomas, es útil dividir el proceso requerido en tareas discretas. (Ver figura 1).

Figura 1: Tareas necesarias para la traducción de idiomas hablados

Adquirir el sonido es mucho más que simplemente grabar una muestra de sonido. El sistema debe enfocarse en los sonidos del sujeto que habla. Esto significa que los ruidos ambientales deben reducirse o eliminarse, incluidas las palabras habladas de cualquier persona que participe en la conversación. Si los micrófonos se colocan en dispositivos ubicados en el oído, pueden ser adecuados para captar el habla de alguien que esté frente al sujeto, como sería necesario para las aplicaciones de audición aumentada, pero esta puede no ser una ubicación óptima para captar el discurso del sujeto. Como resultado, algunos dispositivos dependen de un auricular con micrófono de brazo o usan un dispositivo de mano cerca de la boca del sujeto.

El paso de voz a texto es la tarea más compleja y exigente de la cadena. Debe aislar los sonidos del habla del sujeto y luego usar la coincidencia de patrones para determinar las palabras que se dijeron. No es fácil. En el habla natural, las palabras van juntas. Si alguna vez utilizó un software de dictado de voz a texto de hace 20 años, sabría que los sistemas funcionaban mejor con "voz discreta", lo que significa que tenía que hacer una pausa. Brevemente. Entre. Cada. Palabra. Estos sistemas también requirieron sesiones de entrenamiento interminables para enseñar al sistema a reconocer sus patrones de habla individuales. Por el contrario, la tecnología más nueva separa las palabras habladas cuando se unen en un habla natural.

¿Te gusta este artículo? Suscríbase a nuestro boletín semanal. No perdemos su tiempo.

La mayoría de los sistemas facilitan un poco la tarea de reconocimiento de voz al requerir que especifique el idioma de origen. Esto elimina el difícil paso de intentar identificar el idioma además de traducirlo.

Una vez que el sistema convierte el discurso en texto, es un problema comparativamente simple convertir las palabras de un idioma a otro. Sin embargo, no es una tarea trivial, porque el lenguaje hablado a menudo está incompleto y lleno de usos coloquiales. El proceso de traducción debe llenar los vacíos y reconocer cuando “llover perros y gatos” no es una declaración literal.

Finalmente, el texto traducido debe convertirse en sonido para que el destinatario pueda escuchar la traducción hablada en el idioma de destino. Nuevamente, esto es relativamente fácil, ¡relativamente! Sin embargo, es importante tener la cadencia y la inflexión correctas, ya que esto hace que escuchar la traducción sea menos cansado.

¿Qué podría salir mal?

Si bien es bastante sencillo establecer estos cuatro pasos, la ejecución es mucho más difícil. Es un poco como decir: "Para llegar a la luna, construye una cápsula espacial, colócala en un cohete y lánzala". Hay muchos cuellos de botella y desafíos en la creación de un pez Babel digital que se ajuste a su oído.

En primer lugar, no todo el mundo tiene la misma forma de oreja. El ajuste es un factor importante, especialmente si va a usar estos dispositivos durante horas por negocios o viajes. Algunos dispositivos auditivos se basan en auriculares hechos a medida para crear un dispositivo cómodo y eficaz, pero esto aumenta significativamente el costo del dispositivo. Otros ofrecen auriculares en una variedad de tamaños, lo que permite que los usuarios seleccionen la opción que mejor se adapte.

Hablando de "horas a la vez", eso plantea otro cuello de botella de diseño: la duración de la batería. Un dispositivo intraauricular es, por definición, un producto en miniatura. No hay mucho espacio para baterías u otras formas de almacenamiento de energía. Los audífonos tradicionales son esencialmente amplificadores simples, por lo que sus pequeñas baterías duran mucho tiempo. Tratar de manejar todas las tareas de procesamiento digital enumeradas en la Figura 1 requiere mucha más energía, lo que hace que sea un desafío para un dispositivo lograr una duración útil de la batería. Como resultado, muchos dispositivos dependen de factores de forma portátiles que pueden admitir baterías más grandes.

Otro enfoque de diseño es una conexión inalámbrica Bluetooth a un teléfono inteligente que tiene una batería más grande. Luego, el sistema puede descargar algunas tareas de procesamiento del auricular al teléfono. Por supuesto, la compensación aquí es que puede acortar significativamente el tiempo que el teléfono inteligente puede durar entre cargas.

Otro cuello de botella es lo que yo llamo el "problema de semidúplex". Si alguna vez vio una película clásica antigua sobre pilotos de aviones, recordará cómo tenían que decir "Cambio" al final de cada transmisión para que la parte del otro extremo supiera que era su turno de hablar. El sistema de radio permitía la comunicación bidireccional, pero solo en una dirección a la vez. Este es un concepto arcaico para nosotros, estamos acostumbrados a teléfonos que permiten que ambas partes hablen al mismo tiempo (no es que necesariamente puedan escuchar lo que dicen los demás).

Todos los traductores de idiomas en “tiempo real” hasta ahora son sistemas semidúplex. Usted especifica los idiomas de origen y de destino, y luego habla. El sistema traduce el discurso y lo reproduce en el idioma de destino. Solo entonces la otra parte puede decir algo y luego volver a hacerlo al revés. Este proceso puede estar bien para pedir direcciones a la parada de autobús más cercana, pero es limitante si necesita negociar un trato comercial o disfrutar de una conversación durante la cena.

Esto conduce quizás al mayor cuello de botella de todos: el retraso en la transferencia de datos o la latencia. Es posible que esté más familiarizado con el efecto cuando ve una entrevista remota en la televisión. El anfitrión hace una pregunta, seguida de una pausa mientras el invitado remoto escucha el sonido retardado y finalmente el invitado comienza a responder. Este retraso puede ser inferior a un segundo, pero es perturbador y definitivamente degrada la calidad de la conversación.

La mayoría de estos dispositivos de traducción móviles o audibles sufren importantes problemas de latencia. Parte de esto proviene del procesamiento de sonido digital, pero el mayor culpable es la parte de voz a texto. Como se mencionó anteriormente, esta tarea generalmente se basa en motores de aprendizaje automático y otras técnicas de inteligencia artificial para procesar los datos. A menudo, varios sistemas de IA funcionan de forma independiente y luego "votan" sobre lo que, en conjunto, creen que es la respuesta "correcta" para la conversión. Dados los enormes conjuntos de datos requeridos para la mayoría de los lenguajes, se debe manejar una gran cantidad de procesamiento de datos complejo para lograrlo.

Incluso con los milagros de la electrónica digital miniaturizada, todos estos pasos complejos son una tarea enorme para dar a algo que es lo suficientemente pequeño como para clavarse en su oído. ¡La mayoría de los teléfonos inteligentes se atascan al intentar realizar esta conversión!

Como resultado, muchos sistemas dependen de la transmisión de los datos de sonido a la nube (a través de una conexión de teléfono inteligente) donde los sistemas de inteligencia artificial los procesan. Luego, el texto convertido se traduce y se transmite nuevamente. Esto lleva tiempo y no es infrecuente que los traductores de mano y audibles actuales tengan retrasos de uno o dos segundos antes de comenzar a reproducir la traducción.

Puede que dos segundos no parezcan mucho. Pero pruébalo por ti mismo. Mantenga una conversación con alguien y haga una pausa de dos segundos entre el momento en que una persona se detiene y la otra comienza a hablar. Se siente mucho más largo de lo que cabría esperar. La capacidad de traducir no permite una conversación al instante.

Cuando confía en la nube para manejar el trabajo pesado de la conversión de voz a texto, es difícil evitar el problema de latencia. Replicar esa capacidad de procesamiento y almacenamiento de datos incluso en un dispositivo de mano, y mucho menos algo en su oído, es un desafío enorme y potencialmente costoso.

¿Ya llegamos?

Con todos esos desafíos técnicos, es posible que se sorprenda al saber que ya hay productos en el mercado que hacen un buen trabajo en la traducción de idiomas hablados, con precios de lista que van desde poco más de $ 100 hasta casi $ 800.

Quizás uno de los productos más conocidos en este segmento es Google Pixel Buds. Estos audífonos inalámbricos hacen la mayoría de las cosas que usted esperaría de los audífonos inalámbricos, pero también brindan traducción de idiomas en tiempo real. Esto solo funciona con un teléfono inteligente Google Pixel o Pixel 2, y la función se basa en la aplicación gratuita Google Translate. Para usar el sistema, entregue el teléfono a la otra persona. Esa persona habla por teléfono en su idioma y usted escucha la traducción en los auriculares. En la otra dirección, su discurso es recogido por los micrófonos de los botones y se transmite al teléfono para su traducción y reproducción a través del altavoz del teléfono.

Los auriculares inalámbricos Dash Pro de Bragi también tienen una función de traducción de voz. Se basa en la aplicación gratuita iTranslate para realizar la traducción, lo que significa que los auriculares deben estar emparejados con un teléfono inteligente (iOS o Android). Tenga en cuenta que iTranslate realiza algunas traducciones limitadas cuando está fuera de línea.

El Pilot de Waverly Labs es otra solución de audífonos inalámbricos. Se basa en una aplicación gratuita (iOS o Android) que utiliza un servicio en la nube para procesar la traducción. Para mantener una conversación, le da uno de sus auriculares a la otra persona y cada uno ejecuta la aplicación en sus propios teléfonos. (Algunas personas pueden desanimarse un poco por la idea de compartir algo tan personal como un auricular).

Algunos dispositivos se basan en un diseño diferente. Por ejemplo, el TRAGL tiene un micrófono boom conectado a un auricular, con un altavoz frontal que reproduce la traducción de su discurso a la otra parte de la conversación. (No es necesario compartir el hardware). Captura el habla de la persona y reproduce la traducción a través de su auricular. Este sistema también se basa en una aplicación de teléfono inteligente (iOS y Android) y soporte en la nube, pero el dispositivo proporciona soporte limitado para la traducción fuera de línea de algunos idiomas. Actualmente, el producto se ofrece a través de una campaña de Indiegogo con envíos programados antes de fin de año.

Otros productos omitieron el diseño de auriculares inalámbricos y, en cambio, se basan en un dispositivo de mano dedicado. Un producto exitoso es el Travis, que ha vendido más de 110.000 unidades. La compañía anunció una nueva versión del dispositivo llamada Travis Touch, que tiene una interfaz mejorada y una pantalla táctil más grande. Según la empresa, el sistema se basa en 16 motores de traducción diferentes a la vez para obtener los mejores resultados. Requiere una conexión a Internet de alta velocidad. El Touch también es el tema de una campaña de Indiegogo y está programado para enviarse en el otoño.

Otros dos dispositivos portátiles que buscan soporte de crowdfunding son IU y Mesay 2.0. La IU se basa en una aplicación separada que se ejecuta en un teléfono inteligente, es muy similar a un pequeño altavoz Bluetooth con un micrófono y algunos botones para la interfaz de usuario. Está previsto que se envíe a finales de año. El Mesay tiene una pantalla LCD que muestra el texto original y traducido e incluso se puede utilizar como un punto de acceso Wi-Fi. Ya se está enviando.

Puedes escucharme ahora?

¿Tenemos ya un pez Babel digital? Lamentablemente, ninguno de estos productos es tan competente como la referencia de ciencia ficción, pero estamos logrando un gran progreso. La conectividad inalámbrica 4G y Wi-Fi proporciona un acceso rápido a los recursos de la nube que requieren la mayoría de estos productos. Hasta que podamos empaquetar mucha más potencia de procesamiento en un dispositivo audible, puede esperar que estos productos dependan del soporte de teléfonos inteligentes y una conexión a recursos en línea.

Y tenemos un camino por recorrer antes de que pueda esperar tener una conversación "normal" utilizando la traducción de voz en tiempo real. Las pausas y el problema de turnarse no son naturales, sino un pequeño precio a pagar en comparación con el tiempo necesario para aprender un nuevo idioma. Es posible que estos productos no sean ideales, pero ya pueden ofrecer un valor significativo a los viajeros y empresarios que necesitan hacerse entender por otras personas que hablan un idioma diferente.


Los 10 mejores traductores electrónicos de 2021

Nuestros editores investigan, prueban y recomiendan de forma independiente los mejores productos y servicios. Puede obtener más información sobre nuestro proceso de revisión aquí. Podemos recibir comisiones por las compras realizadas desde nuestros enlaces elegidos.

El resumen

"Cuenta con un diseño compacto y capacidades superiores de traducción de voz".

"Traduce, corrige errores ortográficos, convierte monedas y tiene una calculadora incorporada".

"Muy útil cuando viaja y necesita poder comunicarse sobre la marcha".

"Cuenta con una cámara que se puede usar para capturar letreros de calles y puertas de aeropuertos para su traducción".

"Ofrece una traducción bidireccional en línea con una alta tasa de precisión".

"Permite una comunicación ultrarrápida y lo ayudará a comprar, cenar y navegar".

Lo mejor para traducir español: Traductor Ili Wearable en Amazon

"Lo más cercano a la traducción en tiempo real como sea tecnológicamente posible".

"Actuando como traductor de voz y palabras, todo lo que hable se traducirá en una pantalla".

Lo mejor para traducir alemán: Traductor de idiomas WT2 en Amazon

"Consiste en audífonos que brindan traducciones directamente en su oído en lugar de por un altavoz".

Lo mejor para traducir ruso: Traductor Langogo Pocket AI en Amazon

"Garantiza una traducción precisa incluso con diferentes acentos y dialectos".


  • Agregue una bolsa de almacenamiento para orejeras, ganchos para las orejas y cable de carga
  • Agregue un botón para verificar el nivel de carga de la funda / auriculares
  • Gran solicitud de futuro aquí - Habilite la traducción entrante en llamadas telefónicas y chats de video en una computadora de escritorio / mac

Es bastante sorprendente lo bien que funcionan y el potencial que existe para cambiar la forma en que nos comunicamos con los demás. Para las conversaciones en persona, esto podría significar la diferencia entre sentarse allí en silencio y tener una discusión interesante. La parte más difícil de usarlos es pedirle a la persona con la que estás que lo intente. Cuanto mayor sea la brecha lingüística, más fácil será. Tengo la sensación de que los usaré mucho en los próximos meses.

Precio: $239.99
Donde comprar: Timekettle y Amazon
Fuente: La muestra de este producto fue proporcionada por Timekettle


Cómo comprar un traductor en tiempo real

Aunque la tecnología de viajes es un desarrollo relativamente nuevo, hay ciertas características que querrá tener en cuenta cuando busque su traductor de bolsillo. ¿Funciona mediante WiFi o punto de acceso móvil, o viene con una tarjeta SIM? ¿Cuál es el tiempo de respuesta al participar en una conversación bidireccional? ¿Se puede utilizar como diccionario para aprender más frases clave? ¿Es pantalla táctil? Tantas preguntas, pero no se preocupe: lo tenemos.

Gracias a nuestra investigación y a la encantadora comunidad de revisores de Amazon, hemos desglosado los detalles de algunos de los mejores dispositivos de traducción del mercado para que pueda encontrar el que mejor se adapte a sus necesidades.

Después de todo, los viajes internacionales son una inversión y con la capacidad de hablar el idioma nativo al alcance de su mano, solo tiene sentido darse el regalo de la comunicación inmersiva. Además, te sentirás como un niño espía. Hemos eliminado las conjeturas reuniendo los mejores dispositivos de traducción para que puedas comunicarte más fácilmente donde sea que te lleven tus viajes.


Traductor de google

Google Translate admite más de 100 idiomas. La pantalla de inicio de la aplicación muestra los idiomas de origen y destino en la parte superior. Simplemente toque el nombre de cada idioma si desea cambiar alguno de ellos. A continuación, puede escribir, dibujar o pronunciar las palabras que desea traducir. También puede utilizar un modo de conversación especial para traducir una conversación en tiempo real entre usted y la otra persona.

Si escribió o dibujó sus palabras, toque la flecha junto a la traducción. Luego toque el ícono de altavoz para escucharlo leer en voz alta. Si pronunció las palabras, la traducción se lee en voz alta automáticamente. Simplemente hable en el dispositivo y Google Translate lo traducirá a su idioma de destino.


Ver el vídeo: Cómo puedo dejar de pensar en español cuando quiero hablar otro idioma?


Artículo Anterior

Feria de Artesanía del Altiplano Sur

Artículo Siguiente

10 cosas que te cansan en Alabama que son realmente increíbles