Patrocinado
Patrocinado

Uso del reconocimiento de voz dentro de un ascensor

Patrocinado
Figura 1. Diseño del dispositivo de elevación mediante comandos de voz para conectarse a un teléfono móvil y / o fijo
Este trabajo fue presentado en ElevcoN  París 2014, el Congreso Internacional de Tecnologías de Transporte Vertical, y publicado por primera vez en el libro de la IAEE Tecnología de ascensores 20, editado por A. Lustig. Es una reimpresión con permiso de la Asociación Internacional de Ingenieros de Ascensores.  Iaee (sitio web: www.elevcon.com). Este documento es una reimpresión exacta y no ha sido editado por ELEVATOR WORLD.
Palabras clave: tecnología de reconocimiento de voz, ascensor controlado por voz, industria de ascensores, talk2lift®

RESUMEN

En las últimas décadas hubo varios desarrollos en la industria de los ascensores en cuanto a seguridad, velocidad, pero también economía y conveniencia. La única tarea era hacer que el uso de los ascensores fuera más eficiente, más fácil y más accesible para un número cada vez mayor de personas. En esta dirección, el reconocimiento de voz tiene un impacto significativo en los problemas de accesibilidad, al mismo tiempo que proporciona una forma más rápida de encontrar y llegar a un destino, dentro de un edificio complejo. El presente documento aborda el fundamento del desarrollo de un producto innovador que utiliza tecnología de voz, lo que brinda la oportunidad del surgimiento de la primera serie de ascensores controlados por voz en la historia de la industria de los ascensores.  

1. INTRODUCCIÓN

El presente documento describe una invención relacionada con un ascensor en el que se puede especificar el destino de los pasajeros mediante reconocimiento de voz. Su objetivo es presentar la justificación, el contexto de fondo y el proceso de desarrollo del producto denominado talk2lift®. Además, el documento aborda las principales implicaciones para los ingenieros de ascensores, instaladores e industrias relacionadas con ascensores. Finalmente, el trabajo analiza brevemente las principales perspectivas comerciales del producto. Este documento está organizado en cuatro secciones principales. La primera sección examina los antecedentes y la justificación de la innovación. La segunda sección analiza la función de la innovación enfatizando sus características y capacidades innovadoras. En la siguiente sección se examinan las implicaciones prácticas y el uso de la innovación, mientras que en la última se resumen los elementos principales del artículo centrándose en los principales aspectos críticos del producto.

2. JUSTIFICACIÓN DE LA INNOVACIÓN

En general, un ascensor está provisto de botones para especificar un número de piso. Un usuario-pasajero en el ascensor puede especificar un número de piso deseado presionando el botón del número de piso. 

Se proporcionan dos juegos de botones de números de piso dentro de un elevador en caso de un elevador de gran escala. Además, los ciegos sufren el inconveniente de tener que buscar a tientas los botones para encontrar el tipo Braille. Aunque ya existen sistemas de reconocimiento de voz que permiten a los usuarios dar comandos de voz usando solo su voz, tienen una limitación significativa que es la capacidad de rechazar el ruido ambiental, lo que resulta en una tasa relativamente baja de reconocimiento exitoso de comandos.

Todo lo anterior se trata de la innovación de talk2lift®. Esta invención se refiere a un dispositivo de reconocimiento de voz, que cabe en la consola de la cabina de un ascensor y mediante comandos de voz se puede dirigir al usuario-pasajero del ascensor al destino deseado dentro del edificio. El motor de reconocimiento de voz está diseñado y desarrollado de tal manera que no necesita entrenamiento en la voz de un usuario-pasajero, pero puede reconocer y ejecutar todos los comandos de voz de diferentes usuarios. Brevemente, la función principal de la invención es convertir los comandos de voz en las correspondientes pulsaciones de teclas del ascensor. Más allá de esta función básica, el dispositivo talk2lift®, siempre que haya una interfaz con el controlador principal de los ascensores, también puede recopilar información sobre el funcionamiento de los ascensores y enviarlos a una ubicación central para su posterior procesamiento. El sistema se puede conectar a una pantalla en la cabina del ascensor, que presentará datos adicionales para informar mejor al usuario-pasajero, de acuerdo con los comandos de voz que haya dado.

Finalmente, el sistema puede entrenarse continuamente en grabaciones de ruido ambiental, las almacena en una base de datos y las distribuye a todos los usuarios, de modo que todos los sistemas instalados se entrenan continuamente para reconocer y rechazar el ruido y mejorar aún más la calidad del reconocimiento de voz.

2.1 Función talk2lift®

La presente invención puede entenderse completamente a partir de la descripción detallada anterior del diseño de la invención como se ilustra en la Figura 1.Cuando ingresa un usuario-pasajero, la cabina del sensor de ascensor se activa con el átomo de presencia (ver Figura 1 - Punto 8). Luego el sensor envía una señal al procesador central (ver Figura 1 - Punto 4), que a su vez activa el micrófono (ver Figura 1 - Punto 1) y la unidad de reconocimiento de voz (ver Figura 1 - Punto 10) y así comienza el proceso de reconocimiento del comando de voz del usuario-pasajero. Durante el proceso de activación, el sistema solicita al usuario-pasajero que indique su destino mediante una frase en particular: “Dígame el piso” o “Dígame su destino”.

Tras la respuesta del usuario-pasajero del ascensor, el micrófono (ver Figura 1 - Punto 1) convierte la voz en una señal eléctrica. Luego, el paso ADC (ver Figura 1 - Punto 2), convierte la señal analógica a digital. Después de digitalizar el nivel de señal, DSP (ver Figura 1 - Punto 3) procesa la señal digital para que esté lista para la introducción de la unidad central de procesamiento (ver Figura 1 - Punto 4) y luego la unidad de reconocimiento de voz (ver Figura 1 - Punto 10).

Cuando la unidad de reconocimiento de voz recibe la señal digitalizada se emprende entonces para compararla con una lista existente de posibles comandos, que se almacena en la unidad de almacenamiento (ver Figura 1 - Punto 5). Una vez identificado el mando, se envía la señal correspondiente al procesador central (4) y se compromete a promover el mando correspondiente al controlador del ascensor (ver Figura 1 - Punto 7). Como confirmación para el usuario-pasajero, un sintetizador de voz (Figura 1 - Punto 9) repite el comando reconocido. Además, el sistema tiene la capacidad de dar confirmación visual al usuario-pasajero a través de la pantalla (Figura 1 - Punto 12).

En caso de interrupción del suministro eléctrico, el procesador central se da cuenta de la interrupción y activa el siguiente procedimiento: El sintetizador de voz (ver Figura 1 - Punto 9) pregunta al usuario-pasajero si es necesario comunicarse con el servicio de emergencia apropiado. (por ejemplo, departamento de bomberos, policía, etc.). Entonces se activa la unidad de reconocimiento de voz (ver Figura 1 - Punto 10). Si la respuesta es positiva, entonces el procesador central (ver Figura 1 - Punto 4) permite que la unidad se conecte a la red telefónica (ver Figura 1 - Punto 6) y este a su vez llama al servicio apropiado.

2.2 Algoritmo de cancelación de ruido y reconocimiento de voz

La función más importante de talk2lift® es su capacidad para interactuar con el usuario a través del reconocimiento y la síntesis de voz. Obviamente, el problema más difícil en esta comunicación es reconocer la voz del usuario y no confundirse por la variedad de ruido electromagnético que emerge en un sistema de ascensor. Por lo tanto, es necesario utilizar un algoritmo de supresión de ruido para la cancelación de ruido. Desafortunadamente, el ruido audible está bien capturado por las teorías de la distribución gaussiana normal.

Como resultado de este ruido, la mayoría de los algoritmos (desarrollados bajo el supuesto de Gauss) no proporcionan los resultados esperados o colapsan por completo debido a la presencia del ruido de choque.

Sin embargo, la innovación particular incluye el uso de un servidor central, que recopila muestras de comandos reconocidos del usuario, en una variedad de ruido ambiental por parte de todos los usuarios del sistema. Las grabaciones recibidas por el servidor se recopilan y utilizan para entrenar el algoritmo. Luego, los resultados educativos se pueden compartir con los dispositivos de los usuarios para que contengan los parámetros más actualizados del algoritmo. Este algoritmo se diseña y luego se implementa en lenguaje de alto nivel. Luego, el algoritmo se optimiza para que el tiempo de ejecución y los requisitos de memoria se implementen en el circuito del sistema final. Finalmente, el algoritmo está escrito en aritmética de coma fija que se puede ejecutar en los procesadores disponibles, procesamiento de señales digitales (procesadores de señales digitales - DSP).

Para desarrollar un algoritmo de supresión de ruido, se requirió el diseño, desarrollo e implementación de una placa de reconocimiento de voz especializada. Esta placa incluye las herramientas e interfaces adecuadas para probar diversas técnicas, circuitos, algoritmos e interfaces. Además, incluye los circuitos apropiados para el procesamiento de señales digitales para probar varios algoritmos de reconocimiento de voz y supresión de ruido. También está equipado con las interfaces apropiadas (interfaces) para interactuar con otros circuitos, instrumentos de medición, grabadoras, micrófonos, entradas de varios sensores, etc., y la computadora host para cargar algoritmos. Esta placa ha sido diseñada por un grupo de investigación, especializado y experimentado en tecnologías de reconocimiento de voz.

3. FUNCIONES Y USO INNOVADORES

talk2lift® lleva el poder del reconocimiento de voz en cualquier cabina de ascensor, lo que permite a los pasajeros controlar el ascensor por voz. talk2lift® permite a los usuarios pronunciar el número de piso o cualquier otra información relacionada (propietario de la casa, profesión, sector / área, etc.). Por último, admite el funcionamiento multilingüe.

talk2lift® es un dispositivo electrónico de reconocimiento de voz ajustable en el tablero electrónico de la cabina de un ascensor. Mediante el uso de la tecnología del habla, los pasajeros pueden hablar con el ascensor pronunciando el piso al que desean ir dentro de un edificio o incluso el nombre de la persona que desean visitar o algunos atributos que los caracterizan (por ejemplo, dermatólogo). El sistema de software del reconocimiento de voz ha sido diseñado y desarrollado para reconocer la voz de cualquier usuario, independientemente del tono o volumen de su voz. En resumen, la función principal de Talk & Lift es transformar la voz de los usuarios del ascensor en una pulsación adicional del botón en el tablero de un ascensor. Finalmente, talk2lift® se puede conectar a una pantalla cercana al tablero de un ascensor, en la que los usuarios pueden ver información adicional como los pisos seleccionados junto con cualquier información disponible públicamente para el sistema (por ejemplo, ocupación). Más allá de esta función básica, el dispositivo talk2lift®, siempre que haya una interfaz con el controlador principal de los ascensores, también puede recopilar información sobre el funcionamiento de los ascensores y enviarlos a una ubicación central para su posterior procesamiento.

Las principales capacidades de talk2lift® son las siguientes:

  1. El proceso de reconocimiento del sistema es independiente del hablante, lo que significa que el usuario no tiene que entrenar el sistema con su voz.
  2. Capacidad de reconocer hasta 10,000 comandos de voz predefinidos.
  3. El sistema ha sido desarrollado y entrenado para un mejor uso en el entorno de una cabina de ascensor.
  4. El sistema está diseñado de manera que se pueda conectar a cualquier sistema de ascensor sin necesidad de modificaciones de hardware.
  5. El sistema puede manejar más de un idioma. Por ejemplo, el sistema puede equiparse con dos botones, uno para el idioma inglés y otro para el alemán.
  6. El sistema está disponible en los siguientes idiomas: alemán, inglés, francés, portugués, español, holandés, griego, italiano, polaco, portugués, sueco, turco, ruso, finlandés, danés, chino mandarín.

3.1 Implicaciones y uso indicativo

talk2lift® tiene muchas implicaciones prácticas. En primer lugar, la cabina tiene un “botón adicional” que, al presionarlo, solicita a los pasajeros que pronuncien su destino. De este modo, los usuarios pueden utilizar el ascensor de forma convencional, lo que permite una fase de transición. El botón adicional (ver foto 2) está especialmente diseñado para que sea accesible tanto para usuarios de sillas de ruedas como para personas con discapacidad visual. Los pasajeros pueden ser trasladados al piso deseado con solo pronunciarlo (por ejemplo, “-primer piso”, “planta baja” o “estacionamiento”).

Es posible pronunciar el nombre de una persona o una empresa (por ejemplo, "Jim Brown") o cualquier otra palabra que se ha correlacionado con un piso (por ejemplo, "oficina de impuestos", "abogado", "departamento de cardiología", " café").

En resumen, talk2lift® se puede utilizar como una gran ayuda para las personas con discapacidad visual que pueden recibir apoyo en sus accesos y destinos. Además, los habitantes y visitantes de los edificios pueden tener un acceso fácil y rápido a apartamentos, oficinas, etc. Además, puede ofrecer un ahorro de tiempo para los visitantes en grandes edificios (oficinas, hospitales, servicios públicos, etc.) mejorando la precisión y reduciendo los defectos. de moverse dentro del edificio. Por último, talk2lift® es un sistema respetuoso con el medio ambiente, ya que ahorra energía mediante la aplicación de prácticas de sistemas de gestión inteligentes.

El uso indicativo del sistema podría apuntar a edificios de apartamentos, números de pisos de apoyo y nombres de propietarios o inquilinos. Además, se puede instalar en edificios complejos que albergan oficinas de empresas, vinculados con palabras clave que asocian pisos con nombres de empresas, marcas, productos, nombres de empleados, sectores, etc.

Por último, talk2lift® es una herramienta útil para ascensores en grandes organizaciones públicas o privadas con muchos pisos y departamentos, como hospitales, en los que los edificios suelen albergar decenas de departamentos y clínicas.

4. CONCLUSIONES

La necesidad de un sistema de reconocimiento de voz sólido y confiable se conoce comúnmente desde hace años entre los profesionales de los ascensores.

El uso indicativo del sistema podría apuntar a edificios de apartamentos, edificios complejos que albergan oficinas de empresas y grandes organizaciones con muchos pisos y departamentos, como hospitales. talk2lift® se puede utilizar como una gran ayuda para las personas con discapacidad visual que pueden recibir apoyo en sus accesos y destinos. Asimismo, los habitantes y visitantes de los edificios pueden tener un acceso fácil y rápido a apartamentos, oficinas, etc.

La necesidad era evidente y también lo eran los diversos usos explicados. El producto se diseñó en consecuencia para cubrir todas esas necesidades y se probó minuciosamente en la torre de pruebas de KLEEMANN, donde se instaló unos meses antes de su lanzamiento. Durante esos meses el producto estaba siendo utilizado en condiciones reales por empleados y visitantes de KLEEMANN y no mostraba ninguna inexactitud.

En resumen, talk2lift® tiene las siguientes características innovadoras:

  • Es independiente de la voz, funciona para nuevos pasajeros sin necesidad de formación previa.
  • Proporciona una precisión mejorada para cabinas de ascensor con tasas de precisión de hasta el 97%.
  • Proporciona un control central y dinámico de las asociaciones de palabras clave a los pisos a través de una interfaz de usuario intuitiva.
  • Agrega valor tanto al ascensor como al edificio al dar una sensación de lujo y tecnología de alta gama.
  • No necesita mantenimiento mecánico.
  • Es personalizable para adaptarse a necesidades específicas.
Uso-de-reconocimiento-de-voz-dentro-de-un-ascensor-figura-2
Figura 2. talk2lift®, el "botón adicional"
Tags relacionados
Patrocinado
Patrocinado
Eleftherios Parageorgiou, Nikolaos Stratigakis y Lazaros Asvestopoulos

Eleftherios Parageorgiou, Nikolaos Stratigakis y Lazaros Asvestopoulos

Eleftherios Papageorgiou tiene una licenciatura en ingeniería civil de la Universidad Aristóteles de Tesalónica. Tiene más de 15 años de experiencia en proyectos de construcción y energía sostenible. Ha establecido 10 empresas de éxito en diferentes áreas de la construcción y la fabricación. Es uno de los fundadores y Director General de ENTRANET, donde en 2009 patentó productos innovadores a nivel mundial como “talk2lift®” (www.talk2lift.com), “talk2enter” y “HouseMate”. También es fundador y director general de tres empresas constructoras (Undercon, Neoptolemos SA & Nexus Constructions). Entre 1998 y 2002 fue Director del Departamento Técnico de Fibran SA (industria de materiales aislantes).

Nikolaos Statigakis es ingeniero eléctrico con dos maestrías en Ingeniería de Microondas (Universidad de Warwick) y en seguridad de sistemas inalámbricos (experto en ASR-TTS) (Universidad de Manchester). Ha participado en diversos proyectos relacionados con el desarrollo de innovaciones tecnológicas, entre ellos: (1) Talk & Drive, un GPS basado en reconocimiento de voz. (2) SYSTRAN, traductor automático. En el período 2008-2009 participó como diseñador principal en el desarrollo de un Hardware portátil especializado enfocado en el reconocimiento de voz. Desde 2007 trabaja como lanzador gratuito y consultor en temas relacionados con el desarrollo de sistemas de software y hardware. Desde 2009 es accionista y director de Investigación y Desarrollo en ENTRANET.

Lazaros Asvestopoulos nació en 1959 en Salónica, Grecia. Se graduó de la Facultad de Ingeniería Mecánica (MSc) en la Universidad de Thessaloniki y también tiene una maestría en Diseño Ambiental Urbano. Se incorporó a KLEEMANN en 1984. Actualmente es Director Comercial de la empresa. Es autor de numerosos artículos de congresos y varios artículos publicados en revistas del sector ha sido declarado inventor, por varias patentes solicitadas por el Grupo KLEEMANN. También es miembro fundamental del centro de investigación e innovación de KLEEMANN.

Mundo del ascensor | Junio ​​de 2015 Portada

flipbook

Patrocinado

Mundo del ascensor | Junio ​​de 2015 Portada

flipbook

Patrocinado