¿Por qué leer labios, cuando las imágenes lo dicen todo?
La lectura de labios es un modo de prueba admisible. Sin embargo, la lectura de labios tiene sus límites y en ocasiones ha sido tachada como poco confiable
“Sólo son imágenes”, dijo Ernesto Vásquez, el abogado de William Kushner, respecto a una polémica prueba pericial de lectura de labios a partir de un video. William Kushner es acusado de presuntamente atropellar a su expareja, la fallecida Andrea Aramayo, luego de una discusión el pasado 19 de agosto de 2015, a la salida del pub Mongos de la ciudad de La Paz. El video muestra a Kushner hablando con un oficial de la policía minutos después del incidente. La familia de Andrea Aramayo presentó la pericia de lectura de labios para intentar demostrar que Kushner trató de ofrecer algo al oficial con el objeto de huir del lugar.
La lectura de labios es un modo de prueba admisible. En general, personas con sordera tienen mayor habilidad para leer los labios que cualquier otro tipo de experto que pueda oír. Sin embargo, la lectura de labios tiene sus límites y en ocasiones ha sido tachada como poco confiable. La primera limitación es la calidad del video y la posibilidad de ver el rostro del que habla. Aun así, no todas las palabras pueden ser identificadas tan sólo visualmente y se estima que los mejores expertos en lectura de labios sólo pueden identificar correctamente hasta un 80 por ciento de las palabras.
Dadas estas limitaciones, quizás la solución esté en las imágenes. En el año 2014, el laboratorio del Instituto Tecnológico de Massachusetts publicó un trabajo de cómo obtener sonidos a partir de las imágenes de video. El principio es el siguiente.
Los sonidos son vibraciones. Cuando un sonido golpea un objeto, su superficie también vibra. En ciertas circunstancias se pueden analizar las pequeñas vibraciones captadas en los objetos grabados en un video y así parcialmente reconstruir el sonido. En una serie de experimentos, los investigadores han podido obtener una conversación a partir de las vibraciones de una bolsa de papas fritas, grabada a 4,5 metros de distancia, a través de un vidrio a prueba de sonido. Usando este método, se han grabado videos de objetos cotidianos, como una planta, un vaso de agua o un papel de aluminio, para obtener el sonido de su entorno a través de las imágenes grabadas. Los primeros experimentos fueron en cámaras de alta velocidad que capturan entre 2.000 a 6.000 imágenes por segundo. En otros experimentos, sin embargo, también se usó una cámara digital ordinaria, con un estándar de 60 imágenes por segundo. Aun con estas cámaras, se ha podido extraer las vibraciones de alta frecuencia grabadas en el video.
Si bien ésta es una nueva tecnología, los principios que utiliza están presentes en otros instrumentos. Por ejemplo, el micrófono láser es un instrumento corrientemente usado en espionaje y consiste en enviar un rayo láser para captar las vibraciones de un objeto creadas por el sonido de su entorno. Se ha sugerido que esta tecnología fue utilizada para determinar la presencia de Osama Bin Laden en su escondite en Abbottabad, Pakistán.
Entonces es cierto que los videos “sólo son imágenes”, pero estas imágenes repiten lo que uno dice. Así sea en murmullos.
Los autores son abogados en Bolivia y Nueva York
Columnas de Yuliya |