Validación y mejora de un enfoque de reconstrucción 3D de la superficie medial de las cuerdas vocales para

Blog

HogarHogar / Blog / Validación y mejora de un enfoque de reconstrucción 3D de la superficie medial de las cuerdas vocales para

Feb 15, 2024

Validación y mejora de un enfoque de reconstrucción 3D de la superficie medial de las cuerdas vocales para

Scientific Reports volumen 13, Número de artículo: 10705 (2023) Cite este artículo 292 Accesos 1 Detalles de Altmetric Metrics En la investigación de la laringe, el estudio del componente de oscilación vertical de las cuerdas vocales es

Scientific Reports volumen 13, número de artículo: 10705 (2023) Citar este artículo

292 Accesos

1 altmétrica

Detalles de métricas

En la investigación de la laringe, a menudo se ignora el estudio del componente de oscilación vertical de las cuerdas vocales. Sin embargo, la oscilación de las cuerdas vocales por su naturaleza es un proceso tridimensional. En el pasado, hemos desarrollado un protocolo experimental in vivo para reconstruir la vibración tridimensional completa de las cuerdas vocales. El objetivo de este estudio es validar este método de reconstrucción 3D. Presentamos una configuración de hemilaringe canina in vivo utilizando grabación de vídeo de alta velocidad y un prisma de ángulo recto para la reconstrucción 3D de las vibraciones de la superficie medial de las cuerdas vocales. La superficie 3D se reconstruye a partir de la imagen dividida proporcionada por el prisma. Para la validación, se calculó el error de reconstrucción para objetos ubicados a una distancia de hasta 15 mm del prisma. Se determinó la influencia del ángulo de la cámara, el cambio del volumen calibrado y los errores de calibración. El error medio general de reconstrucción 3D es bajo y no supera los 0,12 mm a 5 mm de distancia del prisma. La influencia de una desviación moderada (5°) y grande (10°) en el ángulo de la cámara provocó un ligero aumento en el error a 0,16 mm y 0,17 mm, respectivamente. Este procedimiento es resistente a cambios en el volumen de calibración y pequeños errores de calibración. Esto hace que este enfoque de reconstrucción 3D sea una herramienta útil para la reconstrucción de superficies de tejido accesibles y móviles.

La voz humana audible se produce en la laringe, cuando la corriente de aire que sale de los pulmones excita las cuerdas vocales para que vibren, lo que nuevamente modula el flujo de aire en ondas sonoras, generando la frecuencia fundamental de la voz1. Aunque este proceso de producción de la voz se describe con bastante facilidad a grandes rasgos, tiene muchas complejidades, ya que puede modularse de diversas maneras y puede verse afectado por diversos factores, como el nivel de estimulación neuromuscular, la elasticidad de los tejidos, la presión subglótica, etc.2. 3. Para lograr una mejor comprensión del control de la producción de la voz, son de interés muchas señales de entrada y salida, como la activación del nervio laríngeo, los cambios en el flujo y la presión, o la señal acústica producida. Para comprender mejor este complejo proceso, idealmente se necesita una configuración experimental que pueda controlar o al menos capturar todos los factores relevantes simultáneamente y que emplee algoritmos sólidos que no introduzcan más factores de confusión.

Las cuerdas vocales son dos estructuras opuestas en la laringe que forman una constricción de las vías respiratorias. Se extienden a lo largo de la laringe en dirección anteroposterior y su postura exacta se puede ajustar mediante el movimiento de varios cartílagos de la laringe, acercándolos para la fonación4. A medida que son puestos en movimiento por la corriente de aire que sale de los pulmones, oscilan con una media de 235 Hz en las mujeres y 134 Hz ​​en los hombres durante la fonación vocal sostenida, la fuente sonora de la voz5. Esta fuente de sonido luego es modulada aún más por las resonancias acústicas del tracto vocal, generando el habla4.

Una voz sana suele caracterizarse por oscilaciones periódicas y simétricas de izquierda a derecha de las cuerdas vocales que se cierran completamente o casi por completo en cada ciclo6,7,8. Por el contrario, la enfermedad fonatoria a menudo se caracteriza por oscilaciones aperiódicas o asimétricas de las cuerdas vocales y cierre glotal incompleto durante la fonación9,10,11. Respectivamente, se utilizan muchas medidas diferentes que intentan capturar las propiedades de las oscilaciones de las cuerdas vocales, como la duración y las proporciones de las fases de apertura, cierre y cierre de la forma de onda del área de apertura de la glotis1,12.

La superficie medial de las cuerdas vocales (es decir, la superficie donde se unen las cuerdas vocales durante la oscilación) es un área vibratoria crítica que influye en la acústica13 y, por lo tanto, es de especial interés. Las cuerdas vocales no se cierran simplemente al mismo tiempo en todas partes de esta superficie, sino que muestran un patrón de cierre de abajo hacia arriba y apertura de la misma manera. Los cambios en este patrón, controlados por activaciones de los músculos laríngeos, pueden tener una gran influencia en la señal acústica resultante13,14.

Sin embargo, en la investigación de la voz, los experimentos in vivo generalmente registran las cuerdas vocales oscilantes desde arriba, capturando la vibración desde una vista superior en 2D15 o 3D16, pero no pueden registrar toda la superficie medial, ni recopilar datos sobre la activación muscular o la dinámica de la superficie medial17 ,18,19. La hemilaringe ex vivo permite la visualización de la superficie medial, pero a menudo no se puede lograr la activación nerviosa20,21 sin aplicar medidas especiales como el uso de modelos perfundidos22.

Para la reconstrucción 3D in vivo de tejido biológico, existen varios métodos. Una de las menos invasivas es la tomografía computarizada de alta resolución que se aplicó para la reconstrucción 3D de las cuerdas vocales23. Sin embargo, la resolución espacial de esta técnica es limitada, e incluso los enfoques modernos de ultra alta resolución solo alcanzan un espesor de corte de 0,25 mm24. En teoría, se puede lograr una mayor precisión mediante la grabación directa de vídeo de alta velocidad de las cuerdas vocales desde arriba en combinación con proyección láser o técnicas similares. Sin embargo, la precisión de estos enfoques está limitada por las restricciones espaciales de la faringe que actualmente limitan la resolución vertical a un valor de aproximadamente 0,36 mm16. Además, estas técnicas se limitan a una vista superior de las cuerdas vocales y no pueden visualizar completamente la superficie medial completa25. Por lo tanto, la única forma factible de lograr resoluciones en una escala inferior a 0,1 mm de la superficie medial en la actualidad es el uso de una hemilaringe in vivo para la visualización directa.

La hemilaringe se comporta de manera similar a una laringe completa durante la fonación con respecto a muchas variables importantes, como la presión umbral de fonación, la frecuencia fundamental o la amplitud vibratoria26, que conducen a su uso bien establecido en la investigación de la voz27,28,29. La configuración de hemilaringe presentada en este trabajo también permite la estimulación directa de los nervios laríngeos ajustando las cuerdas vocales restantes de la hemilaringe y cambiando sus propiedades de vibración, lo que no sería factible en un modelo ex vivo20. Para este estudio son de interés principalmente dos tipos de nervios laríngeos: el nervio laríngeo recurrente (RLN) inerva todos los músculos aductores intrínsecos de la laringe (es decir, cierra la brecha glotal y endurece la capa corporal) y el nervio laríngeo superior (SLN) inerva los músculos cricotiroideos. (CT) (es decir, alargar y tensar las cuerdas vocales)4. Como los experimentos son pasados ​​en la hemilaringe, sólo se conserva una cuerda vocal (aquí la izquierda) y respectivamente las ramas izquierdas de estos nervios.

Existen herramientas comerciales para la reconstrucción de superficies en 3D30, pero tienen varias limitaciones. Son de código cerrado (lo que los hace opacos), administrados externamente (lo que impide la reparación rápida y eficiente de errores basados ​​en software) y costosos. Además, la aplicación de tales herramientas que se desarrollan con la intención de ser aplicables a una gama preferiblemente amplia de problemas en un problema muy específico, como la reconstrucción de la superficie medial de las cuerdas vocales vibrantes in vivo, puede dar como resultado un rendimiento deficiente.

Para evitar estos problemas, este trabajo se basa en un enfoque previo para la reconstrucción 3D de la superficie medial de la hemilaringe oscilante realizado por Döllinger et al.31,32. En este trabajo anterior, la superficie medial oscilante se registró con vídeo de alta velocidad. Para la calibración, se utilizó un cubo de latón de dimensiones conocidas fijado sobre la superficie medial. Tanto la superficie media como el cubo de latón se registraron a través de un prisma de vidrio transparente en ángulo recto que generó una vista dividida de la superficie y el cubo al mismo tiempo. Utilizando las dimensiones conocidas del cubo de latón se pudo reconstruir la superficie. Sin embargo, este enfoque tenía tres desventajas: (1) como el cubo de latón ocupaba necesariamente un área diferente a la superficie medial, la reconstrucción 3D se basó en una extrapolación considerable del espacio reconstruido. (2) El cubo de latón solo ofrecía un pequeño conjunto de pares de posiciones conocidas de 2 × 2D/3D para la calibración (un conjunto de siete vértices del cubo visibles). (3) El cubo de latón y la superficie media tenían que ser visibles al mismo tiempo. por lo tanto, sólo se podría reservar una sección más pequeña de la imagen de la cámara para la superficie medial.

En este trabajo presentamos una versión actualizada de este enfoque de reconstrucción 3D31,32, resolviendo las desventajas del proceso anterior y mejorando el propio algoritmo de reconstrucción 3D. Para este propósito, también nos basamos en una técnica ya establecida para la estimulación del nervio laríngeo in vivo como la describen Chhetri et al.2,3. Ambos enfoques se describen en sus detalles relevantes en la sección de métodos junto con los cambios que introdujimos para combinarlos y adaptarlos para la reconstrucción 3D de la superficie de la hemilaringe in vivo.

Los objetivos de este estudio de validación son los siguientes: (1) Proponer una configuración adaptada y un algoritmo mejorado para la reconstrucción 3D de superficies de tejido en movimiento accesibles que sean resistentes a los cambios en la configuración de la cámara. (2) Valide esta configuración en relación con varios factores que influyen, como la distancia del objeto reconstruido, el ángulo de la cámara y las diferencias entre los parámetros de la cámara de calibración y reconstrucción. (3) Proporcione un ejemplo de aplicación de la configuración basada en la reconstrucción 3D de una grabación de hemilaringe in vivo de la superficie medial de las cuerdas vocales vibrante con estimulación del nervio laríngeo concurrente. (4) Al hacer que el código fuente esté disponible, damos a los colegas la oportunidad de utilizar todo o parte de nuestro código para sus propias tareas específicas de reconstrucción 3D.

En este estudio se utilizaron datos de un canino mestizo macho sano con fines de demostración. Los datos fueron recopilados originalmente para un estudio anterior14. El procedimiento quirúrgico realizado para exponer y preparar la hemilaringe ya se describió en detalle anteriormente en 2,3 y, por lo tanto, aquí solo se resumirá brevemente con énfasis en los detalles relevantes para el algoritmo de reconstrucción 3D:

El canino se anestesió utilizando anestesia endotraqueal general con isoflurano y se colocó en posición supina sobre una mesa de operaciones y se proporcionó ventilación a través de una traqueotomía baja. Para proporcionar un flujo de aire humidificado controlado, se conectó un tubo subglótico a los anillos traqueales dos y tres, y un controlador de flujo de aire (Controlador de flujo de masa serie MCS; Alicat Scientific, Tucson, AZ). Se expuso la laringe y se realizó una hemilaringectomía derecha, lo que resultó en una hemilaringe in vivo con solo la cuerda vocal izquierda restante. Figura 1a Con tinta china se tatuó una cuadrícula de 35 puntos de referencia en la superficie medial de las cuerdas vocales. Figura 1b Se colocó un prisma de vidrio transparente en ángulo recto (base de 48 mm, longitud de 35 mm, altura de 24 mm) contra las cuerdas vocales con la base en el lado de la hipotenusa mirando hacia la superficie medial. Figura 1c El prisma se fijó firmemente a la mesa mediante una configuración de postes metálicos, asegurando una posición estacionaria del prisma durante el proceso de grabación. Las dos bases del prisma en los lados de las piernas proporcionan una vista dividida de la superficie medial desde dos perspectivas diferentes. Figura 1d Se colocó una cámara de alta velocidad Phantom v210 (Vision Research Inc., Wayne, Nueva Jersey) perpendicular al prisma, capturando ambas vistas.

Procedimiento quirúrgico para preparar la hemilaringe para el registro: (a) Rejilla de puntos de referencia con tinta china tatuados en la superficie medial de la cuerda vocal restante en la hemilaringe, (b) prisma colocado delante de la cuerda vocal que proporciona una vista dividida de la superficie medial , (c) configuración de poste metálico que sostiene el prisma en su lugar, (d) cámara de video de alta velocidad para registrar las oscilaciones de las cuerdas vocales a través del prisma de vidrio.

Para la calibración de la configuración, se insertó una placa de calibración estrecha entre las cuerdas vocales y el prisma de vidrio (dimensiones 25 × 25 × 6 mm con ranuras de 0,5 mm de profundidad). La placa se colocó firmemente contra el prisma y se grabó una imagen de la placa con la cámara. En la Fig. 2a se muestra un esquema de la configuración de grabación. La placa de calibración presenta múltiples puntos de referencia con distancias conocidas entre sí en tres dimensiones, como se ilustra en la Fig. 2b. Estas distancias se pueden utilizar para mapear y extrapolar el espacio 3D reconstruido.

Visualización de (a) la configuración de reconstrucción 3D para la calibración, (b) características de la placa de calibración y (c) configuración para la reconstrucción 3D de la superficie medial de las cuerdas vocales con los mismos parámetros de la cámara que se utilizan para la calibración.

Posteriormente se retiró la placa y se registró la superficie medial de las cuerdas vocales. Al proporcionar un flujo de aire humidificado a través del tubo subglótico (a 1200 ml/s) y la estimulación simultánea de los nervios laríngeos (ver sección "Estimulación neuromuscular fonatoria") se logró la fonación con las cuerdas vocales oscilando contra el prisma de vidrio. Las oscilaciones de las cuerdas vocales se registraron a 3000 cuadros por segundo durante 1,5 s con una resolución espacial de 512 × 512 píxeles. Al igual que el prisma, la cámara permaneció fija durante la calibración y durante todo el proceso de grabación (ver Fig. 2c). Para verificar que los parámetros de la cámara permanecen constantes (es decir, la posición de la cámara y el prisma), se mantiene a la vista la posición exacta del prisma en las imágenes grabadas y se realiza una nueva grabación de calibración si es necesario.

Para aplicar estimulación nerviosa durante la oscilación, se expusieron los nervios laríngeos superior y recurrente (SLN y RLN) de las cuerdas vocales izquierdas y se fijaron electrodos de manguito (Ardiem Medical, Indiana, PA) a todos los nervios. De esta manera, el músculo cricotiroideo (CT) inervado por el SLN y los músculos aductores laríngeos inervados por la rama del NLR podrían estimularse por separado. Al dividir la rama nerviosa que inerva el músculo cricoaritenoideo posterior, se evitó la estimulación cruzada.

Para la estimulación, se utilizaron pulsos catódicos bifásicos con carga equilibrada de 30 ms a 100 Hz durante 1,5 s para cada nervio. Se probaron once niveles de activación del SLN y NLR para cada nervio, desde ninguna estimulación (0) hasta estimulación máxima (10). Los efectos de esta estimulación fueron discutidos con más detalle por Reddy et al.14. Sin embargo, este trabajo no se centra en los efectos de las combinaciones de activación, por lo tanto, solo se incluyeron tres condiciones de activación que cubren los niveles de estimulación promedio ((1) RLN 4 SLN 5, (2) RLN 5 SLN 5, (3) RLN 6 SLN 5). con fines demostrativos y se calcularon los parámetros básicos (ver Interpolación de superficie y detección de ciclos).

El proceso de reconstrucción 3D usando dos vistas se basa en33 y se puede expresar de manera simplificada usando la ecuación. (1). En el primer paso (la calibración) se utilizan combinaciones conocidas de puntos 2D de ambas vistas en el espacio de la imagen y sus posiciones 3D resultantes en el espacio real para obtener una aproximación preferiblemente buena de la función de transformación T. En un segundo paso (la reconstrucción) Esta función T luego se puede aplicar a nuevos pares de puntos en el espacio de la imagen para obtener sus correspondientes posiciones 3D desconocidas. Por lo tanto, los parámetros de la cámara (es decir, la posición y el ángulo de la cámara y el prisma) deben permanecer iguales durante ambos pasos.

Para la calibración, al principio, se marcó una cuadrícula de 17 × 9 puntos en las grabaciones de la placa de calibración utilizando una herramienta de software personalizada (GLabel, Universidad Friedrich Alexander Erlangen-Nürnberg), proporcionando así una matriz de pares de posiciones de puntos de 2 × 2D en el espacio de la imagen. Debido a las dimensiones conocidas y las distancias entre los puntos de la placa, se definió una matriz correspondiente de posiciones 3D ideales en el espacio real para todos los puntos.

Se obtuvo una primera T* estimada aplicando el enfoque de mapeo de 2 × 2D a 3D basado en el método de aproximación lineal descrito por Döllinger et al.31. Este enfoque utiliza un objeto de calibración que actúa como base ortogonal en el espacio real. En el experimento de Döllinger et al., se utilizó un cubo de calibración que se montó encima de las cuerdas vocales y se fijó en la parte superior del prisma. Por lo tanto, el objeto de calibración y la superficie de las cuerdas vocales siempre fueron visibles al mismo tiempo, pero tampoco en el mismo espacio y la reconstrucción dependió completamente de la extrapolación del área calibrada. Usando nuestra configuración, la base ortogonal se derivó de los puntos de la placa de calibración. Esto produce tres ventajas sobre el enfoque anterior: (1) como la rejilla se coloca en el mismo espacio que las cuerdas vocales (ver Fig. 2) las dimensiones x e y ya no tienen que extrapolarse (2) Para la calibración de todos Se pueden utilizar dimensiones no sólo de los bordes de un solo cubo, sino de toda la cuadrícula, que representa múltiples cuboides "virtuales", lo que produce más puntos para la calibración y el promedio. (3) Se puede reservar una sección de imagen de cámara más grande para la superficie medial, ya que la superficie y el objeto de calibración no tienen que ser visibles al mismo tiempo.

En el espacio de la imagen, los vectores de base virtual (\(\vec{v}_{1} ,\vec{v}_{2} ,\vec{v}_{3} \,{\text{and}}\, \vec{v}_{1}^{^{\prime}} ,\vec{v}_{2}^{^{\prime}} ,\vec{v}_{3}^{^{\ prime}} \in R^{2}\)) se reconstruyeron a partir de los puntos marcados para cada vista como se muestra en la Fig. 3. Los vectores en las direcciones x e y se construyeron restando puntos vecinos en la cuadrícula. Sin embargo, como ningún punto en la cuadrícula estaba ubicado "exactamente encima" uno del otro en la dirección z (ver Fig. 2b), los vectores \(\vec{v}_{3}\) (como representaciones 2D de vectores que apuntaría en la dirección z en el espacio 3D) tuvo que construirse indirectamente. Como se muestra en la Fig. 3, se utilizaron cuatro puntos vecinos a un punto en un medidor para construir un punto virtual p' ubicado exactamente "encima" del punto marcado en el medidor. Conectando estos puntos, se podrían construir vectores en dirección \(\vec{v}_{3}\). Luego se promediaron los vectores para cada vista y dirección, lo que dio como resultado tres vectores 2D para cada vista (\(\vec{v}_{1} = \left( {x_{1} ,y_{1} } \right), \vec{v}_{2} = \left( {x_{2} ,y_{2} } \right),\vec{v}_{3} = \left( {x_{3} ,y_{3) } } \right)\) y \(\vec{v}_{1} ^{\prime} = \left( {x_{1} ^{\prime},y_{1} ^{\prime}} \ derecha), \vec{v}_{2} ^{\prime} = \left( {x_{2} ^{\prime},y_{2} ^{\prime}} \right),\vec{v }_{3} ^{\prime} = \left( {x_{3} ^{\prime},y_{3} ^{\prime}} \right)\)).

Reconstrucción de una serie de cubos virtuales a partir de puntos de placa de calibración.

Posteriormente, la matriz \(F\), que describe el mapeo lineal desde el espacio real 3D + 1 al espacio de imagen 2 × 2D (\(F: R^{4} \to R^{2} \times R^{2}\ )), se construyó a partir de los vectores base \(\vec{v}_{1} ,\vec{v}_{2} ,\vec{v}_{3} y \vec{v}_{1} ^{^{\prime}} ,\vec{v}_{2}^{^{\prime}} ,\vec{v}_{3}^{^{\prime}} \en R^{2 }\) con un vector de cuarta base agregado como “dimensión auxiliar” para permitir la inversión de matrices como se muestra en la ecuación. (2). Utilizando la optimización de Nelder-Mead, se calculó el primer \(F^{*}\) optimizado y la inversión de \(F^{*}\) se puede utilizar para mapear el espacio de imagen 2 × 2D al espacio real 3D + 1. Por tanto, el algoritmo de reconstrucción 3D propuesto por Döllinger et al. fue reproducido en este punto31.

Para alinear los puntos 3D reconstruidos \(p^{\# }\) con un sistema de coordenadas del espacio real útil elegido, se debe aplicar una cierta rotación y desplazamiento a los puntos reconstruidos. Se determinaron una matriz de rotación R y un vector de desplazamiento S alineando los puntos de la cuadrícula 3D reconstruidos \(p^{\# }\) con sus posiciones 3D en el espacio real definidas por las dimensiones de la placa de calibración. Si la estimación inicial \(F^{*}\) no produce un error cuadrático medio entre las posiciones 3D reconstruidas \(p^{\# }\) y las posiciones 3D ideales en el espacio real de menos de 0,08 mm, además La optimización iterativa de Nelder-Mead se lleva a cabo minimizando la suma del error cuadrático, optimizando F, R y S en el proceso hasta que el algoritmo no produce más mejoras dentro de 100 iteraciones. Esto permite una reconstrucción 3D exitosa incluso en casos en los que el algoritmo original habría dado como resultado una imagen deformada (por ejemplo, si el ángulo entre la cámara y el prisma es demasiado alto). Por lo tanto, la función de transformación final T se muestra en la ecuación. (3). Todo el algoritmo se implementó en Matlab (R2021b) Actualización 1).

Comparando las coordenadas 3D reconstruidas con las posiciones teóricas óptimas sólo se puede obtener información exacta sobre el error con respecto al espacio 3D cubierto por la placa de calibración, es decir, un volumen que luego cubrirá toda la cuerda vocal en las dimensiones x e y, pero solo cubre 0,5 mm en la dirección z (desde y hacia la superficie del prisma de vidrio). Se espera que el error aumente lentamente al aumentar la distancia desde el prisma de vidrio debido al método de aproximación lineal subyacente que extrapola posiciones 3D y una precisión cada vez menor de los puntos marcados a medida que aumenta la distancia al vidrio. Por esta razón, se diseñó el siguiente experimento para analizar cómo se comporta el error hasta 15 mm de la superficie del vidrio:

Se instaló un sistema de posicionamiento manual (A40 Series UniSlide, Velmex Inc., Bloomfield, Nueva Jersey) y el prisma de vidrio transparente en ángulo recto se fijó en su posición sobre el extremo anterior del sistema. Por razones de viabilidad, el prisma se fijó para una división vertical de las vistas. La placa de calibración se colocó en el extremo anterior del sistema en posición vertical, en contacto con la base en el lado de la hipotenusa del prisma. Utilizando la cámara estacionaria de alta velocidad Phantom v210, se grabaron múltiples imágenes de la placa alejándose del prisma en pasos de 15 1 mm desde 0 mm desde la superficie del prisma hasta una distancia de 15 mm. El ajuste de la distancia se realizó manualmente con una precisión de 0,01 mm. La distancia entre la cámara y la superficie del prisma fue de 1 m, lo que corresponde a la distancia límite superior que se utiliza en los experimentos in vivo donde la cámara suele colocarse más cerca. Toda la configuración se ilustra esquemáticamente en la Fig. 4.

Ilustración de la configuración utilizada para la validación del algoritmo de reconstrucción 3D.

Para capturar también la influencia de diferentes ángulos de la cámara, se giró la cámara 5° y 10° alrededor de los ejes transversal y longitudinal del prisma y se repitió el experimento. Todas las sesiones de grabación transversal se ilustran en la Fig. 5 (a) 0°, (b) 5° y (c) 10°. Para la correspondiente rotación longitudinal se giró el prisma 90° y se repitió el proceso.

Ilustración de las rotaciones del eje transversal en (a) 0°, (b) 5° y (c) 10°.

El espacio de reconstrucción sólo se calibró utilizando el registro de la placa de calibración más cercana al prisma. En este registro de calibración se marcó una cuadrícula de 152 puntos (una matriz de puntos de referencia de 17 × 9, omitiendo un punto como marcador para la orientación de la cuadrícula). Todos los registros de la placa de calibración más alejada del prisma se utilizaron para la reconstrucción 3D basada en esta calibración inicial. Es decir, estas grabaciones fueron tratadas como grabaciones de “objetos para reconstrucción”. En estas grabaciones, solo se marcó una serie de puntos de referencia de 9 × 9 para aumentar la precisión del clic a una distancia mayor del prisma, evitando la superposición de marcadores. Respectivamente, los errores se calcularon en función de esta cuadrícula de 9 × 9 entre las posiciones de los puntos de referencia reconstruidos en 3D y las posiciones de los puntos de referencia en el espacio real conocidas (posiciones ideales) a una distancia de 1 a 15 mm del prisma.

Se investigó el efecto de seis posibles factores de influencia: (1) la influencia de la distancia entre la superficie del prisma y los puntos reconstruidos (2) la influencia de las rotaciones en el eje transversal del prisma (3) la influencia de las rotaciones en el eje longitudinal del prisma (4 ) la influencia de diferentes números de puntos utilizados para la calibración en el registro de calibración (5) la influencia de la extrapolación del espacio calibrado en las direcciones x e y (6) la influencia del cambio de los parámetros de la cámara entre la calibración y la reconstrucción. Esto último se logró utilizando los registros de calibración de 0° (distancia de la superficie de la placa al prisma de 0 mm) para calibrar los respectivos registros de rotación transversal y longitudinal de 5° para la reconstrucción (distancia de la superficie de la placa al prisma de 1 a 15 mm).

Para la validación del proceso de reconstrucción 3D, se calcularon dos medidas de error. El error de posición refleja la desviación absoluta exacta entre cada posición del punto de la cuadrícula 3D reconstruida y la posición ideal esperada de este punto de la cuadrícula 3D en el espacio real en las direcciones x, y y z. El error de distorsión relaciona las distancias medidas entre los puntos reconstruidos en la placa de calibración con sus distancias ideales esperadas, es decir, mide los cambios en las dimensiones de la cuadrícula reconstruida en la placa de calibración en comparación con las dimensiones reales conocidas. La distorsión de la superficie reconstruida es más crítica que la desalineación sistemática de la posición. Sin embargo, debido al pequeño espesor de la placa de calibración, la distorsión puede ser engañosamente alta. Por este motivo, en la mayoría de las evaluaciones se incluyen ambos tipos de errores.

En la Fig. 6 se ofrece un resumen gráfico del proceso desde la medición in vivo hasta la extracción de datos 3D. En el primer paso (a) se registra una imagen de calibración. Sin cambiar la posición de la cámara o del prisma después de retirar la placa de calibración (b), se registra la superficie medial con una serie de puntos de referencia tatuados. (c) Estos puntos de referencia se resaltan y se rastrean. (d) Las posiciones 2D correspondientes de todos los marcadores se importan en Matlab (si los puntos de referencia tatuados en las cuerdas vocales en el espacio 2D se oscurecieron durante hasta 3 fotogramas en una vista o ambas posiciones se interpolaron linealmente). (e) Utilizando el algoritmo descrito anteriormente, se reconstruye la posición 3D de cada punto y (f) la forma de la superficie 3D formada por las posiciones de los puntos 3D se calcula mediante interpolación spline (utilizando la función griddata de Matlab con el método de interpolación “cúbica”34). (g) Para la detección del ciclo se eligió un corte estrecho inferior-superior de la superficie, que cubre el 20% del rango anteroposterior completo y el 60% del rango superior-inferior completo. (h) El volumen se calculó basándose en un corte de superficie amplia que cubre el 80% del rango anteroposterior completo y el 20% del rango superior-inferior completo. (i) en base a estas selecciones, se calcularon el volumen a lo largo del tiempo y las duraciones de las fases básicas (apertura, cierre y cierre) con fines de demostración para los tres niveles de estimulación mencionados anteriormente ((1) RLN 4 SLN 5, (2) RLN 5 SLN 5, (3) RLN 6 SLN 5). Las medidas se calcularon individualmente durante tres ciclos sucesivos y luego se promediaron.

Resumen del proceso de reconstrucción 3D que cubre (a) calibración, (b) registro de la superficie medial, (c) seguimiento de puntos de referencia, (d) importación de posiciones de marcadores 2D, (e) reconstrucción 3D, (f) interpolación de superficies, (g) detección de ciclos , (h) cálculo de volumen y (i) generación de datos.

Los ciclos se determinaron de la siguiente manera: los máximos de volumen local entre el corte de superficie estrecha (Fig. 6g) y la superficie de vidrio del prisma determinan los inicios del ciclo. La fase cerrada de cada ciclo se determina luego por la distancia mínima entre la superficie reconstruida y la placa de vidrio para cada “línea” reconstruida (es decir, corte coronal) de la superficie que va de inferior a superior en cada fotograma. Si más del 50% de las líneas que componen un corte de superficie están a menos de 0,02 mm de la superficie del prisma, el marco correspondiente se marca como completamente "cerrado". Posteriormente, los fotogramas individuales sin marcar que quedan entre varios fotogramas marcados como "cerrados" también se marcan como cerrados y viceversa. Luego se determinó que la fase de cierre abarcaba desde el inicio del ciclo hasta el primer cuadro cerrado, la fase de cierre comprendía desde el segundo hasta el penúltimo cuadro cerrado, y la fase de apertura comprendía desde el último cuadro cerrado hasta el final del ciclo. Todos los videos reconstruidos están incluidos en la colección de videos complementarios (videos complementarios S1).

Todos los experimentos de este estudio se llevaron a cabo cumpliendo con las recomendaciones de la Guía para el cuidado y uso de animales de laboratorio de los Institutos Nacionales de Salud. El estudio fue aprobado por el Comité de Investigación Animal (ARC) de la Universidad de California, Los Ángeles (Número de protocolo: ARC-2010-021). Este estudio cumple con las pautas ARRIVE.

En la Fig. 7 se representan el error de posición y el error de distorsión para las dimensiones x, y y z para una distancia cambiante al prisma de 1 a 15 mm. (a) Se representa una visualización esquemática del error de posición y la dirección de los ejes x, y y z en el espacio real. De esta manera x se define como el eje transversal del prisma, y ​​su eje longitudinal y z su eje frontal. (b) El error de posición en las direcciones x e y aumenta lentamente al aumentar la distancia de la placa al prisma. El error absoluto en la dirección z no muestra un aumento notable al aumentar la distancia. Como se ilustra en (c), el error de distorsión medido puede entenderse como estiramiento o compresión de la rejilla reconstruida. Este error se calculó como un valor relativo en porcentaje. Para (d) las dimensiones x e y, este error aumenta muy ligeramente al aumentar la distancia al prisma. El error en la dirección z muestra significativamente más ruido pero no hay una asociación inequívoca con la distancia al prisma.

(a) Ilustración del cálculo del error de posición. (b) Error de posición en las dimensiones x, y y z para distancias de placa de 1 a 15 mm al prisma. (c) Ilustración del cálculo del error de distorsión. (c) Error de distorsión en las dimensiones x, y y z para distancias de placa de 1 a 15 mm al prisma.

En la Fig. 8 se muestran los errores de posición y distorsión para rotaciones de 5° y 10° alrededor del eje transversal del prisma. La columna izquierda de la figura muestra los errores de posición y distorsión para una rotación de 5° y la columna derecha para una rotación de 10°. Como se muestra en (a) y (b), el error de posición para 5° y 10° permanece muy bajo para las dimensiones x e y y aumenta al aumentar la distancia desde el prisma en la dirección z. El error de distorsión para (c) 5° y (d) 10° solo aumenta en la dirección z.

Error de posición de (a) 5° y (b) 10° registros rotados transversalmente y error de distorsión de (c) 5° y (d) 10° registros rotados longitudinalmente con dos desviaciones estándar.

De manera análoga, en la Fig. 9 se muestran los errores de posición y distorsión para rotaciones de 5° y 10° alrededor del eje longitudinal del prisma. Nuevamente, el error de posición se mantiene bajo en las direcciones x e y y aumenta en la dirección z al aumentar la distancia desde el prisma. El error de distorsión también aumenta en la dirección z.

Error de posición de (a) 5° y (b) 10° registros rotados longitudinalmente y error de distorsión de (c) 5° y (d) 10° registros rotados longitudinalmente con dos desviaciones estándar.

Para evaluar la influencia de un menor número de puntos utilizados para la calibración y volúmenes de calibración más pequeños (lo que requiere la extrapolación del espacio calibrado en las direcciones x e y), se repitió la primera evaluación (Influencia de la distancia) con cuadrículas de calibración más pequeñas. En la Fig. 10a, las cuadrículas utilizadas para la calibración se muestran a partir de la cuadrícula original de 152 puntos y de las cuadrículas reducidas de 90 puntos y 44 puntos. Una reducción adicional a 14 puntos dio como resultado que el algoritmo no convergiera y, por lo tanto, no se incluye aquí ya que no se pudo calcular ningún error. La Figura 10b es una ilustración esquemática de los volúmenes calibrados y un objeto para reconstrucción con respecto al espacio calibrado. La Figura 10c muestra el error de posición total para las tres cuadrículas de calibración calculado como la distancia euclidiana promedio entre los puntos reconstruidos y sus posiciones ideales. El error aumenta más rápidamente con la distancia en los registros de calibración utilizando un número menor de puntos. La cuadrícula de 90 puntos tuvo el error más alto, ya que para este registro el error de calibración inicial estuvo por debajo del umbral de 0,08 mm y, por lo tanto, se omitió una mayor optimización, lo que generó un error final ligeramente mayor. El error de deformación (no mostrado) no cambió notablemente entre los tamaños de cuadrícula.

Cambio en el error según el área y la cantidad de puntos utilizados para la calibración. (a) Imágenes de las tres cuadrículas de calibración diferentes utilizadas para esta evaluación. (b) Esquema de las diferentes áreas calibradas y donde se colocaría el objeto a reconstruir. (c) Error de posición total calculado como la distancia euclidiana promedio entre los puntos reconstruidos y sus posiciones ideales.

En la Fig. 11 se muestran los errores de posición y distorsión de los experimentos que exploran la influencia del cambio de los parámetros de la cámara entre la calibración y la reconstrucción. La columna de la izquierda de la figura muestra errores si los registros de rotación transversal de 5° se calibraron usando los registros de calibración de 0°, y la columna de la derecha muestra errores análogos si los registros de rotación longitudinal de 5° se calibraron usando los registros de calibración de 0°. Como se ve en la Fig. 11 (a), el error de posición es muy alto en las dimensiones x e y y moderado en la dimensión z. El error permanece prácticamente constante en la dirección x, pero cambia en la dirección y para la rotación transversal y (b) viceversa para la rotación longitudinal. La no linealidad en el error de dimensión x se debe a que la superficie reconstruida se “deriva” en la dirección x al aumentar la distancia desde el prisma, alcanzando su posición ideal y luego moviéndose más en la misma dirección, alejándose nuevamente de la posición ideal. Además, aumenta la desviación estándar en la dimensión z. En comparación, los errores de distorsión como se ven en (c) y (d) se mantienen bajos.

(a) error de posición de registros de rotación transversal de 5° calibrados con calibración de 0°, (b) error de posición de registros de rotación longitudinal de 5° calibrados con calibración de 0°, (c) error de distorsión de registros de rotación transversal de 5° calibrados con calibración de 0° y (d) error de distorsión de registros de rotación longitudinal de 5° calibrados con calibración de 0°. Todos los errores se dan con dos desviaciones estándar.

Para la validación de la versión anterior de esta configuración, se calculó un error de calibración (cE) basado en la distorsión de las longitudes del cubo de calibración utilizado (5 mm3). Este error se expresó como una desviación absoluta de la longitud ideal del cubo de 5 mm para cada lado y para la diagonal del cubo33. A modo de comparación, calculamos el error de distorsión absoluto y relativo de la misma manera basándose en segmentos de cuadrícula de 2 × 2 × 0,5 que forman cuboides. En la Tabla 1 se dan los errores de distorsión absoluta y relativa (es decir, desviaciones en las longitudes de cubo/cuboide de sus longitudes ideales) para la versión anterior de esta configuración y la configuración avanzada actual. El error absoluto de la configuración avanzada es entre cuatro y 20 veces menor.

En la Tabla 2, se dan los valores promedio y las desviaciones estándar para las cuatro medidas laríngeas dinámicas calculadas y las tres combinaciones de estimulación. Además, se proporciona un promedio general de las condiciones y la desviación estándar correspondiente, que denota la variación total.

En este estudio, adaptamos la configuración y el algoritmo de reconstrucción laríngea 3D propuestos originalmente por Döllinger et al.31 de varias maneras para facilitar la aplicación en grabaciones in vivo y mejorar el error de reconstrucción. Mejoramos la viabilidad fijando la posición del prisma y, por lo tanto, evitando la recalibración continua requerida debido a la respiración animal in vivo y, por lo tanto, introduciendo un ligero movimiento del prisma. Disminuimos el error de reconstrucción reemplazando el cubo de calibración con una placa de calibración, lo que permitió una mayor variedad de "puntos conocidos" para la calibración y al mismo tiempo eludió la mayor parte de la extrapolación del espacio calibrado que de otro modo sería necesaria. Agregamos un paso de optimización al algoritmo de reconstrucción 3D en caso de que la primera estimación de la matriz F no produzca resultados convincentes, lo que lo hace más robusto a los errores de ángulo de la cámara. Realizamos múltiples experimentos para cuantificar el error de reconstrucción en función de diferentes errores potenciales que pueden ocurrir en experimentos reales y, por último, complementamos este trabajo con una implementación en Matlab del algoritmo discutido que incluye un ejemplo de calibración y superficie para la reconstrucción (código complementario S2).

Como era de esperar, el error general aumenta al aumentar la distancia entre la superficie del prisma y los puntos reconstruidos. Una excepción a esta tendencia es el error de posición en la dirección z (distancia desde la placa de vidrio del prisma) que muestra una mayor dependencia del ángulo de grabación y no muestra un aumento notable con la distancia para un ángulo perfectamente perpendicular. En entornos in vivo, no siempre se puede garantizar un ángulo perfectamente perpendicular; sin embargo, incluso en el caso extremo de una desviación del ángulo de la cámara de 10° en experimentos de rotación transversal y longitudinal, el error z de posición no supera los 0,6 mm a una distancia máxima de 15 mm. desde el prisma. Estudios previos de fonación de hemilaringe demostraron que la superficie medial de las cuerdas vocales en estas configuraciones nunca está a más de 5 mm de la superficie del prisma, por ejemplo35.

El error de distorsión que describe la deformación de la placa debido a la reconstrucción sigue siendo bajo para las direcciones x e y. El error de distorsión en la dirección z muestra mucho ruido pero el error de posición es bajo. Esta diferencia es esperable ya que la placa tiene sólo 0,5 mm de profundidad en contraste con la expansión mucho mayor en las direcciones x e y (9 mm y 17 mm cubiertos por puntos marcados). Es decir, un error de distorsión del 10 al 20 % sólo equivale a una desviación absoluta de 0,05 a 0,1 mm.

Reducir el número de puntos utilizados para la calibración, haciendo que sea necesaria la extrapolación del espacio calibrado en las direcciones x e y, solo aumenta ligeramente el error general. Esto es de esperar, ya que se ha demostrado anteriormente que el método de aproximación lineal utilizado para estimar la matriz F es muy adecuado para la extrapolación del espacio calibrado33. Sin embargo, para obtener mejores resultados, puede ser recomendable utilizar una gran cantidad de puntos para la calibración. El error ligeramente mayor en la cuadrícula de 90 puntos probablemente se deba a la omisión de la optimización de la calibración, ya que el umbral de error de 0,08 mm ya se alcanzó después del primer paso de calibración. El umbral de error se estableció porque notamos que en este rango de error, una optimización adicional podría dar como resultado un error menor en las direcciones x e y a costa de un error mayor en la dirección z.

La calibración de las grabaciones de rotación transversal y longitudinal de 5° con la grabación de calibración de 0° simuló un pequeño cambio accidental en la posición de la cámara entre la calibración y la reconstrucción. Esto resultó en errores de posición elevados en las direcciones x e y, pero aún errores aceptables en la dirección z y errores de baja distorsión. Dependiendo de la rotación, el error de posición en la dirección x o y cambió aproximadamente 0,5 mm por cada 5 mm de distancia del prisma. Esto implica que este tipo de cambio entre la calibración y la reconstrucción conducirá principalmente a cambios en la posición general de la superficie reconstruida. Sin embargo, se producen pequeñas distorsiones lineales dependiendo de la distancia desde el prisma, dando la apariencia de un movimiento ligeramente diagonal durante la oscilación de las cuerdas vocales, distorsionando respectivamente ligeramente la superficie. La mayor desviación estándar en el error de posición en la dirección z para las reconstrucciones con rotación longitudinal de 5° también implica una rotación adicional muy leve de la reconstrucción. En la configuración experimental, este tipo de cambio de parámetro de la cámara rara vez ocurre, ya que se puede ver de antemano y generalmente se evita.

El valor traslacional de este trabajo está en aplicaciones donde los objetos que se mueven rápidamente deben reconstruirse con alta precisión en un dominio 3D pequeño y accesible. Un ejemplo de ello son las aplicaciones en velocimetría de imágenes de partículas (PIV). En la PIV tomográfica, a medida que las partículas viajan a través de un túnel de aire, pasan por un volumen iluminado con láser que las hace visibles para permitir la reconstrucción 3D de sus posiciones en grabaciones de alta velocidad utilizando cuatro cámaras36. En configuraciones en las que la superposición de partículas no es crítica (ya que las partículas en el frente oscurecen a otras detrás de ellas), las posiciones de las partículas en 3D podrían reconstruirse usando solo una cámara con la configuración validada en este estudio37. De manera similar, las superficies 3D móviles o vibratorias de tamaños pequeños y medianos podrían reconstruirse cuando la cuadrícula de calibración y el prisma se aumentan o reducen en consecuencia38. Además, para la aplicación traslacional, es fundamental que se puedan identificar conjuntos de puntos 2D emparejados en las grabaciones de vista dividida. Esto puede dificultar la transferibilidad en algunos casos. En general, las modificaciones exactas que uno tendría que aplicar a la configuración descrita y al código fuente proporcionado (código complementario S2) dependen en gran medida de la tarea específica que debe realizarse y, por lo tanto, no pueden describirse en detalle aquí.

Como lo muestran los experimentos, el error general de reconstrucción del procedimiento propuesto es bajo. El error de posición total en todas las direcciones no excede un promedio de 0,12 mm para el ángulo de cámara perpendicular que graba a una distancia de 5 mm del prisma; la distancia máxima que alcanza la superficie de las cuerdas vocales desde el prisma en la mayoría de los experimentos de fonación. Incluso si se introducen desviaciones considerables del ángulo de la cámara con respecto al ángulo de grabación perpendicular, el error de reconstrucción sigue siendo bajo (aproximadamente 0,16 a 0,17 mm a una distancia de 5 mm del prisma). Una reducción de los puntos para la calibración que requiera una extrapolación en las direcciones x e y solo aumenta ligeramente el error siempre que quede un número suficiente de puntos. Siempre que las cuerdas vocales no se desvíen significativamente (varios cm) del volumen calibrado, los cambios de movimiento, estiramiento o compresión, o cambios en las distancias entre puntos de referencia en las cuerdas vocales no afectan el error. Lo que se debe evitar son cambios accidentales en la posición de la cámara entre la calibración y la reconstrucción, pero los efectos son tolerables siempre que los cambios sean pequeños. La comparación de esta configuración con su versión anterior muestra una mejora significativa en el error de reconstrucción.

Sólo se utilizó un canino para la demostración y la profundidad de las ranuras en la placa de calibración actualmente es de solo 0,5 mm. Aunque el error en la dirección z es pequeño, probablemente podría reducirse aún más con ranuras más profundas, lo que permitiría una calibración más precisa en la dirección z.

El enfoque actual de reconstrucción 3D se basa en el marcado manual y el seguimiento de los puntos de referencia en las cuerdas vocales. Debido a los frecuentes reflejos y sombras, así como a las limitaciones de la cámara utilizada, hasta el momento no existe un algoritmo de seguimiento fiable y totalmente automatizado. Por tanto, el momento de marcar puntos de referencia es actualmente el mayor cuello de botella de esta técnica de reconstrucción 3D que ralentiza la generación de datos. Estamos trabajando activamente para mejorar el proceso y la calidad de la imagen para permitir la introducción exitosa de enfoques de seguimiento automatizados basados ​​en redes neuronales en el futuro.

Además, como solo se reconstruyen los puntos marcados y la superficie restante se interpola entre estos puntos, la precisión de la reconstrucción 3D también depende del número de puntos y de la densidad de la cuadrícula de puntos marcados en las cuerdas vocales. Sin embargo, como las cuerdas vocales tienen una superficie lisa, no se deben introducir errores importantes siempre que se haya tatuado un número suficiente de puntos.

En este trabajo, propusimos y validamos una nueva configuración para la reconstrucción de superficies de tejido en movimiento en 3D basándose en trabajos anteriores de Chhetri et al.2,3 y Döllinger et al.31. Avanzamos en el método de reconstrucción 3D de Döllinger et al.31 al facilitar la aplicación de grabaciones in vivo mediante la introducción de un prisma fijo y una calibración basada en placas. Agregamos al algoritmo de reconstrucción hacerlo más robusto frente a desviaciones en los ángulos de grabación y cambios en los parámetros de la cámara. Utilizando el protocolo de estimulación del nervio laríngeo establecido por Chhetri et al.2,3 en combinación con estos ajustes, se mejoró la reconstrucción 3D in vivo de la superficie medial de las cuerdas vocales oscilantes en combinación con estimulación nerviosa concurrente. La precisión de esta reconstrucción fue validada y mostró un error promedio de posición total máximo de 0,12 mm a una distancia de hasta 5 mm de la superficie del prisma para el registro perpendicular, superando la versión anterior de esta configuración33 y otros métodos de reconstrucción 3D in vivo establecidos. en términos de resolución espacial23,24. Por último, se demostró la utilidad de esta configuración reconstruyendo tres registros de la superficie medial de las cuerdas vocales y calculando los parámetros básicos. La aplicación de esta configuración no se limita a la investigación de la voz, ya que los algoritmos se pueden aplicar total o parcialmente a otros problemas37,38 que requieren una reconstrucción precisa de superficies o partículas en movimiento accesibles.

Todos los datos relevantes para una replicación del algoritmo de reconstrucción 3D descrito se proporcionan en el material complementario. Para solicitudes de datos relacionados con este estudio, comuníquese con [email protected].

Titze, Principios IR de producción de voz, 2.ª ed., Centro Nacional para la Voz y el Habla, IA: Iowa City, 2000

Chhetri, DK, Neubauer, J. & Berry, DA Activación gradual de los músculos laríngeos intrínsecos para la postura de las cuerdas vocales. J. acústico. Sociedad 127, EL127–EL133 (2010).

ADS del artículo Google Scholar

Vahabzadeh-Hagh, AM, Zhang, Z. & Chhetri, DK Evaluación cuantitativa de la forma de la superficie medial de las cuerdas vocales in vivo. J. Voz 31, 513.e15-513.e23 (2017).

Artículo PubMed Google Scholar

Zhang, Z. Mecánica de producción y control de la voz humana. J. acústico. Soc. Soy 140, 2614–2635 (2016).

Artículo ADS PubMed PubMed Central Google Scholar

Saggio, G. & Costantini, G. Parámetros básicos de la voz de adultos sanos en todo el mundo: una revisión exhaustiva. J. Voz 36, 637–649 (2022).

Artículo PubMed Google Scholar

Inwald, EC, Döllinger, M., Schuster, M., Eysholdt, U. y Bohr, C. Análisis multiparamétrico de vibraciones de cuerdas vocales en voces sanas y desordenadas en imágenes de alta velocidad. J. Voz 25, 576–590 (2011).

Artículo PubMed Google Scholar

Unger, J., Schuster, M., Hecker, DJ, Schick, B. y Lohscheller, J. Un procedimiento generalizado para analizar vibraciones sostenidas y dinámicas de las cuerdas vocales a partir de videos laríngeos de alta velocidad utilizando fonovibrogramas. Artif. Intel. Medicina. 66, 15-28 (2016).

Artículo PubMed Google Scholar

Uloza, V., Vegienė, A., Pribuišienė, R. & Šaferis, V. Evaluación cuantitativa de la videolaringoestroboscopia: confiabilidad de los parámetros básicos. J. Voz 27, 361–368 (2013).

Artículo PubMed Google Scholar

Roy, N. Disfonía funcional. actual. Opinión. Otorrinolaringol. Cirugía de cabeza y cuello. 11, 144-148 (2003).

Artículo PubMed Google Scholar

Bonilha, HS, Deliyski, DD, Whiteside, JP y Gerlach, TT Asimetrías de fase de las cuerdas vocales en pacientes con trastornos de la voz: un estudio de técnicas de visualización. Soy. J. Lenguaje del habla. Patol. 21, 3-15 (2012).

Artículo PubMed Google Scholar

Eysholdt, U., Rosanowski, F. & Hoppe, U. Irregularidades de vibración de las cuerdas vocales causadas por diferentes tipos de asimetría laríngea. EUR. Arco. Oto-Rhino-L 260, 412–417 (2003).

Artículo CAS Google Scholar

Pedersen M, Jønsson A, Mahmood S, Agersted AA: Qué fórmulas matemáticas y fisiológicas describen la patología de la voz: una descripción general. J Gen Práctica 4, 2006

Zhang, Z. & Chhetri, DK Efecto de los cambios en la forma de la superficie medial sobre la producción de la voz en laringes humanas extirpadas. J. acústico. Soc. Enm. 146, EL412–EL417 (2019).

Artículo ADS PubMed PubMed Central Google Scholar

Reddy, NK, Schlegel, P., Lee, PY y Chhetri, DK Reconstrucción 3D de la forma y el volumen de la glota fonatoria: efectos de la activación neuromuscular (laringoscopio en prensa, 2022).

Google Académico

Hoppe, U. y col. Glissando: motricidad y acústica laríngea. J. Voz 17, 370–376 (2003).

Artículo PubMed Google Scholar

Semmler, M. y col. Reconstrucción 3D de la dinámica laríngea humana basada en registros endoscópicos de alta velocidad. Traducción IEEE. Medicina. Imágenes 35, 1615-1624 (2016).

Artículo PubMed Google Scholar

Kopczynski, B., Niebudek-Bogusz, E., Pietruszewska, W. & Strumillo, P. Segmentación de imágenes glotales de videoendoscopia de alta velocidad optimizadas mediante grabaciones acústicas sincrónicas. Sensores 22, 1751 (2022).

Artículo ADS PubMed PubMed Central Google Scholar

DeJonckere, PH y Lebacq, J. Velocidad de colisión de las cuerdas vocales en vivo: el efecto del volumen. J. Voz 36, 608–621 (2022).

Artículo PubMed Google Scholar

Díaz-Cádiz, ME et al. Estimación de la presión de contacto de las cuerdas vocales a partir de una videoendoscopia laríngea de alta velocidad sin procesar utilizando un modelo de contacto de hercios. Aplicado 9, 2384 (2019).

Google Académico

Döllinger, M. y col. Experimentos para analizar la producción de voz: enfoques extirpados (humano, animal) e in vivo (animal). actual. Bioinformar. 6, 286–304 (2011).

Artículo PubMed PubMed Central Google Scholar

Semmler, M., Berry, DA, Schützenberger, A. y Döllinger, M. Interacciones fluido-estructura-acústica en un modelo de fonación porcina ex vivo. J. acústico. Soc. Enm. 149, 1657–1673 (2021).

Artículo ADS PubMed PubMed Central Google Scholar

Berke, GS, Neubauer, J., Berry, DA, Ye, M. y Chhetri, DK Modelo de fonación de laringe perfundida ex vivo: estudio preliminar. Ana. Отол. Rinol. Laringol. 116, 866–870 (2007).

Artículo PubMed Google Scholar

Yumoto, E., Oyamada, Y., Nakano, K., Nakayama, Y. y Yamashita, Y. Características tridimensionales de la laringe con cuerdas vocales inmóviles. AOHNS 130, 967–974 (2004).

Google Académico

Miyamoto, M. y col. Imágenes tridimensionales de la laringe vocalizante mediante tomografía computarizada de ultra alta resolución. EUR. Arco. Oto-Rhino-L 276, 3159–3164 (2019).

Artículo de Google Scholar

Luegmair, G., Mehta, DD, Kobler, JB y Döllinger, M. Reconstrucción óptica tridimensional de la cinemática de las cuerdas vocales mediante vídeo de alta velocidad con un sistema de proyección láser. Traducción IEEE. Medicina. Imágenes 34, 2572–2582 (2015).

Artículo PubMed PubMed Central Google Scholar

Jiang, JJ y Titze, IR Un estudio metodológico de la fonación hemilaríngea. Laringoscopio 103, 872–882 (1993).

Artículo CAS PubMed Google Scholar

Alipour, F., Montequin, D. & Tayama, N. Perfiles aerodinámicos de una hemilaringe con tracto vocal. Ana. Отол. Rinol. Laringol. 110, 550–555 (2001).

Artículo CAS PubMed Google Scholar

Andrews, RJ y cols. Función vocal después de hemilaringectomía vertical: Comparación de cuatro técnicas de reconstrucción en el canino. Ana. Отол. Rinol. Laringol. 106, 261–270 (1997).

Artículo CAS PubMed Google Scholar

Herbst, C. T, Hampala, V., García, M., Hofer, R., Svec, JG Configuración hemilaríngea para estudiar la vibración de las cuerdas vocales en tres dimensiones. JOVE e55303, 2017

LaVisión. Software Davis. Disponible en https://www.lavision.de/en/products/davis-software/. Consultado el 18 de mayo de 2023.

Döllinger, M., Berry, DA y Berke, GS Dinámica de la superficie medial de una cuerda vocal canina in vivo durante la fonación. J. acústico. Soc. Enm. 117, 3174–3183 (2005).

Artículo ADS PubMed Google Scholar

Döllinger, M., Berry, DA y Berke, GS Un estudio cuantitativo de la dinámica de la superficie medial de una cuerda vocal canina in vivo durante la fonación. Laringoscopio 115, 1646–1654 (2005).

Artículo de Google Scholar

Döllinger, M. & Berry, DA Cálculo de la dinámica tridimensional de la superficie medial de las cuerdas vocales. J. Biomecánica. 39, 369–374 (2006).

Artículo PubMed Google Scholar

Trabajos de matemáticas. Datos de cuadrícula. Disponible en https://www.mathworks.com/help/matlab/ref/griddata.html. Consultado el 22 de junio de 2022.

Bößenecker, A., Berry, DA, Lohscheller, J., Eysholdt, U. y Döllinger, M. Propiedades de las ondas mucosas de una cuerda vocal humana. Acta Acusta. Acústica Unida. 93, 815–823 (2007).

Google Académico

Elsinga, GE, Scarano, F., Wieneke, B. y van Oudheusden, BW Velocimetría de imagen de partículas tomográficas. Exp. Fluidos 41, 933–947 (2006).

Artículo de Google Scholar

Neubauer, J. & Zhang, Z. Las estructuras coherentes del campo cercano fluyen en un modelo físico autooscilante de las cuerdas vocales. J. acústico. Soc. Enm. 121, 1102-1118 (2007).

Artículo ADS PubMed Google Scholar

Lacour, C., Daher, P., Lecordier, B. Técnica de grabación multiangular en una sola cámara para mediciones 3D en mecánica de fluidos. En el 13.º Simposio internacional sobre velocimetría de imágenes de partículas, julio de 2019, Múnich, Alemania

Descargar referencias

Este estudio fue apoyado por la subvención R01DC11300 del Instituto Nacional de Salud (NIH) y del Instituto Nacional de Sordera y otras comunicaciones (NIDCD). La contribución del Sr. Döllinger fue apoyada por la Deutsche Forschungsgemeinschaft (DFG) con la subvención no. DO1247/16-1.

Departamento de Cirugía de Cabeza y Cuello, Universidad de California, Los Ángeles, Servicios de Rehabilitación de UCLA, 1000 Veteran Ave, Los Ángeles, CA, 90095, EE. UU.

Patrick Schlegel, Neha K. Reddy, Zhaoyan Zhang y Dinesh K. Chhetri

Departamento de Cirugía de Cabeza y Cuello, División de Foniatría y Audiología Pediátrica, Universidad Friedrich Alexander Erlangen-Nürnberg, Erlangen, Alemania

Michael Döllinger

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Conceptualización, PS y DKC; Curación de datos, PS, NR y ZZ; Análisis Formal, PS; Adquisición de financiación, DKC y MD, Investigación PS; Administración de proyectos DKC; Recursos DKC; Software, PD; Supervisión, DKC; Validación, MD y ZZ; Redacción del borrador original, PD; Redacción: revisión y edición, MD, DKC, ZZ y PS

Correspondencia a Patrick Schlegel.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Schlegel, P., Döllinger, M., Reddy, NK et al. Validación y mejora de un enfoque de reconstrucción 3D de la superficie medial de las cuerdas vocales para aplicación in vivo. Representante científico 13, 10705 (2023). https://doi.org/10.1038/s41598-023-36022-6

Descargar cita

Recibido: 18 de julio de 2022

Aceptado: 27 de mayo de 2023

Publicado: 03 de julio de 2023

DOI: https://doi.org/10.1038/s41598-023-36022-6

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.