As novidades do universo tecnológico estão cada vez mais frequentes, mudando a forma com que as pessoas vêem e interagem com o mundo.
Essas novidades podem ser usadas para superar obstáculos de acessibilidade nos meios digitais para usuários com necessidades específicas, como o público que sofre com limitações fonoaudiólogas.
Foi com foco na melhoria da experiência desses usuários de televisão que, o time de Visual Display (VD) do Sidia Instituto de Ciência e Tecnologia, desenvolveu uma solução que permite disponibilizar conteúdo de linguagem de sinais nas TVs da Samsung através de um modelo humanoide 3D (Avatar), controlado pelo sinal aberto de TV digital.
A solução permite que as emissoras de TV transmitam sinais em Libras (glosas) para os receptores de TV conduzirem os movimentos desse Avatar, exibido em uma janela em um dos cantos da tela. Este processo é similar ao já conhecido closed-caption que apresenta legendas referentes ao conteúdo de vídeo.
Inicialmente, o time desenvolveu provas de conceito com base no conjunto de ferramentas de código aberto VLibras que permite a tradução de conteúdos digitais (texto, áudio e vídeo) em linguagem natural (português) para realizar a animação do avatar 3D em Libras.
Os primeiros testes identificaram que não era possível usar um serviço web para a tradução de legendas e download das animações em tempo hábil, para que a TV conseguisse animar o avatar de forma sincronizada com as mídias de áudio e vídeo.
Para superar esse obstáculo, as animações do VLibras foram inseridas diretamente no sinal aberto da TV Digital, através de um fluxo elementar alternativo. Com isso, a emissora de televisão teria o controle sobre o envio das animações, garantindo a chegada dessas em tempo hábil para exibição síncrona com o conteúdo de vídeo.
O projeto é um passo para maior disponibilização de conteúdo acessível em Libras pelos meios digitais e não visa substituir a figura do intérprete no processo de comunicação, mas sim fornecer os meios que facilitem a inserção de conteúdo acessível pelas emissoras de televisão, além de estimular avanços tecnológicos nesta área.
—
CONCEPÇÃO DA IDEIA
A ideia do Avatar no sinal de TV digital aberta surgiu após o desenvolvimento de provas de conceito usando um Avatar através da WEB. Nós criamos um protótipo que utiliza o framework WEB do VLibras para traduzir e devolver glosas de linguagem de sinais (LIBRAS) a partir das legendas (texto em português) decodificadas na TV e animar um Avatar Humanoide do VLibras. Após vários experimentos verificamos que não era possível usar um serviço web para tradução de legendas e download das glosas em tempo hábil para que a TV conseguisse animar o Avatar de forma sincronizada com a mídia de áudio e vídeo da TV. Assim, concluímos que a única possibilidade seria incluir as glosas (dados binários que produzem a animação do Avatar de linguagem de sinais) diretamente no sinal de TV através de um fluxo elementar alternativo. Este projeto de pesquisa ocorreu em paralelo a outros projetos de acessibilidade (GraphicZoom) que estávamos desenvolvendo em 2020. Desde então estamos trabalhando na viabilidade técnica da inclusão dos dados do Avatar juntamente com vídeo, áudio e metadados do sinal de TV.
Sobre o Sidia: Fundado em 2004, o Sidia Instituto de Ciência e Tecnologia é um dos maiores institutos de PD&I do país e responsável por implementar soluções tecnológicas inovadoras para o mercado local e global. O Sidia é referência no desenvolvimento de tecnologias focadas em 5G, IoT, Inteligência Artificial, VR/AR, Softwares Embarcados, Automação Industrial, Visão Computacional, entre outros. Atua em diversos setores como Indústria 4.0, Saúde e Varejo, criando novas tendências e oportunidades de negócios.
Com três sedes em Manaus (AM) e uma em São Paulo, o time do Sidia é formado por mais de 1.300 profissionais engajados com a inovação, composto por especialistas de diferentes formações intelectuais e culturais, além de infraestrutura de ponta.