A plataforma ADI fornece componentes e ferramentas para o desenvolvimento de óculos de AR com som de ouvido aberto

By Pete Bartolik

Contributed By DigiKey's North American Editors

A integração do áudio espacial com óculos de realidade aumentada (AR) pode criar experiências sensoriais humanas imersivas e interativas para melhor preencher a lacuna física e digital. Mas os projetistas precisam garantir que os óculos de AR com áudio aprimorado sejam leves e ofereçam tempo de funcionamento prolongado para uso prático.

O mercado de óculos inteligentes de AR parece estar à beira de um crescimento substancial, com remessas de unidades projetadas para aumentar de pouco mais de 676.000 em 2023 para 13 milhões de unidades em 2030, representando uma taxa de crescimento anual composta de 53%. As melhorias na qualidade da tela, na duração da bateria e no desempenho geral tornarão os óculos de AR mais práticos em casos de uso corporativo, industrial e de consumo.

Os óculos de AR com microfones e alto-falantes incorporados oferecem acesso rápido a assistentes de voz e reprodução de música. Eles podem ser um fator essencial para aproveitar os gêmeos digitais no chão de fábrica ou para fornecer aos ciclistas avisos de navegação e desempenho.

O áudio espacial de alta fidelidade pode impactar significativamente a experiência de AR do usuário, aprimorando a textura, o contexto e o significado das interações visuais. Mas obter áudio de alto desempenho com óculos de AR é especialmente desafiador devido ao pequeno fator de forma necessário para obter a aceitação e a satisfação do usuário. Além disso, esses dispositivos precisam ser leves e oferecer uma vida útil prolongada da bateria, o que pode ser particularmente desafiador ao incorporar recursos como áudio de alta qualidade, gravação de vídeo ou exibições visuais na aplicação.

Aliado aos avanços na capacidade de processamento e na resolução da tela, o gerenciamento de áudio e energia desempenhará um papel fundamental na criação de aplicações bem-sucedidas que maximizarão a demanda por esses dispositivos. Entre os desafios a serem superados estão:

  • Os alto-falantes menores tendem a ter altas frequências de ressonância, o que pode danificar os alto-falantes se forem excitados com muita força e dificultar o acionamento de graves profundos.
  • A qualidade da chamada sem ruído que capta a voz do usuário e bloqueia o ruído ambiente é essencial, mas complicada devido às distâncias entre os microfones e a boca do usuário.
  • A integração de mais recursos exige melhores soluções de gerenciamento de bateria para garantir um carregamento mais rápido e um tempo de funcionamento mais prolongado. O compromisso entre peso, função e tempo de funcionamento é fundamental para a adoção generalizada no mercado.
  • Muitos casos de uso exigem que os usuários não sejam impedidos de ouvir o que está acontecendo ao seu redor, como veículos que se aproximam ou interações com colegas de trabalho.

Áudio de ouvido aberto

Os projetistas que se esforçam para combinar informações visuais e auditivas de forma natural e realista devem considerar a tecnologia de áudio de ouvido aberto. Ao eliminar a necessidade de fones de ouvido ou minifone de ouvido, o áudio de ouvido aberto oferece aos usuários a capacidade de ouvir sons de AR e sons do mundo prático, possibilitando uma experiência imersiva e contínua sem comprometer a interação com outros usuários e o ambiente.

Com microfones embutidos e alto-falantes de ouvido aberto, os óculos de AR são altamente adequados para aplicações de AR, realidade virtual (VR) e realidade mista. Os usuários podem desfrutar de uma experiência auditiva mais confortável sem comprometer a qualidade ou a fidelidade do som. Esses dispositivos permitem que os usuários ouçam o que está acontecendo ao seu redor para que possam manter a consciência situacional para garantir a segurança e colaborar com colegas de trabalho ou interagir com outras pessoas, além de minimizar o risco — ou o incômodo — de outras pessoas ouvirem o conteúdo de áudio.

Os engenheiros podem aproveitar o áudio de ouvido aberto para criar aplicações eletrônicas que combinam informações visuais e auditivas de forma natural. Os óculos de AR com essa tecnologia adicionam outra camada de realismo, fornecendo áudio espacial que proporciona aos usuários um som que parece vir de uma direção e distância específicas.

O áudio espacial será um componente essencial do desenvolvimento do áudio de ouvido aberto. Ele cria um ambiente sonoro realista e imersivo que combina com o conteúdo visual e a perspectiva do usuário. O dispositivo Vision Pro VR da Apple, por exemplo, apresenta áudio de ouvido aberto, integração de áudio espacial e mapeamento de ouvido 3D para melhorar a experiência imersiva e eliminar a necessidade de fones de ouvido externos.

Simulando a maneira como as ondas sonoras interagem com os ouvidos, a cabeça e o corpo de um usuário — e com superfícies e objetos em seu ambiente físico — o áudio espacial também pode usar metadados como posição, orientação, distância, velocidade e direção para ajustar dinamicamente os parâmetros do som. Isso inclui volume, tom, timbre e reverberação, com base no movimento e na interação do usuário.

Projetar aplicações de áudio de ouvido aberto para óculos de AR exige uma compreensão das vantagens e desvantagens do dispositivo, dos princípios e das práticas recomendadas do projeto de áudio espacial, além de ferramentas e estruturas de desenvolvimento. As exibições e gravações de vídeo consomem muita energia, portanto, a eficiência é fundamental. O som de alta qualidade e os designs atraentes desempenharão um papel importante na aceitação do cliente, e o carregamento dos dispositivos deve ser conveniente e tão pouco frequente quanto a tecnologia permitir.

Plataforma da ADI para aplicações de óculos AR com áudio de ouvido aberto

A Analog Devices, Inc. (ADI) oferece uma plataforma de óculos de AR que inclui captura de áudio integrada, reprodução, componentes de gerenciamento de bateria e algoritmos. Esses componentes e ferramentas de desenvolvimento oferecem aos projetistas um caminho rápido para criar e testar aplicações de óculos de AR com áudio de ouvido aberto.

Os codecs do processador de áudio da ADI utilizam os algoritmos de processamento Pure Voice da empresa para melhorar a qualidade das chamadas de voz em ambientes acústicos desafiadores, e os algoritmos Dynamic Speaker Management (DSM™) para criar um som mais alto e mais rico a partir de aplicações de alto-falantes com restrições de espaço.

  • O ADAU1860 (Figura 1) apresenta um núcleo DSP de áudio HiFi 3z e um núcleo FastDSP de baixa latência, além de oito canais de entrada de microfone digital (DMIC), três entradas analógicas, uma saída analógica e dois canais de saída de modulação por densidade de pulso (PDM). A otimização do caminho entre a entrada analógica e o núcleo do DSP para baixa latência é ideal para o cancelamento de ruído.

Imagem do codec ADAU1860 da Analog DevicesFigura 1: O codec ADAU1860 da ADI incorpora dois DSPs, oito entradas de microfone digital e três entradas analógicas, entre outros recursos. (Fonte da imagem: Analog Devices, Inc.)

  • O ADAU1797 é uma opção de codec de baixo consumo de energia e alto desempenho que também integra um núcleo DSP de áudio HiFi 3z e um núcleo FastDSP de baixa latência, juntamente com três canais de entrada analógica, 10 canais de entrada DMIC, dois canais de saída PDM e um canal de saída de amplificador Classe D de alta eficiência. No modo de baixa potência, os núcleos DSP são otimizados para aplicações com fator de forma pequeno, como óculos AR de áudio de ouvido aberto. No modo de alto desempenho, o núcleo HiFi 3z é reforçado desde 50 MHz a 200 MHz, e o FastDSP aceita o dobro do número de instruções de 64 a 128. Sua maior capacidade de processamento pode ser usada para descarregar ciclos de um processador host ou para permitir o uso de um processador host de baixo custo sem a necessidade de um DSP ou MCU de áudio externo adicional.
  • A ADI oferece placas de teste para cada um desses codecs. A EVAL-ADAU1797Z (Figura 2) é um projeto de 8 camadas, com um plano-terra e um plano-alimentação nas camadas internas, e pode ser alimentada por uma única fonte de 3,8 V a 5 V. A EVAL-ADAU1860EBZ é um projeto de 4 camadas, também com um plano-terra e um plano-alimentação nas camadas internas, e pode ser alimentada pelo barramento USB ou por uma única fonte de 5 V.

Imagem da placa de teste EVAL-ADAU1797Z da Analog DevicesFigura 2: A placa de teste EVAL-ADAU1797Z fornece acesso completo a todas as entradas/saídas, analógicas e digitais, no ADAU1797. (Fonte da imagem: Analog Devices, Inc.)

Os amplificadores de áudio inteligentes da ADI oferecem realimentação integrada da detecção de corrente e tensão (IV) e algoritmos de gerenciamento de alto-falantes para maximizar o desempenho em fatores de forma que exigem pouco espaço.

  • O MAX98388 é um amplificador de entrada digital mono, classe D, projetado para aplicações de óculos AR/VR e inteligentes. Ele apresenta realimentação IV para recursos de amplificador inteligente e pode aliviar o processamento DSM para o codec de áudio. É otimizado para aplicações de até 5,5 V (célula única) e oferece eficiência de até 90%.
  • O MAX98390, apresentado mais recentemente, é um amplificador de classe D com DSM integrado que pode aumentar o volume (SPL) e a resposta de graves para melhorar a qualidade de áudio dos microalto-falantes e, ao mesmo tempo, maximizar a eficiência. Um conversor boost integrado e o dimensionamento do FET, com o DSM, proporcionam uma operação mais longa da bateria. A tensão máxima de saída do conversor boost é programável de 6,5 V a 10 V em incrementos de 0,125 V a partir de uma tensão de bateria tão baixa quanto 2,65 V. O MAX98390CEVSYS# (Figura 3) inclui o DSM Sound Studio GUI da ADI para simplificar o projeto e a implementação do DSM para aplicações que usam o MAX98390CEWX+T.

Imagem do sistema de avaliação MAX98390CEVSYS# da Analog DevicesFigura 3: O sistema de avaliação MAX98390CEVSYS# inclui o software DSM Sound Studio com uma poderosa GUI para extrair, sintonizar e avaliar o amplificador MAX98390C. (Fonte da imagem: Analog Devices, Inc.)

A potência é um fator crítico de design para óculos de AR. Os alto-falantes com áudio de ouvido aberto exigem mais potência do que o gerenciamento típico de fones de ouvido, e a ADI oferece vários CIs de gerenciamento de energia eficientes que os projetistas podem utilizar em suas aplicações:

  • Os circuitos integrados de gerenciamento de energia (PMICs) da série MAX77654 da ADI oferecem soluções altamente integradas de carregamento de bateria e fornecimento de energia. Com um regulador SIMO (um indutor, várias saídas), ele fornece três trilhas de alimentação programáveis independentemente a partir de um único indutor para minimizar o tamanho da solução. Um carregador Smart Power Selector™ Li+/Li-Poly fornece corrente de carga programável de 7,5 mA a 300 mA e tensão de carga programável de 3,6 V a 4,6 V, com monitoramento da temperatura da bateria para um carregamento seguro. Ele incorpora dois reguladores lineares de baixa queda de tensão (LDOs) de 100 mA para fornecer rejeição da ondulação para áudio e outras aplicações sensíveis a ruídos.
  • Os PMICs MAX77659 apresentam um regulador buck-boost SIMO de entrada dupla que fornece uma trilha de carga e três trilhas de alimentação programáveis independentemente a partir de um único indutor e um LDO para rejeição da ondulação.
  • O MAX77972 da ADI é um chip combinado três em um que inclui detecção de USB-C, um carregador de 3 A e um medidor de nível. Ele é compatível com o reforço reverso USB On-The-Go (OTG) e inclui um Smart Power Selector™ (SPS). O medidor de nível usa o algoritmo ModelGauge™ m5 que compensa automaticamente o envelhecimento da célula, a temperatura e a taxa de descarga e fornece um estado de carga (SOC) preciso em uma ampla gama de condições operacionais. Os pinos de detecção do canal de configuração (CC) do USB Type-C permitem a detecção automática da fonte de alimentação do USB Type-C e a configuração do limite de corrente de entrada.
  • O MAX17301 é um CI de medidor de nível autônomo instalado ao lado do pacote de baterias. Ele oferece proteção, detecção opcional de autodescarga interna da bateria e autenticação SHA-256 opcional para baterias de íon-lítio/polímero de 1 célula. Uma interface I2C Maxim de 1 ou 2 fios fornece acesso a registradores de dados e de controle.
  • O MAX17332 da ADI é uma solução de gerenciamento de bateria de chip único que inclui um carregador linear, um medidor de nível, proteção de bateria e detecção de autodescarga. Ele pode equilibrar a capacidade mista da bateria e fornecer carregamento rápido, com a capacidade de carregar baterias paralelas de forma independente e evitar o carregamento cruzado.

Conclusão

O áudio tem sido uma grande limitação para atingir o potencial das aplicações de AR, que normalmente se concentram na visão. O áudio de ouvido aberto oferece uma oportunidade de realizar esse potencial com óculos de AR mais leves, modernos e confortáveis, capazes de suportar vários casos de uso. A ADI montou uma plataforma de componentes, ferramentas e software para criar soluções completas.

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

About this author

Image of Pete Bartolik

Pete Bartolik

Pete Bartolik is a freelance writer who has researched and written about IT and OT issues and products for more than two decades. He previously was news editor of the IT management publication Computerworld, editor-in-chief of a monthly end-user computer magazine, and a reporter with a daily newspaper.

About this publisher

DigiKey's North American Editors