Videoconferências, podcasts e webinars aumentaram em popularidade durante os anos de pandemia de 2020 e 2021, quando o trabalho remoto se tornou parte do novo normal. Com a pandemia agora no espelho retrovisor, as técnicas de comunicação por vídeo não mostraram sinais de desaceleração.
O que é divertido para mim é que, apesar da onipresença das comunicações por vídeo, como muitas vezes parecemos pouco lisonjeiros na câmera usando webcams de baixa resolução e baixa potência recebem muito pouca atenção. A falta de iluminação, principalmente nas videochamadas de casa, é sem dúvida um grande problema. As webcams com resolução Sub-HD integradas na maioria dos laptops, mesmo os mais sofisticados, não ajudam.
Sem os ativos profissionais disponíveis em um estúdio de televisão profissional, políticos, celebridades e especialistas do setor geralmente parecem horríveis ao serem entrevistados remotamente de suas casas.
Chamadas de videoconferência de rotina em casa são especialmente vulneráveis a uma aparência de “hora amadora”, principalmente durante uma apresentação formal em que o olhar errante (por exemplo, não olhar diretamente para a webcam) pode distrair o espectador.
A localização da webcam é responsável por esse efeito indesejável porque a câmera geralmente é integrada na parte superior do painel do laptop ou em um suporte separado que é difícil de colocar na frente de uma tela de desktop.
Como a videoconferência típica usando um PC de mesa ou laptop não possui a funcionalidade de teleprompter adequada, que é complexa, volumosa e cara, é quase impossível ler as anotações do orador sem evitar o fenômeno irritante de um ângulo horrível da webcam que olha para cima ou para baixo em seu nariz .
Existem maneiras rápidas de corrigir o problema do olhar?
Existem algumas maneiras de atenuar esse problema em uma configuração doméstica típica de desktop ou laptop. No entanto, essas abordagens são estritamente enigmáticas e não eliminam o problema.
Algumas empresas fornecem pequenas webcams externas, geralmente equipadas sem microfone integrado, para reduzir o tamanho do dispositivo e permitir a colocação no centro da tela, na frente de qualquer material de texto ou da própria janela de visualização do aplicativo de vídeo que você está usando.
Essas câmeras usam um fio fino enrolado e preso na parte superior da tela. Dessa forma, você olha diretamente para a webcam e pode ver a maior parte, embora não toda, da apresentação ou material de texto que está apresentando.
Ainda assim, outro método é usar uma peça transparente de plástico acrílico que permite montar praticamente qualquer webcam e prendê-la na parte superior da tela para que a webcam fique suspensa na frente do ponto central da tela.
A vantagem dessa abordagem é que ela libera você para usar sua webcam preferida. A desvantagem é que o tamanho da webcam e do aparato de plástico acrílico muitas vezes obscurece uma boa parte da tela, tornando-a menos útil como alternativa de teleprompter.
No caminho, podemos ver laptops e monitores de PC com webcams integradas atrás do painel LCD, que são invisíveis para o usuário. Embora esta seja uma solução ideal para o problema que descrevi acima, a desvantagem é que o custo desses monitores especiais será muito alto, o que a maioria dos fabricantes relutará em oferecer devido às implicações da elasticidade de preço.
A IA pode corrigir problemas de contato visual de maneira conveniente e econômica.
A ideia de usar inteligência artificial para atenuar ou eliminar o contato visual durante as videoconferências não é nova. Quando feita corretamente, a IA pode eliminar a necessidade de comprar equipamentos caros de teleprompting que os estúdios de televisão usam ou recorrer a alguns dos métodos enigmáticos que descrevi acima.
O desafio de empregar IA para realizar correções de contato visual em tempo real (ao vivo) ou mesmo em um cenário gravado é que requer potência do processador para fazer grande parte do trabalho pesado.
A Apple Silicon tem esse recurso integrado há alguns anos com seus chips para iPhone. Poucos usuários sabem que o aplicativo FaceTime da Apple possui correção de contato visual (que pode ser desativada), o que garante que seu olhar esteja focado no meio da tela, independentemente da orientação do iPhone.
Configuração de contato visual no aplicativo FaceTime da Apple
A Microsoft também se juntou à equipe de IA para corrigir problemas de contato visual. No ano passado, anunciou que adicionaria o recurso de solução de contato visual ao Windows 11, aproveitando o poder das soluções Arm da Qualcomm e aproveitando o silício da unidade de processamento neural (NPU) para aprimorar o vídeo e o áudio em reuniões – incluindo enquadramento de assunto, supressão de ruído de fundo e desfoque de fundo.
Muitos desses recursos já estão disponíveis no dispositivo Surface Pro X da Microsoft, que usa um chip Arm. Ainda assim, a Microsoft implantará amplamente essa funcionalidade em modelos mais compatíveis dos principais fabricantes de PCs este ano.
Nvidia Broadcast com contato visual
Aplicativo de transmissão da Nvidia, que funciona em uma ampla variedade de placas gráficas externas da Nvidia, é uma ferramenta robusta de IA que melhora as chamadas de vídeo e as comunicações em PCs baseados em x86. Na semana passada, a Nvidia aprimorou o utilitário na versão 1.4 para oferecer suporte à implementação do Eye Contact, fazendo parecer que o assunto no vídeo está olhando diretamente para a câmera.
O novo efeito Eye Contact ajusta os olhos do orador para reproduzir o contato visual com a câmera. Essa capacidade é obtida usando a potência da IA nas GPUs da Nvidia para estimar e alinhar o olhar com precisão.
O novo efeito Eye Contact no Nvidia Broadcast 1.4 move os olhos do locutor para simular o contato visual com a câmera. | Crédito da imagem: Nvidia
A vantagem da abordagem da Nvidia é que a capacidade não se limita a uma única plataforma ou aplicativo de videoconferência. A Apple oferece suporte apenas ao recurso de correção de contato visual usando o aplicativo FaceTime do iPhone. No entanto, não ficaria surpreso se a Apple estendesse esse recurso para usuários do macOS ainda este ano em conjunto com o recurso de câmera de continuidade.
Além disso, a Nvidia Broadcast fornece funcionalidade Vignette comparável à experiência de muitos usuários de aplicativos do Instagram. Dessa forma, a Nvidia Broadcast pode gerar um desfoque de fundo discreto para obter um visual nebuloso simulado por IA em sua webcam, melhorando imediatamente a qualidade visual.
Substituir imagens de fundo em chamadas de videoconferência não é nenhuma novidade. Ainda assim, a abordagem da Nvidia presumivelmente oferecerá melhor qualidade, pois aproveita o poder de suas placas gráficas, que são otimizadas para criação de conteúdo de vídeo e jogos.
Considerações finais
O recurso de contato visual no aplicativo Broadcast da Nvidia está atualmente em forma beta e ainda não é adequado para implantação. Como qualquer recurso beta, ele sofrerá falhas inevitáveis e devemos adiar o julgamento formal de sua qualidade até que a versão de produção seja disponibilizada.
Além disso, o Nvidia Broadcast não é apenas um aplicativo comum, mas um SDK aberto com recursos que podem ser integrados a aplicativos de terceiros. Isso abre um novo potencial interessante para aplicativos de terceiros aproveitarem diretamente a funcionalidade do Nvidia Broadcast.
Apesar disso, estou impressionado com algumas das reações adversas que surgiram nos últimos anos em torno da perspectiva de usar IA para corrigir o contato visual. Alguns analistas de tecnologia usaram frases como “fator assustador” para categorizar esse recurso da maneira menos atraente possível.
De fato, a capacidade inspirará muitas piadas, talvez merecidas, se o efeito posterior parecer antinatural e artificial. No entanto, a designação assustadora parece exagerada e hipócrita. Pode-se fazer a mesma insinuação sobre o uso de maquiagem ou a implantação de ferramentas aprimoradas que corrigem deficiências de áudio durante uma chamada de vídeo. Aplicativos como TikTok ou Instagram não existiriam sem filtros, que criam imagens muito mais assustadoras, na minha opinião.
Goste ou não, a videoconferência sobreviveu como um dos resultados positivos do mundo pós-pandemia. A utilização de tecnologia que facilita chamadas de vídeo mais produtivas, atraentes e impactantes é algo que devemos receber, não desprezar.
Como alguém que produz um podcast de vídeo semanal e reconhece o potencial de eliminar ou mesmo reduzir o olhar, o que poderia, por sua vez, introduzir vantagens semelhantes ao teleprompter, estou ansioso para testar esse recurso tão necessário nas próximas semanas.
