Este alto-falante inteligente LIDAR imagina Alexa com olhos

Este alto-falante inteligente LIDAR imagina Alexa com olhos

No momento, o LIDAR pode ser mais conhecido por ajudar a fornecer carros autônomos (e enfurecer Elon Musk), mas a mesma tecnologia pode melhorar a maneira como interagimos com alto-falantes inteligentes, sugerem uma equipe de pesquisadores apoiados pela Intel. O SurfaceSight especula sobre o potencial de dispositivos IoT mais úteis quando eles entendem o que os rodeia, incluindo o reconhecimento de objetos e mãos.

O objetivo era fornecer aos falantes inteligentes existentes e aos aplicativos que eles executam alguma percepção situacional. Ao empilhar um Amazon Echo ou Google Home Mini em cima de um sensor LIDAR compacto, os pesquisadores Gierad Laput e Chris Harrison, da Universidade Carnegie Mellon, demonstraram como os dispositivos podem fazer inferências baseadas na forma e no movimento sobre o que está próximo. Eles apresentarão suas descobertas no ACM CHI 2019 hoje.

O LIDAR usa lasers para encontrar alcance, desviar efetivamente a luz não visível dos objetos e, em seguida, criar um mapa de nuvens de pontos com base no tempo que leva para que a luz seja refletida de volta. Embora seja comumente associado a projetos de carros autônomos, onde a capacidade de criar um plano em tempo real da área circundante é útil para evitar tráfego ou pedestres, também é comumente usado em robótica, com UAVs e outras aplicações.

Importante, também está se movendo para o reino da acessibilidade relativa. Embora o LIDAR de alto alcance e alta precisão para aplicações automotivas ainda seja relativamente caro – algo que os fabricantes desejam mudar com os novos processos de produção – sensores menores e mais acessíveis estão disponíveis. O SurfaceSight, por exemplo, conta com uma unidade abaixo de US $ 100, e os pesquisadores especulam que a disponibilidade mais ampla do LIDAR de estado sólido reduzirá ainda mais isso.

Para o SurfaceSight, os aplicativos são variados. Uma possibilidade é usar dedos e mãos para fazer gestos; como alternativa, um alto-falante inteligente pode rastrear quando um smartphone é colocado sobre a mesa próxima e, em seguida, reconhecer automaticamente isso como o usuário que pretende transmitir música.

Como o SurfaceSight também pode estimar o caminho que uma pessoa está enfrentando, pode priorizar o reconhecimento de comandos quando o usuário estiver apontado ativamente na direção do alto-falante. É sugerido que isso pode ajudar em situações em que os comandos de voz não podem ser ouvidos sobre o áudio de fundo. As áreas de contorno definidas, somente dentro das quais os gestos são reconhecidos, também são suportadas e podem ser estabelecidas por gestos com as mãos.

O plano de reconhecimento também não precisa ser horizontal. Em outra demonstração, o SurfaceSight conseguiu rastrear o movimento contra uma parede, com um LIDAR integrado a um termostato inteligente. Isso poderia reconhecer toques, furtos e movimentos circulares contra a parede, transformando efetivamente a superfície em um bloco de controle estendido. Pense na linha do Google Soli, mas em uma escala maior.

O fato de o SurfaceSight realmente se tornar interessante é como ele usa o LIDAR para reconhecer objetos. A equipe treinou o sensor em diferentes objetos de cozinha, como balanças e copos de medição, além de itens de oficina, como ferramentas. Uma receita de várias etapas pode usar o LIDAR para rastrear qual parte está sendo concluída, avançando automaticamente. Como alternativa, o movimento pode ser associado a pedidos falados para dar mais contexto, como sacudir um copo medidor e ao mesmo tempo perguntar “quantas onças nele?”

O LIDAR tem suas desvantagens, é claro. Para começar, há a questão da oclusão: o sensor depende da linha de visão. Objetos diferentes que têm o mesmo perfil também podem confundir o SurfaceSight. Os pesquisadores sugerem que alguma combinação de câmera ou mesmo códigos de barras refletivos possa ser usada para diferenciar entre eles, com o alto-falante inteligente também avisando os usuários para organizar a área ao seu redor se quiserem que o sistema funcione efetivamente.

É importante ressaltar que, embora o LIDAR possa ser altamente preciso, ele também possui vantagens de privacidade que, por exemplo, os sistemas de visão computacional baseados em câmera não têm. Um sensor LIDAR não pode diferenciar pessoas diferentes ou pode ser usado para capturar fotos em casa, por exemplo.

É justo dizer que os alto-falantes inteligentes estão no nível das commodities agora, com a Amazon e o Google competindo entre si pelo preço mais acessível. Embora ambas as empresas tenham apostado na voz como o principal método de interação preferido, elas o fazem às custas de outras modalidades. Assar no LIDAR pode não ser a única maneira de resolver isso, mas não há como negar que um dispositivo no estilo de hub doméstico poderia ser muito mais útil se soubesse o que você estava fazendo, não apenas o que estava dizendo.

0 Shares