Como aumentar o uso de IA quando não há dados de treinamento o suficiente?

Aprendizado “zero-shot learning” redireciona conhecimento por meio de abordagens estatísticas, sem a necessidade de grandes quantidades de novos dados

Inteligência Artificial (IA) é o campo de sonhos mais perfeito da cultura moderna. Se você perguntar à pessoa comum na rua onde a IA é executada, ela provavelmente não mencionará no que se convenciona como dados de treinamento ou, no inglês, training data. Em vez disso, podem murmurar algo sobre programas de computador que aprendem magicamente como fazer coisas úteis do nada. No entanto, algumas das inteligências artificiais mais sofisticadas de hoje se aproximam desse sonho ingênuo. Refiro-me a uma abordagem ainda em desenvolvimento, conhecida como “zero-shot learning” (aprendizado do zero).

Essa metodologia – que está sendo explorada na Microsoft, Uber, Baidu, Alibaba e outras empresas orientadas por IA – permite o reconhecimento de padrões com pouco ou nenhum dado de treinamento. O aprendizado de padrões zero-shot learning permitirá que os robôs inteligentes reconheçam e respondam dinamicamente a objetos, comportamentos e padrões ambientais desconhecidos que eles talvez nunca tenham encontrado no treinamento.

Prevejo que essas abordagens serão cada vez mais combinadas com o aprendizado por reforço, a fim de permitir que os robôs executem as melhores ações interativamente em ambientes caóticos e pontuais. Além disso, os aplicativos de jogos usarão abordagens zero-shot learning, como jogo interativo, como uma alternativa ao treinamento em dados volumosos derivados de uma jogabilidade bem-sucedida. Isso permitirá que o treinamento dos agentes domine estratégias complexas de ganho, apesar de não saber nada sobre esses jogos inicialmente.

Além disso, o zero-shot learning promete tornar os aplicativos de reconhecimento de objetos mais versáteis, devido à sua capacidade de conduzir:

  • Reconhecimento imediato de objetos raros, desconhecidos e invisíveis que podem estar substancialmente ausentes nos dados de treinamento;
  • Reconhecimento de padrões para os quais é difícil obter dados de treinamento rotulados com um nível suficientemente alto de conhecimento especializado;
  • Detecção de instâncias de classes de objetos em que a proliferação de categorias refinadas tornou difícil ou absurdamente caro para se adquirir quantidades suficientes de dados de treinamento rotulados estatisticamente diversos.

O que torna possível o zero-shot learning é a existência de conhecimento prévio que pode ser descoberto e reaproveitado por meio de abordagens estatísticas ou semânticas. Os métodos de zero-shot usam esse conhecimento para prever o maior espaço semântico de recursos que abrange as instâncias vistas (aquelas nos dados de treinamento) e as instâncias invisíveis (aquelas ausentes nos dados de treinamento).

Em relação à descoberta automatizada de conhecimento, algumas das abordagens técnicas mais promissoras para o zero-shot learning incluem:

  • Construção de modelos de classificação a partir de conhecimentos estatísticos adquiridos em projetos de aprendizado supervisionado anteriores que estão em domínios distintos, mas semanticamente adjacentes de reconhecimento de objetos (identificando uma classe nunca vista com base em características extraídas de uma espécie relacionada).
  • Extrair o conhecimento semântico dos objetos-alvo a partir de descrições textuais das classes-alvo (artigos da Web rastreados que descrevem os recursos visuais das espécies a serem reconhecidas).
  • O uso de vetores de palavras e outras abordagens gráficas para refinar inferências dos recursos semânticos das classes de destino daquelas das classes de origem, dada a disponibilidade de descrições textuais das classes de destino.

O aprendizado de zero-shot learning não pode realizar seu potencial como um acelerador de pipeline de IA, a menos que os cientistas de dados adquiram ferramentas que fornecem acesso simplificado a essas técnicas. Isso, por sua vez, exige kits de ferramentas de aprendizado profundo que suportam o design visual fácil de novos modelos a partir de blocos funcionais preexistentes sob um paradigma maior conhecido como “transfer learning” (aprendizado de transferência). Isso depende de bancadas de trabalho que fornecem aos cientistas de dados representações de recursos reutilizáveis, camadas de nós neurais, pesos, métodos de treinamento, taxas de aprendizado e outros recursos relevantes de modelos anteriores que podem ser rapidamente incorporados em projetos de IA de zero-shot.

À medida que as técnicas do zero-shot ganham aceitação e o conjunto de conhecimentos anteriores aumenta, os desenvolvedores de IA de alta qualidade ficam menos dependentes dos dados de treinamento.

Durante os próximos anos, veremos os cientistas de dados construindo aplicativos mais inteligentes de robótica, jogos e reconhecimento de padrões, configurando conhecimentos estatísticos e semânticos preexistentes, sem precisar adquirir, preparar e rotular grandes quantidades de novos dados de treinamento.

Quando esse dia chegar, mais aplicativos baseados em IA poderão automatizar o bootstrapping de sua inteligência, de um estado de pura ignorância para um profundo conhecimento por meio de técnicas ad-hoc, zero-shot e ocasionalmente adaptáveis. Isso marcará o verdadeiro começo da inteligência geral artificial, um sonho que motivou a comunidade de IA desde os dias de Alan Turing até o presente.

FONTE: CIO