A palestra do executivo foi gravada em sua casa, na Califórnia (EUA), e dividida em nove partes, todas disponíveis no canal oficial da NVIDIA no YouTube. A princípio, a apresentação do executivo estava agendada para final de março, integrando as atrações da NVIDIA GTC 2020, mas precisou ser adiada por conta das medidas de segurança da pandemia de COVID-19. O anúncio da nova arquitetura e dos novos produtos e sistemas marca a mudança de visão da empresa para a próxima geração da computação. Como o próprio executivo destacou em sua apresentação, para a NVIDIA o futuro está numa nova classe poderosa e flexível de data centers. Ele também anunciou a compra da empresa Mellanox, líder mundial em redes de alta performance. Em sua apresentação, Huang destacou inovações da NVIDIA em computação de alto desempenho, ciências de dados, máquinas autônomas e assistência médica. Tudo isso, a princípio, será usado para desenvolvimento científico.
NVIDIA GTC 2020: Combate à COVID-19
O primeiro ponto que Huang explorou em sua apresentação foi como as tecnologias (principalmente de inteligência artificial) da NVIDIA tem ajudado no combate à pandemia do novo coronavírus. O executivo explicou que pesquisadores e cientistas estão usando as GPUs e IAs para tratar, mitigar, conter e monitorar a pandemia. Ele citou os seguintes exemplos:
A Oxford Nanopore Technologies sequenciou o genoma do novo coronavírus em apenas sete horas;Plotly está monitorando a taxa de infecção em tempo real;O Laboratório Nacional Oak Ridge e o Instituto de Pesquisa Scripps selecionaram um bilhão de combinações possíveis para medicamentos em um dia;Structura Biotechnology, a Universidade do Texas em Austin e o Instituto Nacional de Saúde reconstruíram a estrutura, em 3D, da proteína do novo coronavírus;O Laboratório Nacional de Argonne, do Departamento de Energia dos EUA, está usando o sistema DGX A100 para estudar a COVID-19 de maneira mais profunda e detalhada.
O desenvolvimento científico no Brasil também pode aproveitar as novas tecnologias da NVIDIA. “As pesquisas brasileiras poderão se beneficiar muito desse sistema para otimizar o tempo dos cientistas e pesquisadores em busca de uma vacina para a COVID-19 ou até outras doenças, como Dengue e Zika”, explicou Mario Aguiar, gerente sênior da NVIDIA Enterprise para América Latina. Huang exibiu um vídeo, produzido pela empresa, que ilustra diversos exemplos de como IAs estão melhorando nossa qualidade de vida e auxiliando o progresso da ciência. Quem narrou o vídeo foi a AIVA, uma inteligência artificial desenvolvida pela NVIDIA. Essa IA também compôs a trilha sonora do clipe, que foi reproduzida pela Orquestra Sinfônica de Londres. Confira abaixo: Agora vamos mergulhar nas novas tecnologias anunciadas pelo CEO na NVIDIA GTC 2020.
Arquitetura Ampere: GPU A100
A NVIDIA A100 é a primeira GPU cuja base é a arquitetura Ampere. Essa nova arquitetura é otimizada para a próxima geração da computação, unindo treinamento, inferência e análise de dados em uma plataforma de IA. De acordo com o CEO, a performance da GPU A100 chega a ser 20 vezes melhor em comparação às outras oito gerações de GPUs da empresa. Também suporta análise de dados, computação científica e gráficos em nuvem. O executivo apontou cinco características principais da nova GPU:
Mais de 54 bilhões de transistores (é a maior capacidade de um processador de sete nanômetros do mundo);3ª geração de Tensor Cores (processadores dedicados a IA) com TF32, mais flexível e fácil de usar, que acelera a precisão da IA;Aceleração estrutural, por meio de uma nova técnica que aumenta a performance da IA;GPU Multi-Instância (MIG, na sigla em inglês), que permite que uma A100 seja dividido em até sete GPUs independentes, cada uma com seus recursos;3ª geração da tecnologia NVLink, dobrando a conectividade em alta velocidade entre GPUs (isso permite que servidores A100 funcionem como uma GPU gigante).
Para o executivo, a nova GPU da NVIDIA vai possibilitar o aprimoramento de três pontos que, atualmente, considera críticos: gerenciamento de big data, criação de sistemas de recomendação e desenvolvimento de IAs que conversam e interagem em tempo real.
NVIDIA DGX A100: sistema de IA mais avançado do mundo
O DGX A100 é a terceira geração do sistema DGX, de inteligência artificial, da NVIDIA. Como o nome já entrega, o sistema é baseado na GPU A100. Esse é o primeiro servidor do mundo com cinco petaflops de desempenho de IA. E cada DGX A100 pode ser configurado de uma a 56 GPUs independentes para oferecer infraestrutura de data center flexível e definido por software. Esse novo sistema consolida pela primeira vez o poder e os recursos de um data center inteiro em uma plataforma. A vantagem, conforme explicou o executivo, é a seguinte: um data center funcionando com um rack de cinco sistemas DGX A100, consumindo 28 kilowatts de energia e custando US$ 1 milhão, tem a mesma capacidade de um data center com 50 sistemas DGX-1 e 600 CPUs, consumindo 630 kilowatts e custando mais de US$ 11 milhões. Ou seja, o desempenho maximizado permite que as empresas obtenham um retorno mais rápido sobre seus investimentos em infraestrutura de IA. Outra característica do sistema DGX A100 é integrar oito das novas GPUs de Tensor Cores A100, que fornece 320 GB de memória para treinar conjuntos maiores de dados de IA, e interconexões NVIDIA Mellanox HDR 200Gbps de alta velocidade. Além disso, várias cargas de trabalho podem ser aceleradas ao particionar a DGX A100 usando o recurso de GPU Multi-Instância. Isso permite que as empresas otimizem potência e recursos de computação para acelerar cargas de trabalho, incluindo análise de dados, treinamento e inferência. Tudo isso em uma plataforma única. O CEO também anunciou a próxima geração do DGX SuperPOD, com números ainda mais impressionantes. O cluster funciona com 140 sistemas DGX A100 e interconexões da Mellanox, alcançando 700 petaflops de potência de computação de IA. Usando essa tecnologia, a NVIDIA desenvolveu seu próprio supercomputador de última geração para pesquisas internas em áreas como IA de conversação, genômica e condução autônoma. Com capacidade de 4,6 exaflops de performance, o supercomputador de IA da NVIDIA é um dos mais rápidos do mundo. O nível de desempenho alcançado pelo supercomputador, até então, exigia milhares de servidores e meses (ou até anos) de planejamento e aquisição de componentes especializados. A arquitetura Ampere e o desempenho do sistema DGX A100 permitiram que a NVIDIA construísse o supercomputador em apenas um mês. Para ajudar os clientes a criarem seus próprios data centers com tecnologia A100, a NVIDIA lançou uma arquitetura de referência DGX SuperPOD. Essa arquitetura oferece aos clientes um esquema que segue os mesmos princípios de design e as práticas recomendadas que a NVIDIA usou para construir seu cluster de supercomputação de IA baseado na DGX A100. Os sistemas NVIDIA DGX A100 estão disponíveis para encomenda no ecossistema de revendedores da NVIDIA (preço sob consulta). Os fornecedores de tecnologia DDN Storage, Dell Technologies, IBM, NetApp, Pure Storage e Vast planejam integrar a DGX A100 às suas ofertas com base nas arquiteturas de referência de DGX POD e DGX SuperPOD da NVIDIA.
Merlin: nova aplicação da NVIDIA para sistemas de recomendação
Assim como o universo, a internet está em constante expansão. A experiência do usuário nela está cada vez mais personalizada, graças aos sistemas de recomendação que funcionam por meio de IAs e machine learning. E as GPUs da NVIDIA têm um longo histórico de uso para aprimorar a capacidade de aprendizado de redes neurais de IA. Depois de avaliar esse contexto e essa demanda, a NVIDIA lançou o Merlin, uma aplicação de GPU que promete explorar a nova geração de sistemas de recomendação. O Merlin também tem o objetivo de tornar o desenvolvimento de sistemas de recomendação mais acessível para as empresas. A plataforma aproveita as capacidades da arquitetura Ampere da GPU A100, o que possibilita que as empresas desenvolvam seus sistemas de recomendação de maneira mais rápida e econômica. Mas o que são sistemas de recomendação, afinal? Há não muito tempo, você precisava querer comprar ou assinar algo para, então, achar anúncios e ofertas na internet. Hoje em dia, esses anúncios pulam na sua frente conforme você navega em sites e aplicativos, seja no smartphone ou no computador. Esses anúncios chegam até você por meio dos sistemas de recomendação, cuja IA avalia seu histórico de pesquisa e navegação para encaminhar ofertas personalizadas para o que você (talvez) queira. Aquelas sugestões do que assistir ou ouvir a seguir em plataformas de streaming também funcionam com base em sistemas de recomendação. Esses sistemas estão em alta por conta da explosão de opções de todo tipo de produtos e serviços que existem na internet. É humanamente impossível explorar todas as opções, então os sistemas de recomendação tentam te ajudar a filtrar esse universo de escolhas possíveis. A corrida que acontece no momento é desenvolver sistemas de recomendação cada vez mais certeiros, que dê sugestões mais personalizadas e coerentes que sejam capazes de atender (ou despertar) os desejos do usuário.
Jarvis: uma plataforma para criar IAs de conversação
A alta do home office, da telemedicina e do aprendizado remoto aumentou, também, a demanda por serviços de IA mais customizados ainda, a nível conversacional. Esses serviços vão desde suporte em tempo real para clientes até transcrição e resumo de reuniões e chamadas de vídeo para garantir que as pessoas continuem produtivas e conectadas. O Jarvis é uma aplicação de GPU que permite que as empresas utilizem dados de vídeo e voz para desenvolver serviços customizados de IA a nível conversacional. Isso garante um serviço ainda mais personalizado para os clientes. Entre as empresas que já estão usando a plataforma, estão:
Voca, com uma IA que dá suporte para clientes num call center;Kensho, com uma IA que transcreve falas automaticamente para finanças e negócios;Square, com uma IA que funciona como assistente virtual para clientes agendarem horários.
As aplicações desenvolvidas na plataforma Jarvis irão aproveitar as inovações da nova GPU A100 Tensor Core para computação IA e as otimizações mais recentes da NVIDIA TensorRT para inferência. Além disso, a plataforma oferece recursos para que os desenvolvedores criem aplicações IA capazes de entender terminologias únicas e específicas de cada empresa. Para se desenvolver uma aplicação IA que ofereça interação a nível conversacional, a empresa precisa “treiná-la” para compreender termos e dados relacionados aos produtos que oferece e as necessidades dos seus clientes. Só que isso exige uma expertise profunda em IA, grandes quantidades de dados e recursos computacionais, além de pelo menos um software para atualizar as bases de dados. A vantagem do Jarvis é que a plataforma oferece recursos para atender essas demandas, com modelos atualizados de deep learning para a compreensão de linguagem coloquial (como o NVIDIA Megatron BERT). A NVIDIA disponibilizou um programa para acessar a plataforma para um número limitado de usuários. Os desenvolvedores interessados em avaliar a plataforma podem se cadastrar no site da NVIDIA.
Plataforma Drive na nova arquitetura Ampere
Um dos maiores desafios da computação atualmente, segundo Huang, são os carros autônomos. E a NVIDIA continua aprimorando o Drive, uma linha de sistemas específica para esse nicho. Agora com a nova arquitetura Ampere da GPU A100, a NVIDIA pôde expandir as capacidades de direção da plataforma Drive AGX, que oferece um sistema ADAS de 5-watt para o parabrisa, um sistema L2+ de 45-watt de piloto automático e um sistema L5 de 800-watt de robotaxi. Tudo compatível com a arquitetura Ampere e funcionamento a partir do mesmo software. A plataforma vai usar o novo sistema-no-processador (SoC, na sigla em inglês) Orin, que, incorporado na nova arquitetura, vai melhorar a eficiência energética. No caso da plataforma Drive AGX Pegasus de robotaxi, o dispositivo consegue processar até duas mil TOPS (trilhões de operações por segundo). Isso é seis vezes mais do que a plataforma anterior consegue processar. Graças a essa expansão na nova arquitetura Ampere, a NVIDIA agora oferece às fabricantes uma plataforma única e um software que, juntos, possibilitam que uma IA seja desenvolvida e implementada em qualquer veículo. O ecossistema NVIDIA Drive agora engloba carros, caminhões, fornecedores automotivos de primeira linha, próxima geração de serviços de mobilidade, startups, serviços de mapeamento e simulação. E o CEO também anunciou que a plataforma vai acrescentar ao “pacote” o NVIDIA Drive RC, capaz de gerenciar frotas inteiras de veículos autônomos. A previsão é que os sistemas SoCs Orin estejam disponíveis para as fabricantes no final de 2022. A empresa acredita que isso pavimente o caminho para a próxima geração da linha programável e definida por software NVIDIA Drive AGX. Fonte: NVIDIA