Da criação de vídeos que parecem reais a solução de problemas complexos, a inteligência artificial generativa protagonizou os principais lançamentos das empresas de tecnologia neste ano.
Segundo Arthur Igreja, especialista em tecnologia e inovação, antes as big techs tinham divisões mais claras de negócios. Agora, porém, todas estão no mesmo campo de IA. “Para mim, o destaque de 2024 é que todas as big techs viraram empresas de IA generativa. Antes nós tínhamos territórios muito demarcados. A Meta, com redes sociais. Alphabet, com Android e buscadores. A Microsoft, com produtividade e nuvem. E, agora, está todo mundo na mesma arena de Gen AI”, diz.
Para o especialista, apesar de algumas tecnologias anunciadas neste ano já estarem no radar em 2023, a evolução foi grande. “Os saltos estão sendo tão grandes e tão relevantes que, se nós formos falar só o que aconteceu em 2024, é quase uma era da computação. Ao mesmo tempo que é uma continuação de um pipeline de coisas que nós já sabíamos em 2023 que seriam feitas, o salto é colossal, gigante.”
Ele cita como exemplo o Sora, ferramenta de geração de vídeo da OpenAI, que já era anunciado, mas que avançou muito neste ano, assim como o assistente do Google, o Gemini.
“Se você parar para pensar que em 2022 nós só tínhamos imagens estáticas, em 2023 começam vídeos, mas de uma forma muito precária, e nós terminamos 2024 com o Sora gerando vídeos num patamar hollywoodiano, dá para ter uma ideia do tamanho da evolução”.
Confira a seguir algumas tecnologias que marcaram 2024
Sora, da OpenAI
A OpenAI, desenvolvedora do ChatGPT, lançou oficialmente neste mês de dezembro o Sora, sua ferramenta de geração de vídeos por inteligência artificial. O modelo é capaz de gerar imagens em movimento a partir de descrições textuais, permitindo a criação de vídeos de alta definição com base em cenas solicitadas pelo usuário. Para utilizar o Sora, é necessário ser assinante dos planos ChatGPT Plus ou Pro.
“o1” ou “Strawberry”, da OpenAI
Em setembro, a OpenAI anunciou o lançamento do “o1” ou “Strawberry”, um modelo de linguagem avançado projetado para aprimorar habilidades de raciocínio e resolução de problemas complexos. A nova tecnologia consegue “raciocinar” sobre tarefas complexas e solucionar problemas em disciplinas como ciência, programação ou matemática.
Meta AI, da Meta
A Meta, empresa de Mark Zuckerberg, passou a disponibilizar neste ano, no Brasil, a Meta AI, um assistente virtual para auxiliar os usuários em diversas tarefas, como realizar pesquisas, responder perguntas, sugerir ações e até gerar imagens a partir de descrições. A Meta AI está dentro dos aplicativos WhatsApp, Instagram, Facebook e Messenger, representada por um círculo azul e rosa.
Gemini 2.0, do Google
O Google intensificou suas apostas no Gemini, seu assistente de inteligência artificial, capaz de gerar textos, traduzir idiomas e responder perguntas. Neste mês, a big tech apresentou o Gemini 2.0, com tempos de resposta mais rápidos e novos recursos, como capacidade de entender e gerar texto, código, áudio e até mesmo vídeo.
Ele também é capaz de realizar tarefas mais complexas, como resolver problemas matemáticos, escrever códigos de computador e criar planos de ação. Além disso, possui o conceito de agentes de IA, que são sistemas autônomos capazes de realizar tarefas em nome do usuário, como pesquisar na internet e reservar voos.
ChatGPT Search, da OpenAI
A OpenAI anunciou, no final de outubro, o lançamento do ChatGPT Search, uma ferramenta que conecta o ChatGPT à web em tempo real, e que pode começar a competir com o Google. Inicialmente liberado apenas para assinantes, a modalidade agora está disponível para todos os usuários.
O ChatGPT decidirá automaticamente se deve fazer a busca na internet com base no que o usuário perguntar. Também é possível optar por realizar uma busca manualmente clicando no novo ícone de pesquisa na web.
Apple Intelligence, da Apple
A Apple anunciou o lançamento da Apple Intelligence, um assistente pessoal integrado ao iOS, iPadOS e macOS. Entre as funções estão a possibilidade de reescrever textos, criar resumos, transcrever áudios e até editar imagens. No entanto, a chegada da ferramenta ao Brasil, com suporte para o idioma português, está prevista apenas para 2025.
Vision Pro, da Apple
No começo deste ano, a Apple lançou o esperado Vision Pro, um headset de realidade aumentada, com tela infinita, em uma aposta da empresa para a computação espacial. A proposta é que toda a experiência do usuário seja controlada pelos olhos, mãos e voz, sem a necessidade de um segundo dispositivo.
O produto, porém, começou a enfrentar uma demanda mais lenta, em razão do seu preço – US$ 3,5 mil (aproximadamente R$ 21,3 mil, na cotação atual) – e peso. Com isso, a Apple teria suspendido o trabalho em seu próximo Vision Pro de alta qualidade e estaria trabalhando para lançar um headset mais acessível, com menos recursos.
Orion, da Meta
A Meta apresentou neste ano seus novos óculos de realidade aumentada, chamados Orion. A aparência é de óculos comuns, com lentes mais grossas, mas apresenta interfaces gráficas, com imagens em hologramas e janelas virtuais. Além de comandos por voz, o dispositivo de 70 gramas poderá ser controlado pelo usuário por meio de uma interface neural, com uma pulseira que fica conectada ao dispositivo.
Durante sua conferência anual de desenvolvedores, a empresa também anunciou uma linha mais acessível de seus óculos de realidade virtual, o Meta Quest 3s, e novos recursos de IA e funções como tradução em tempo real do Ray-Ban Meta.
Copilot, da Microsoft
Neste ano, a Microsoft adicionou novos recursos em sua ferramenta de inteligência artificial, o Copilot. A empresa acrescentou funcionalidades como o Copilot Voice, que permite interações verbais mais naturais, e o Copilot Vision, uma ferramenta que pode "ver" os sites que o usuário acessa no navegador Edge.
Ferramenta de transcrição no WhatsApp
Quem nunca recebeu um áudio no WhatsApp que poderia ter sido um texto? Ou teve que caçar um lugar silencioso para ouvir uma mensagem? Desde novembro, o aplicativo de mensageria passou a oferecer o recurso de transcrição de áudios.
A empresa afirma que a transcrição é feita no próprio aparelho do usuário, o que garante que as mensagens e o conteúdo em texto permaneçam criptografados. “Isso significa que ninguém mais, nem mesmo o WhatsApp, pode ver, ouvir ou ler suas mensagens", afirmou a plataforma, em nota.
Galaxy Ring, da Samsung
Em janeiro, ao apresentar o novo smartphone Galaxy S24, a Samsung deu uma rápida pista de sua próxima aposta: um "anel inteligente", batizado de Galaxy Ring. A intenção é atrair consumidores preocupados com a saúde, já que o anel é capaz de aferir diversas métricas, como temperatura corporal, batimentos cardíacos, padrões de sono e volume de exercícios. Após sete dias de uso, serão gerados alertas para o usuário a partir de algoritmos e inteligência artificial.
O produto começou a ser vendido no Brasil em outubro, por R$ 3.499.