OpenAI introduz API Realtime, Cache de Prompts e muito mais no DevDay

Durante o DevDay, evento anual da OpenAI realizado em 2 de outubro de 2024, a empresa revelou várias novas ferramentas e recursos que prometem transformar o desenvolvimento com inteligência artificial. Entre as principais novidades estão a API Realtime, o cache de prompts, o tuning de modelos para visão computacional e a distilação de modelos, cada uma com o potencial de revolucionar como os desenvolvedores criam e otimizam aplicações de IA.
API Realtime e Suporte Multimodal
A API realtime, agora em fase beta pública, foi um dos maiores destaques do evento. Essa API foi desenvolvida para criar experiências de baixa latência, o que é especialmente útil para aplicativos multimodais. A OpenAI compartilhou exemplos práticos de como algumas empresas já estão utilizando essa API. O app de coaching de saúde Healthify usou a API para tornar suas interações com o treinador virtual mais naturais e responsivas. Já o Speak, um aplicativo de aprendizado de idiomas, aproveitou a API em Tempo Real para proporcionar conversas mais fluidas em diversos idiomas.
Essa nova API também suporta áudio como entrada e saída, incluindo as seis vozes avançadas disponíveis no ChatGPT. Com isso, desenvolvedores podem criar experiências de conversação natural utilizando uma única chamada de API, eliminando a necessidade de combinar vários modelos para alcançar resultados semelhantes.
Cache de Prompts: Economizando e Acelerando Processos
Outra funcionalidade lançada foi o cache de prompts, que visa melhorar a eficiência e reduzir os custos no uso de modelos de IA. Com essa tecnologia, os tokens de entrada mais recentes são armazenados, permitindo sua reutilização a um custo reduzido de 50% em relação aos tokens não armazenados. Essa solução está integrada nos modelos mais recentes da OpenAI, como o GPT-4o, GPT-4o mini, o1-preview e o1-mini, além de versões ajustadas desses modelos.
Essa abordagem de caching acelera significativamente o tempo de resposta e pode reduzir os custos para desenvolvedores que trabalham com grandes volumes de dados ou interações frequentes.
Tuning de Modelos para Visão Computacional
A OpenAI também anunciou avanços na área de visão computacional, incluindo o tuning de modelos para compreensão de imagens no GPT-4o. Essa funcionalidade permite que desenvolvedores ajustem o modelo para cenários específicos que envolvem processamento avançado de imagens. Isso pode incluir buscas visuais avançadas, melhoria na detecção de objetos para veículos autônomos e até mesmo análises médicas mais precisas.
Para incentivar o uso dessa nova funcionalidade, a OpenAI está oferecendo, até o fim do mês, 1 milhão de tokens de treinamento gratuitos por dia para quem fizer o ajuste fino do GPT-4o com imagens.
Distilação de Modelos: Otimizando com Eficiência
Outra novidade é a distilação de modelos, que oferece uma forma de transferir o conhecimento de modelos maiores e mais robustos para modelos menores e mais eficientes. Esse recurso pode ser útil em cenários onde é necessário otimizar custos e recursos, permitindo que modelos menores mantenham parte da precisão dos maiores. Os desenvolvedores podem usar a saída de modelos como o GPT-4o e o o1-preview para ajustar versões menores, como o GPT-4o mini.
O conjunto de ferramentas para distilação inclui a captura e armazenamento de pares de entrada-saída gerados por um modelo, a criação e execução de avaliações, além de integração com as capacidades de ajuste fino da OpenAI. Para promover o uso dessa tecnologia, a OpenAI está oferecendo 2 milhões de tokens de treinamento gratuitos por dia para o GPT-4o mini e 1 milhão para o GPT-4o até o final do mês.
Novas Oportunidades com a Expansão da OpenAI
Além das inovações tecnológicas, a OpenAI também anunciou uma nova rodada de financiamento que levantou US$ 6,6 bilhões, elevando a avaliação da empresa para US$ 157 bilhões. Com esse novo capital, a empresa planeja expandir suas capacidades de computação e dobrar os investimentos em pesquisas de IA de ponta, além de continuar desenvolvendo ferramentas que ajudem as pessoas a resolver problemas complexos.
A OpenAI destacou que esse financiamento permitirá que a empresa continue a liderar o desenvolvimento de uma IA acessível e segura, beneficiando a sociedade como um todo. A empresa também está colaborando com governos e parceiros estratégicos para maximizar o potencial dessas tecnologias em um futuro próximo.