Pesquisas sobre modelos de IA para imagens, vídeos e 3D serão destaque no principal evento do setor
A Apple confirmou presença na CVPR 2025 (Conference on Computer Vision and Pattern Recognition), um dos mais importantes eventos da área de visão computacional, que acontecerá entre os dias 11 e 15 de junho em Nashville, Tennessee (EUA). A gigante da tecnologia vai patrocinar o evento, apresentar três artigos científicos inéditos e promover demonstrações ao vivo de suas soluções com inteligência artificial.
Três pesquisas de ponta em IA com foco em imagens e 3D
Durante o evento, a Apple irá expor três projetos de destaque desenvolvidos por suas equipes de pesquisa. São eles:
- FastVLM (Fast Vision Language Model): um modelo de codificação visual eficiente, capaz de acelerar significativamente a compreensão de imagens em alta resolução em tempo real, utilizando menos tokens visuais.
- Matrix3D: um modelo unificado para fotogrametria 3D, que simplifica a criação de conteúdos tridimensionais mesmo com conjuntos de dados incompletos.
- World-Consistent Video Diffusion: um modelo de difusão de vídeo com modelagem 3D explícita, que melhora a consistência tridimensional e permite previsões mais precisas da estrutura 3D, mesmo quando a posição da câmera é desconhecida.
Esses estudos reforçam a atuação da Apple em áreas estratégicas como modelos generativos, realidade aumentada e machine learning voltado à visão computacional, tecnologias fundamentais para o futuro do Apple Intelligence e outros recursos baseados em IA.
Demonstração ao vivo do FastVLM
Além das apresentações acadêmicas, a Apple realizará demonstrações técnicas do FastVLM, um modelo promissor voltado à integração de visão e linguagem. As demos ocorrerão nos seguintes horários:
- Sexta-feira, 13 de junho: das 10h às 12h30 e das 14h30 às 16h30
- Sábado, 14 de junho: das 10h às 12h30 e das 14h30 às 16h30
- Domingo, 15 de junho: das 10h às 12h30
Apple aposta em parcerias com a comunidade acadêmica
Outro destaque é o envolvimento da empresa com o meio científico: mais de 20 pesquisadores afiliados à Apple atuam como revisores do evento, o que evidencia o compromisso da marca com a inovação em inteligência artificial de forma colaborativa.
Essa aproximação com a academia fortalece a posição da Apple em um momento em que o mercado de modelos de linguagem multimodal, reconhecimento de imagem e renderização 3D ganha cada vez mais relevância – inclusive no Brasil, onde o uso de soluções baseadas em IA vem crescendo em áreas como saúde, varejo, educação e indústria.