BITS | Boletim de Inovação, Tecnologia e Segurança | 16/06/2025

BITS: o seu clipping diário, por Fábio Xavier
Inteligência Artificial
Modelo de linguagem de áudio Step-Audio-AQAA permite interação de voz natural
Fonte: MarkTechPost | Índice de Inovação: ★★★★☆
O modelo Step-Audio-AQAA, desenvolvido pela StepFun, é um modelo de linguagem de áudio completo que processa diretamente comandos de voz em respostas de áudio expressivas, sem conversão para texto intermediário. Ao contrário de sistemas modulares que sofrem com atrasos e erros acumulados, o Step-Audio-AQAA usa um tokenizer dual para extrair recursos linguísticos e prosódia semântica, alimentados em um LLM de 130 bilhões de parâmetros (Step-Omni). Um vocoder de casamento de fluxo garante a síntese de fala natural. O modelo obteve resultados superiores em benchmarks, superando modelos como Kimi-Audio e Qwen-Omni em geração de respostas de áudio semanticamente precisas e emocionalmente ricas. Sua arquitetura inovadora elimina gargalos de processamento e melhora a fluidez da interação, abrindo caminho para assistentes de voz, narrativas em áudio e computação mãos-livres mais sofisticadas. A capacidade de gerar respostas de áudio expressivas e contextualmente relevantes representa um avanço significativo na interação humano-computador.
PiPViT: Protótipos Visuais Interpretáveis para Análise de Imagens de Retina
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★☆
O PiPViT é um modelo prototípico interpretável para reconhecimento de imagens, usando um transformador de visão (ViT) para capturar dependências de longo alcance entre patches. Ele aprende protótipos robustos e interpretáveis para aproximar a extensão da lesão usando apenas rótulos de nível de imagem. O modelo se beneficia do aprendizado contrastivo e do processamento de entrada em multi-resolução, permitindo a localização eficaz de biomarcadores em diferentes escalas. Avaliações em quatro conjuntos de dados de imagens de OCT de retina mostraram desempenho quantitativo competitivo em relação a métodos de última geração, fornecendo explicações mais significativas. Os protótipos aprendidos são relevantes do ponto de vista semântico e clínico, auxiliando médicos na compreensão de diagnósticos. O código está disponível no GitHub.
Table-R1: Aprendizado por Reforço para Melhorar a Compreensão de Tabelas por LLMs
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★☆
O artigo apresenta o Table-R1, um novo método de aprendizado por reforço que aprimora a compreensão de tabelas por modelos de linguagem grandes (LLMs). Ele integra evidências regionais nas etapas de raciocínio, usando o RE-SFT para guiar a identificação de regiões relevantes antes da geração de respostas. O TARPO, um sistema de recompensa mista, equilibra a precisão regional e a correção da resposta. Experimentos demonstram uma melhora média de 14,36 pontos em três conjuntos de dados, superando modelos com dez vezes mais parâmetros. O TARPO também reduz em 67,5% o consumo de tokens na resposta, tornando o raciocínio tabular mais eficiente. O método combina raciocínio textual, simbólico e baseado em programas para uma compreensão mais completa de tabelas. A inovação reside na combinação de aprendizado por reforço com foco em regiões específicas da tabela para melhorar a precisão e eficiência do raciocínio.
IA melhora precisão de localização para veículos autônomos em 28%
Fonte: MarkTechPost | Índice de Inovação: ★★★★☆
Pesquisadores da EPFL desenvolveram o FG2, um modelo de IA que reduz em 28% os erros de localização de veículos autônomos em áreas com bloqueio de GPS. O método utiliza imagens aéreas e de nível do solo, combinando pontos específicos para determinar posição e orientação com precisão. Diferente de métodos anteriores, o FG2 imita a forma como humanos se localizam, focando em pontos de referência específicos como faixas de pedestres e edifícios. Sua capacidade de interpretação aumenta a confiança na segurança do sistema. Os resultados superam os métodos anteriores em datasets desafiadores, como VIGOR e KITTI, abrindo caminho para sistemas de navegação mais robustos em ambientes urbanos densos.
Segurança Cibernética
PANDAS: Aprimorando Ataques de Jailbreaking em LLMs com Novas Técnicas
Fonte: ArXiv (Criptografia e Segurança) | Índice de Inovação: ★★★★☆
O artigo apresenta PANDAS, uma técnica híbrida que aprimora ataques de 'jailbreaking' em modelos de linguagem grandes (LLMs). 'Jailbreaking' consiste em burlar os mecanismos de segurança dos LLMs, alimentando-os com longas sequências de entrada fabricadas para induzi-los a gerar respostas maliciosas. PANDAS melhora esses ataques usando afirmações positivas, demonstrações negativas e amostragem adaptativa, otimizando os diálogos falsos para atingir o objetivo. Os pesquisadores introduziram o ManyHarm, um novo conjunto de dados de perguntas e respostas maliciosas. Experimentos mostraram que PANDAS supera métodos anteriores em cenários de longo contexto. A análise de atenção forneceu insights sobre como vulnerabilidades são exploradas e como PANDAS as amplia.
Fatoração de Matriz Raiz Quadrada em Banda para Treinamento Privado de Modelos
Fonte: ArXiv (Criptografia e Segurança) | Índice de Inovação: ★★★★☆
O artigo apresenta o BSR, uma nova abordagem de fatoração de matrizes para treinamento de modelos com privacidade diferencial. Ao contrário dos métodos atuais, que demandam alta capacidade computacional para otimizar a fatoração antes do treinamento, o BSR explora propriedades da raiz quadrada de matrizes para lidar eficientemente com problemas em larga escala. Para o cenário de descida de gradiente estocástico com momentum e decaimento de peso, o BSR possui expressões analíticas que tornam a sobrecarga computacional insignificante. O artigo demonstra que modelos treinados com BSR têm desempenho comparável aos melhores métodos existentes, sem a alta demanda computacional. Limites na qualidade de aproximação são provados para cenários centralizados e de aprendizado federado. A eficiência do BSR é uma inovação significativa para o treinamento privado de modelos.
Pacote Malicioso no PyPI Rouba Dados de AWS, CI/CD e macOS
Fonte: The Hacker News | Índice de Inovação: ★★★★☆
Pesquisadores descobriram um pacote malicioso no PyPI, o 'chimera-sandbox-extensions', que rouba credenciais, dados de configuração e variáveis de ambiente. Mimetizando um módulo auxiliar para o Chimera Sandbox da Grab, ele coleta informações de infraestrutura corporativa e cloud, incluindo dados JAMF (macOS). O malware se comunica com um domínio gerado por algoritmo (DGA) para baixar um payload, que coleta dados e os envia de volta. Outros casos envolvem pacotes npm com execução de código remoto e um caso de ofuscação sofisticada com um RAT Pulsar. A sofisticação crescente desses ataques e o surgimento do 'slopsquatting' (criação de pacotes falsos por IAs) destacam a necessidade de vigilância e segurança proativa no desenvolvimento de software.
ChatGPT Codex: Nova atualização permite escolha de soluções de código
Fonte: Bleeping Computer | Índice de Inovação: ★★★☆☆
O ChatGPT Codex, ferramenta de programação da OpenAI, recebeu uma atualização que permite a geração de múltiplas soluções para uma mesma tarefa de codificação, permitindo que o usuário escolha a melhor opção. Anteriormente, o usuário precisava solicitar múltiplas tentativas para alcançar resultados diferentes. Além disso, foram adicionados atalhos de teclado para facilitar o acesso. O Codex é baseado no modelo o3 otimizado para codificação, e acessa o código-fonte do GitHub para gerar soluções, podendo criar código novo, propor pull requests e executar cada tarefa em um ambiente isolado (sandbox). A ferramenta está disponível para assinantes do plano Plus ($20). Esta atualização melhora significativamente a eficiência do processo de codificação, automatizando tarefas e permitindo que os desenvolvedores se concentrem em aspectos mais estratégicos do seu trabalho.
Análise de Esteganografia em Imagem JPEG revela DLL .NET
Fonte: ISC | Índice de Inovação: ★★★☆☆
Um artigo detalha a descoberta de um payload oculto em uma imagem JPEG usando técnicas de esteganografia. A análise dinâmica revelou o download de uma imagem contendo dados anexados após o fim da imagem (EOI). A decodificação, utilizando ferramentas como jpegdump.py e base64dump.py, revelou uma string BASE64 com um caractere '@' substituindo 'A'. Após a decodificação completa, obteve-se um arquivo DLL .NET, cuja verificação de hash confirmou a descoberta. A técnica explora a ocultação de dados em imagens, com a substituição de um caractere alterando a codificação padrão, exigindo análise estatística para descoberta. O processo demonstra a importância da análise forense digital para detecção de malwares.
Tecnologia e Liderança Inovadora
Influenciador cria religião 'Não Morra' usando IA para combater a morte e a IA superinteligente
Fonte: MIT Technology Review Brasil (Inovação e Liderança) | Índice de Inovação: ★★★☆☆
O multimilionário Bryan Johnson, influenciador da longevidade, fundou a religião 'Não Morra', que visa combater o envelhecimento e a ameaça da IA superinteligente. A religião prega que 'o corpo é Deus' e utiliza a IA como ferramenta para alcançar a imortalidade, redefinindo a relação entre corpo e mente. Johnson busca alinhar a IA com a preservação da vida humana, integrando tecnologia e fé. Ele acredita que essa nova abordagem religiosa será crucial em um futuro dominado pela IA, oferecendo uma estrutura para lidar com as questões existenciais da humanidade. A ideia central é a preservação da existência humana, usando a tecnologia e a fé em conjunto. A comunidade 'Não Morra' se reúne em grupos, realizando rituais e práticas de saúde.
BITS – Boletim de Inovação, Tecnologia, Segurança e Privacidade, by Fábio Correa Xavier.
Fábio Correa Xavier é um apaixonado por construir futuros inspiradores por meio da tecnologia e inovação.
Mestre em Ciência da Computação pela Universidade de São Paulo, com MBA em Gestão de Negócios pelo Ibmec/RJ, e Especialização Network Engineering pela Japan International Cooperation Agency (JICA).
Atualmente é CIO do Tribunal de Contas do Estado de São Paulo, Professor e Coordenador de graduação e pós-graduação, e colunista da MIT Technology Review Brasil e da IT Forum.
Possui as certificações CIPM e CDPO/BR (IAPP – International Association of Privacy Professionals), CC((ISC)²) e EXIN Privacy e Data Protection.
É autor de vários livros sobre tecnologia, inovação, privacidade, proteção de dados e LGPD, com destaque para o Best Seller “CIO 5.0”, semifinalista do Prêmio Jabuti 2024 e destaque da Revista Exame, e também de Mapa da Liderança.
