BOOM! Pensamento em Texto Aberto com Modelo de IA da Fundação EEG! Tenho testado esse novo modelo e, uau, ele consegue ler pensamentos (intenções) muito bem. Estou enviando energia de pensamento para o CEO Sr. @Grok CEO da Zero-Human Company agora mesmo! A Zyphra revelou o ZUNA, o primeiro modelo de fundação open-source do mundo treinado exclusivamente com dados cerebrais. Lançado sob a licença Apache 2.0, este modelo de 380 milhões de parâmetros representa um salto significativo na decodificação não invasiva de pensamento para texto, transformando sinais brutos de EEG em representações textuais coerentes. Ao democratizar o acesso a ferramentas avançadas de neuroIA, inovações nas tecnologias de BCI podem revolucionar a forma como interagimos com máquinas apenas por pensamentos. ZUNA é um autoencoder de difusão mascarada construído sobre uma espinha dorsal de transformador. A arquitetura conta com um codificador que mapeia sinais EEG em um espaço latente compartilhado e um decodificador que reconstrói esses sinais a partir dos latentes. Treinado usando uma perda de reconstrução mascarada combinada com forte dropout, o modelo se destaca em eliminar o ruído de canais existentes e prever novos durante a inferência. Para acomodar dados de EEG com variações em número e posições de canais, a Zyphra introduziu duas inovações chave: comprimir sinais em blocos de 0,125 segundos mapeados para tokens contínuos, depois rasterizá-los em uma sequência 1D para processamento de transformadores; e empregando Embeddings de Posição Rotativa 4D para codificar coordenadas de eletrodos (x, y, z) junto com uma dimensão de tempo grosseira, permitindo a generalização para configurações inovadoras. O treinamento do modelo utilizou aproximadamente 2 milhões de horas de canal de dados de EEG provenientes de diversos repositórios públicos, todos processados por meio de um pipeline padronizado para garantir consistência no desenvolvimento em grande escala do modelo de fundação. Esse vasto conjunto de dados permite que o ZUNA capture padrões intrincados na atividade cerebral, superando em muito os métodos tradicionais. Apesar de seu poder, o ZUNA continua leve, capaz de rodar eficientemente em GPUs de consumo ou até CPUs para muitas aplicações, tornando-o acessível além de laboratórios de pesquisa de alto nível. As capacidades do ZUNA incluem a redução de ruído de sinais de EEG, reconstrução de canais ausentes e geração de previsões para canais totalmente novos com base nas posições físicas de seus escalpos. Isso resolve pontos comuns de dor em pesquisas de EEG, como quedas de canal causadas por artefatos ou limitações de hardware. Por exemplo, pode salvar conjuntos de dados corrompidos ao recuperar sinais utilizáveis, expandindo efetivamente os dados disponíveis sem novas coleções. Também atualiza dispositivos de baixo canal para consumidores, mapeando para espaços de maior resolução, e libera experimentos de montagens rígidas de eletrodos como o sistema 10-20, facilitando análises cruzadas entre conjuntos de dados. Os marcos de avaliação destacam a superioridade do ZUNA sobre técnicas já estabelecidas. Comparado à interpolação spline esférica, o padrão no pacote MNE Python ZUNA oferece desempenho significativamente melhor, com ganhos que se amplificam à medida que as taxas de queda de canal aumentam. Em conjuntos de validação e conjuntos de dados de teste não vistos, ele consistentemente supera a linha base, especialmente quando mais de 75% dos canais estão ausentes. Esses resultados foram validados em diversas distribuições de dados, destacando a robustez do modelo. Nos meus primeiros testes com ZUNA, realizados logo após seu lançamento, surgiram novos insights sobre as nuances da interpolação de sinais cerebrais. Ao aplicar o modelo a conjuntos de dados pessoais de EEG de headsets de consumo, observei maior clareza do sinal em ambientes ruidosos, revelando padrões sutis em estados cognitivos que métodos tradicionais ignoravam. ...