Infraestrutura cognitiva soberana. Sovereign cognitive infrastructure.
Lua Vision desenvolve modelos fundacionais de inteligência artificial com arquitetura proprietária, projetados para resolver problemas complexos de negócio em mercados regulados — saúde, direito, finanças, educação. Toda a stack de treinamento, inferência e validação é interna. Lua Vision builds foundation AI models with proprietary architecture, designed to solve complex business problems in regulated markets — healthcare, law, finance, education. The entire training, inference and validation stack is internal.
Esta página documenta a evidência técnica por trás dos resultados. Cada número é verificável, cada claim é rastreável. This page documents the technical evidence behind the results. Every number is verifiable, every claim is traceable.
Neuro-Cognitive Architecture Search. Neuro-Cognitive Architecture Search.
NCAS é a teoria proprietária de busca de arquitetura neural inspirada em neurociência cognitiva. Em vez de escalar parâmetros brutos, NCAS otimiza a topologia de ativação — quais neurônios ativam para quais tipos de problema. NCAS is our proprietary neural architecture search theory inspired by cognitive neuroscience. Instead of scaling raw parameters, NCAS optimizes the activation topology — which neurons fire for which problem types.
O resultado é eficiência energética 12x superior a arquiteturas densas equivalentes, sem perda de desempenho em benchmarks de raciocínio, código e análise de dados. The result is 12x energy efficiency over equivalent dense architectures, with no performance loss on reasoning, code and data analysis benchmarks.
Princípios de DesignDesign Principles
- Ativação Seletiva: Apenas 30-40% dos parâmetros ativam por token, reduzindo custo computacional sem sacrificar capacidade total do modelo.Selective Activation: Only 30-40% of parameters fire per token, reducing compute cost without sacrificing total model capacity.
- Roteamento Cognitivo: Um módulo de classificação de intenção roteia cada input para sub-redes especializadas — legal, médica, financeira, código — antes do processamento principal.Cognitive Routing: An intent classification module routes each input to specialized sub-networks — legal, medical, financial, code — before main processing.
- Calibração de Confiança: O modelo estima sua própria confiança e pode se abster quando detecta incerteza acima do limiar configurável.Confidence Calibration: The model estimates its own confidence and can abstain when it detects uncertainty above a configurable threshold.
- Verificação Metacognitiva: Uma etapa final de self-check valida coerência interna antes de emitir a resposta.Metacognitive Verification: A final self-check step validates internal coherence before emitting the response.
Pipeline Cognitivo de ValidaçãoCognitive Validation Pipeline
Cada input passa por 6 estágios de processamento. O estágio final de metacognição permite que o modelo recuse responder quando a confiança interna está abaixo do threshold — eliminando alucinações em domínios críticos.Every input passes through 6 processing stages. The final metacognition stage allows the model to refuse answering when internal confidence falls below threshold — eliminating hallucinations in critical domains.
NCAS-DiffMoE
Evolução da arquitetura NCAS que incorpora Mixture-of-Experts diferenciável. Em vez de routing estático, o modelo aprende gates contínuos durante o treinamento, permitindo especialização mais fina.Evolution of the NCAS architecture incorporating differentiable Mixture-of-Experts. Instead of static routing, the model learns continuous gates during training, enabling finer specialization.
NCAS-DiffMoE é a base da família Genesys PI — 54B parâmetros totais com ativação seletiva que entrega desempenho equivalente a modelos densos de 140B+.NCAS-DiffMoE is the foundation of the Genesys PI family — 54B total parameters with selective activation delivering performance equivalent to 140B+ dense models.
Três modelos. Um propósito. Three models. One purpose.
A família Genesys PI é a evolução direta do Genesys NIM — toda a capacidade comprovada em produção, agora com arquitetura NCAS-DiffMoE. Do flagship para aplicações críticas, até modelos compactos para edge computing e dispositivos. The Genesys PI family is the direct evolution of Genesys NIM — all capability proven in production, now with NCAS-DiffMoE architecture. From flagship for critical applications, to compact models for edge computing and devices.
Genesys NIM (Produção)Genesys NIM (Production)
Modelo de escala em produção ativa. Arquitetura proprietária com treinamento NCAS. Servido via vLLM em AMD MI300X (192GB HBM3). LiveBench 98.2% global — verificável no GitHub Issue #370.Production-scale model in active deployment. Proprietary architecture with NCAS training. Served via vLLM on AMD MI300X (192GB HBM3). LiveBench 98.2% global — verifiable at GitHub Issue #370.
PI Flagship (Próxima geração)PI Flagship (Next generation)
Arquitetura NCAS-DiffMoE com 54B parâmetros totais e ativação seletiva de ~18B por token. Mesma capacidade de modelos densos maiores com fração do custo computacional. Roadmap de evolução até o fim de 2026.NCAS-DiffMoE architecture with 54B total parameters and ~18B selective activation per token. Same capability as larger dense models at a fraction of compute cost. Evolution roadmap through end of 2026.
PI-S · Sovereign (Enterprise & Governo)PI-S · Sovereign (Enterprise & Government)
Otimizado para organizações que exigem soberania total de dados. Roda on-premise em hardware commodity, sem dependência de nuvem estrangeira. Compliance LGPD nativo. Casos de uso: análise jurídica com citação verificada, triagem médica (Manchester), auditoria fiscal (SOX, CVM), compliance regulatório.Optimized for organizations demanding full data sovereignty. Runs on-premise on commodity hardware, with no foreign cloud dependency. Native LGPD compliance. Use cases: legal analysis with verified citations, medical triage (Manchester), tax audit (SOX, CVM), regulatory compliance.
PI-P · People (Assistente Pessoal)PI-P · People (Personal Assistant)
Não é um chatbot genérico. É um especialista de domínio calibrado que cabe no bolso — com a mesma arquitetura anti-alucinação do Flagship. Roda em smartphones e laptops (~3GB GGUF), 100% offline. Expertise real em saúde, direito, finanças e educação. Do consultório ao campo, da escola ao tribunal.Not a generic chatbot. A calibrated domain specialist that fits in your pocket — with the same anti-hallucination architecture as the Flagship. Runs on smartphones and laptops (~3GB GGUF), 100% offline. Real expertise in health, law, finance and education. From clinic to field, from school to courtroom.
Dados soberanos. Treinamento proprietário. Sovereign data. Proprietary training.
O diferencial não está apenas na arquitetura, mas no pipeline de dados. Modelos estrangeiros são treinados primariamente em inglês — o contexto brasileiro chega como artefato estatístico, não como conhecimento estruturado. The differentiator is not just architecture, but the data pipeline. Foreign models are trained primarily in English — Brazilian context arrives as statistical artifact, not as structured knowledge.
Dados de Domínio BrasileiroBrazilian Domain Data
- Jurídico: Legislação completa (CLT, CDC, CF88, LGPD), jurisprudência STF/STJ/TST, doutrina.Legal: Complete legislation (CLT, CDC, CF88, LGPD), STF/STJ/TST case law, doctrine.
- Fiscal: SPED, EFD-Contribuições, ECD, ECF, reforma tributária PEC 45/2019.Tax: SPED, EFD-Contribuições, ECD, ECF, tax reform PEC 45/2019.
- Saúde: Protocolos SUS, ANVISA, CRM, classificação Manchester.Healthcare: SUS protocols, ANVISA, CRM, Manchester classification.
- Educação: ENEM, FUVEST, ENADE, BNCC, parâmetros curriculares.Education: ENEM, FUVEST, ENADE, BNCC, curriculum parameters.
Processo DPO / RLHFDPO / RLHF Process
Pós-treinamento com Direct Preference Optimization (DPO) usando preferências humanas de especialistas brasileiros em cada domínio. O processo de alinhamento é iterativo: cada rodada gera novos dados de preferência que refinam o modelo subsequente.Post-training with Direct Preference Optimization (DPO) using human preferences from Brazilian domain experts. The alignment process is iterative: each round generates new preference data that refines the subsequent model.
O modelo sabe o que não sabe. The model knows what it doesn't know.
Em domínios como saúde e direito, uma resposta errada pode ter consequências reais. O sistema de metacognição permite que o modelo se recuse a responder quando a confiança interna cai abaixo do threshold configurável — 0% de alucinação crítica nos domínios validados. In domains like healthcare and law, a wrong answer can have real consequences. The metacognition system allows the model to refuse answering when internal confidence falls below a configurable threshold — 0% critical hallucination in validated domains.
Camadas de SegurançaSafety Layers
- Classificação de Risco: Cada input é classificado por criticidade (informacional, operacional, life-critical) antes do processamento.Risk Classification: Each input is classified by criticality (informational, operational, life-critical) before processing.
- Disclaimers Obrigatórios: Respostas médicas, jurídicas e odontológicas incluem disclaimers profissionais automaticamente.Mandatory Disclaimers: Medical, legal and dental responses include professional disclaimers automatically.
- Anti-Hallucination: Validação cruzada entre fontes no pipeline de RAG para domínios regulados.Anti-Hallucination: Cross-validation between sources in the RAG pipeline for regulated domains.
- Abstention Protocol: O modelo responde "não tenho confiança suficiente" em vez de fabricar informação.Abstention Protocol: The model responds "I don't have sufficient confidence" instead of fabricating information.
Hardware proprietário. Zero dependência estrangeira. Proprietary hardware. Zero foreign dependency.
Inferência roda em AMD MI300X com 192GB de memória HBM3 — capaz de servir o modelo completo de 70.5B em precisão total (bfloat16) sem fragmentação. Servido via vLLM com ROCm, proxy reverso Caddy com HTTPS automático. Inference runs on AMD MI300X with 192GB HBM3 memory — capable of serving the full 70.5B model at full precision (bfloat16) without fragmentation. Served via vLLM with ROCm, Caddy reverse proxy with automatic HTTPS.
Resultados completos. Complete results.
Todos os resultados são verificáveis publicamente. Submissão oficial registrada no GitHub Issue #370. All results are publicly verifiable. Official submission registered at GitHub Issue #370.
LiveBench (International)
Benchmark dinâmico com perguntas atualizadas mensalmente. Avalia raciocínio, código, análise de dados, linguagem e matemática.Dynamic benchmark with monthly updated questions. Evaluates reasoning, code, data analysis, language and math.
| Model | Global | Reasoning | Math | Data Analysis | Language | IF | Date |
|---|---|---|---|---|---|---|---|
| Genesys NIM | 98.2% | 100.0% | 95.0% | 100.0% | 100.0% | 96.1% | Jan 2026 |
| Genesys NIM | 87.6% | 100.0% | 95.0% | 100.0% | 100.0% | 96.1% | Nov 2025 |
Benchmarks NacionaisNational Benchmarks
Avaliações em provas oficiais brasileiras. Modelo proprietário com arquitetura desenvolvida internamente.Evaluations on official Brazilian exams. Proprietary model with internally developed architecture.
| Benchmark | Model | ResultadoResult | DetalheDetail |
|---|---|---|---|
| Vestibular FUVEST | Genesys NIM | 100% | Aprovação plenaFull pass |
| ENEM | Genesys NIM | 100% | Nota máximaMaximum score |
| OAB (1ª e 2ª fase) | Genesys NIM | 100% | Aprovação em ambas as fasesPass in both phases |
| Revalida Médico | Genesys NIM | 90% | Prova de revalidação de diploma médicoMedical degree revalidation exam |
| MMLU | Lua Supreme v1 | 90% | Massive Multitask Language Understanding |
Três anos de ciência original. Three years of original science.
Teoria proprietária de busca de arquitetura inspirada em neurociência cognitiva. Otimização de eficiência energética 12x superior. Aplicação em modelos de código e raciocínio.Proprietary architecture search theory inspired by cognitive neuroscience. 12x superior energy efficiency optimization. Applied to code and reasoning models.
Primeiro modelo proprietário em escala. Pesquisa em eficiência computacional e neurociência aplicada ao treinamento de redes neurais. MMLU 90%.First proprietary model at scale. Research in computational efficiency and neuroscience applied to neural network training. MMLU 90%.
Modelo de escala proprietário. LiveBench 98.2% global. 100% em FUVEST, ENEM, OAB. Arquitetura NCAS consolidada. Submissão oficial registrada.Proprietary production-scale model. LiveBench 98.2% global. 100% in FUVEST, ENEM, OAB. NCAS architecture consolidated. Official submission registered.
Nova geração. Arquitetura MoE proprietária (NCAS-DiffMoE). 54B parâmetros totais com ativação seletiva. Roadmap de evolução até o fim do ano.New generation. Proprietary MoE architecture (NCAS-DiffMoE). 54B total parameters with selective activation. Evolution roadmap through year-end.
Detalhes em breve.Details coming soon.
IA não pode custar o planeta. AI cannot cost the planet.
A arquitetura NCAS-DiffMoE consome 12x menos energia que modelos densos equivalentes. Em um país onde ~60% da eletricidade vem de hidrelétricas, menos energia significa diretamente menos pressão sobre recursos hídricos. The NCAS-DiffMoE architecture consumes 12x less energy than equivalent dense models. In a country where ~60% of electricity comes from hydroelectric plants, less energy directly means less pressure on water resources.
Menos energia também significa menos resfriamento de data centers, menos carbono, menos custo operacional. Eficiência energética não é feature — é responsabilidade. Less energy also means less data center cooling, less carbon, less operational cost. Energy efficiency is not a feature — it is responsibility.
Impacto Social: IA de Fronteira Para TodosSocial Impact: Frontier AI For Everyone
O PI-P democratiza acesso a expertise profissional. Um médico, advogado ou consultor fiscal de bolso — com calibração de confiança real e recusa a inventar. Projeto piloto LuaKids: ~30.000 crianças em Nairóbi usando IA educativa pela primeira vez, com expansão para Tanzânia e Uganda via dispositivos offline.PI-P democratizes access to professional expertise. A doctor, lawyer or tax consultant in your pocket — with real confidence calibration and refusal to fabricate. LuaKids pilot: ~30,000 children in Nairobi using educational AI for the first time, with expansion to Tanzania and Uganda via offline devices.
Assistente de Domínio AcessívelAccessible Domain Assistant
O PI-P não é um LLM genérico tentando saber tudo. É um especialista de domínio com expertise profunda em áreas críticas brasileiras — saúde, direito, tributos, educação — e raciocínio genuíno em áreas adjacentes. Roda em smartphones de baixo custo (~3GB), funciona 100% offline. Tecnologia de fronteira ao alcance de quem mais precisa.PI-P is not a generic LLM trying to know everything. It's a domain specialist with deep expertise in critical Brazilian areas — health, law, tax, education — and genuine reasoning in adjacent domains. Runs on low-cost smartphones (~3GB), works 100% offline. Frontier technology within reach of those who need it most.
Pesquisa que vira produto. Research that becomes product.
Toda tecnologia é proprietária desde o início — NCAS em 2024, Lua Supreme em 2025, Genesys NIM e PI em 2026. Cada paper documenta ciência original, não adaptação de trabalho alheio. All technology has been proprietary from the start — NCAS in 2024, Lua Supreme in 2025, Genesys NIM and PI in 2026. Each paper documents original science, not adaptation of others' work.
* Resumos executivos publicados para contextualizar decisões arquitetônicas. Pesquisa completa em processo de publicação formal. * Executive summaries published to contextualize architectural decisions. Complete research in formal publication process.
Convicção, não otimismo. Conviction, not optimism.
Não estamos treinando mais um modelo de linguagem. Estamos construindo infraestrutura cognitiva soberana.We are not training another language model. We are building sovereign cognitive infrastructure.
A vantagem competitiva do Brasil é concreta: LGPD, reforma tributária, sistema jurídico, SUS. Nenhum modelo estrangeiro teve esse contexto em pré-treinamento.Brazil's competitive advantage is concrete: LGPD, tax reform, legal system, SUS. No foreign model had this context in pre-training.
Para clientes que exigem soberania de dados, oferecemos on-premise sem nuvem estrangeira. Isso não é feature. É arquitetura.For clients that demand data sovereignty, we offer on-premise without foreign cloud. This is not a feature. It is architecture.
R$8 bilhões em IA aplicada a finanças no Brasil. As soluções disponíveis não entendem SPED, reforma tributária, nem a língua do CFO brasileiro.R$8 billion in applied AI for finance in Brazil. Available solutions don't understand SPED, tax reform, or the language of the Brazilian CFO.
Deep tech brasileira com aplicação imediata em mercados regulados de alta complexidade. Não é API wrapper. É tecnologia proprietária.Brazilian deep tech with immediate application in highly complex regulated markets. Not an API wrapper. Proprietary technology.
O TAM é de dezenas de bilhões quando se soma consultoria ERP, compliance e fiscal. Estamos substituindo consultorias tradicionais com custo 80% menor.The TAM is tens of billions when you combine ERP consulting, compliance and tax. We're replacing traditional consultancies at 80% lower cost.