Arquitetura técnica, stack tecnológica, segurança e LGPD
Outline · subtópicos planejados
Este capítulo cobrirá os pontos abaixo. O conteúdo redacional virá na próxima fase, em formato executivo com dados, fontes e referências cruzadas.
- 01 Frontend — React 18 + Vite + Tailwind CSS (SPA, build rápido, design system unificado)
- 02 Backend Core — Laravel 11 (PHP 8.3+) como modular monolith, com domínios isolados por bounded context
- 03 Módulos Laravel (deployáveis independentemente) — Auth/Tenants · Empresas (CNPJ/CNAE) · Certificado Digital · Documentos Fiscais (XML/NF-e/CT-e/SPED) · Motor Tributário · Recuperação · Reforma · BI · IA Copilot
- 04 Workers de processamento pesado — Python + FastAPI + Celery para IA, parsing, OCR, NLP, ML
- 05 Fila e jobs — Redis + Laravel Horizon (retry exponencial, dashboard nativo, métricas)
- 06 Persistência — Caminho híbrido · 3-4 PostgreSQL agrupados por padrão de uso (nem monolito único nem 7 micro-DBs)
- 07 DB 1 · TRANSACTIONAL CORE — schemas core / companies / tax_rules / analysis / billing — alta consistência, FK e transação atômica entre domínios relacionados
- 08 DB 2 · DOCUMENTS — schemas fiscal_documents / audit_logs — alto volume, append-heavy, partition por mês, retenção 5 anos
- 09 DB 3 · ANALYTICS & AI — schemas analytics / ai_knowledge — extensions pgvector (embeddings) + TimescaleDB (séries temporais)
- 10 DB 4 (ano 2+) · SEARCH — ElasticSearch/OpenSearch para jurisprudência, COSIT, pareceres (full-text + busca semântica em larga escala)
- 11 Por que 3-4 DBs (não 1 nem 7) — deploy modular preservado · isolamento de blast radius · custo operacional gerenciável · consistência transacional intra-DB
- 12 Storage — S3-compatible em Hetzner Object Storage (XMLs, SPEDs, PDFs, exports) com versionamento + retenção por bucket
- 13 OCR e parsing — pipeline Python para documentos não estruturados (PDF, imagens, scans antigos)
- 14 Segurança — TLS 1.3 · AES-256 em repouso e trânsito · HSM dedicado para certificados A1/A3 · vault com rotação automática
- 15 Multi-tenancy — isolamento total por CNPJ em schema + row-level security (RLS) no Postgres
- 16 LGPD by design — bases legais, finalidade, minimização, retenção, ANPD · DPO interno · pipeline de eliminação programada
- 17 Autenticação — Laravel Sanctum (SaaS) na Fase 1 · SSO enterprise SAML/OIDC via Keycloak ou Auth0 na Fase 2
- 18 APIs — OpenAPI/Swagger auto-gerado · API pública e privada (suporta o Open Tax API Ecosystem · Cap 38)
- 19 LLM e IA — APIs OpenAI/Anthropic na Fase 1 · fine-tuning proprietário na Fase 3 (Cap 41) · embeddings em pgvector para RAG
- 20 Observability — OpenTelemetry + Grafana + Prometheus (logs, métricas, traces) · Sentry (errors) · logs imutáveis WORM para audit
- 21 Containerização — Docker em dev/staging/prod · orquestração Docker Compose evoluindo para Kubernetes quando volume justificar (provavelmente ano 2-3)
- 22 Infra as Code — Terraform/OpenTofu · CI/CD via GitHub Actions com pipelines independentes por módulo
- 23 Cloud principal — Hetzner Cloud (relação custo/performance) · alternativa AWS-BR/GCP-BR para workloads regulatory-sensitive
- 24 Disaster recovery — backups georredundantes diários (core) + semanais (documents) · RTO < 4h · RPO < 1h · réplica read-only
- 25 Roadmap de certificação — LGPD compliance ano 1 · SOC 2 Type II ano 2 · ISO 27001 ano 2-3
- 26 Filosofia arquitetural — modular monolith primeiro · deploy modular independente · microsserviços apenas quando dor real surgir