Centro de Ciência de Dados
para Estatísticas Públicas
Sobre o Centro
A Fundação Seade abriga o Centro de Ciência de Dados para Estatísticas Públicas (CCDEP), um dos “Centros de Ciência para o Desenvolvimento” aprovados pela FAPESP em 2024 para pesquisas com impacto em políticas públicas.
O CCDEP busca soluções para utilizar dados de alta frequência e grande volume, além de novas ferramentas computacionais, na produção de indicadores voltados a políticas públicas.
Objetivos
Big Data
Utilizar dados de alta frequência, grande volume, estruturados e não estruturados
Conhecimento Novo
Produzir conhecimento novo para áreas específicas de política pública
Formação
Formar recursos humanos especializados em ciência de dados aplicada
Impacto
Gerar impacto direto em políticas públicas do Estado de São Paulo
Metodologias Inovadoras
Desenvolver metodologias inovadoras para coleta, tratamento e análise de dados
Parcerias Estratégicas
Estabelecer parcerias para acesso, análise de dados e disseminação de resultados
Cinco linhas de pesquisa interdisciplinares para transformar dados em indicadores para políticas públicas
Atividade Econômica
Pesquisador Principal: Eduardo de Resende Francisco (FGV EAESP)
Coordenação Técnica: Vagner Bessa (SEADE)
Objetivo
Utilizar dados de alta frequência e registros administrativos digitais para desenvolver indicadores, modelos preditivos e análises sobre a economia paulista de forma tempestiva e com desagregação geográfica.
Atividades em Andamento
A equipe está realizando análises comparativas de frameworks internacionais (FMI, União Europeia, ONU) voltados à integração de registros fiscais na estatística econômica e avaliando experiências de países como Estados Unidos, Canadá e Espanha, de modo a identificar boas práticas que podem ser aplicadas ao contexto paulista. O objetivo principal é desenvolver indicadores de atividade econômica mensais com maior tempestividade e granularidade, aproveitando a expertise do SEADE.
Ferramenta sintética e multidimensional em desenvolvimento que integra informações sobre dimensões fundamentais do território paulista para subsidiar políticas públicas com diagnóstico territorial. O processo envolve revisão bibliográfica, benchmarking de experiências nacionais e internacionais e organização do indicador sintético, baseado em dimensões, subdimensões, indicadores e variáveis de fontes de dados públicas. Próximos passos incluem validação de variáveis e métodos de normalização, agregação e clusterização dos dados, permitindo comparações sistemáticas e monitoramento contínuo do desenvolvimento territorial.
Desenvolvimento experimental de mecanismo automatizado baseado em inteligência artificial generativa com arquitetura agêntica, utilizando o framework CrewAI. O sistema orquestra múltiplos agentes especializados para executar tarefas colaborativas de pesquisa, validação e processamento de dados sobre investimentos produtivos em São Paulo. Embora não substitua integralmente a coleta tradicional da Pesquisa de Investimentos Anunciados (PIESP), demonstrou eficácia como mecanismo complementar, identificando notícias adicionais mesmo navegando pelos mesmos sites monitorados pela pesquisa atual. O experimento serve como referência para expansão da coleta de dados textuais em outros temas.
Plataforma experimental que orquestra modelos de Inteligência Artificial para auxiliar pesquisadores, baseada na técnica de Geração Aumentada por Recuperação (RAG). O sistema integra modelos de linguagem de grande escala a uma base documental curada, possibilitando consultas em linguagem natural sobre normas, procedimentos e documentações da FAPESP. Foram conduzidos experimentos com diferentes cenários, ajustes na base de dados e otimizações na arquitetura, resultando em evolução progressiva na acurácia das respostas. O sistema preliminar está disponível online e estabelece fundamentos para futuras melhorias, como ampliação da base documental e redução da latência.
Pesquisadores
Quem Somos
Pesquisadores, técnicos e estudantes em uma estrutura colaborativa interdisciplinar
Trabalhos apresentados em eventos científicos
Metadata Management in Data Mesh: Toward Federated Discovery and Governance
R. H. Suguimoto, P. M. Meirelles, and K. R. Braghetto
Anais do SBBD'2025 - Simpósio Brasileiro de Banco de Dados, Fortaleza, CE, Brasil, 29/09 a 02/10/2025, 7 pags.
Acessar publicaçãoCan the Linux Kernel sustain 30 more years of growth? Toward mitigating bottlenecks in its development model
D. Tadokoro, R. Siqueira, and P. Meirelles
Anais do SBES'2025 - Simpósio Brasileiro de Engenharia de Software, Recife, PE, Brasil, 22/09 a 26/09/2025, 7 pags.
Acessar publicaçãoKworkflow: a kernel Linux developer workflow tool
D. Tadokoro, R. Siqueira, and P. Meirelles
Anais do SBES'2025-Simpósio Brasileiro de Engenharia de Software, Recife, PE, Brasil, 22/09 a 26/09/2025, 7 pags.
Acessar publicaçãoEstratégias de ensino para incentivar a participação consistente em projetos de Software Livre
D. Tadokoro, R. Passos, and P. Meirelles
Anais do VEM'2025-Workshop on Software Visualization, Maintenance and Evolution, Recife, PE, Brasil, 22/09, 10 pags. (a ser publicado).
Acessar publicaçãoMapping and Mitigating Bottlenecks in the Linux Kernel Development Model
D. Tadokoro
16º Congresso Brasileiro de Software: Teoria e Prática (CBSoft). Recife, PE – Mar Hotel. 22/09 a 26/09/2025.
DUKS: visualizações e análises unificadas para o Kernel Linux
R. Passos, A. Pilone, D. Tadokoro, and P. Meirelles
Anais do VEM'2025-Workshop on Software Visualization, Maintenance and Evolution, Recife, PE, Brasil, 22/09, 10 pags.
Acessar publicaçãoStreamlining Analyses on the Linux Kernel with DUKS
R. Passos, A. Pilone, D. Tadokoro, and P. Meirelles
Proceeding of VISSOFT'2025 - IEEE Working Conference on Software Visualization, Auckland, New Zealand, September 7-8, 4 pages.
Acessar publicaçãoAutomatically Augmenting GitHub Issues with Informative User Reviews
A. Pilone, M. Raglianti, M. Lanza, F. Kon, and P. Meirelles
Proceeding of ICSME'2025 - International Conference on Software Maintenance and Evolution, Auckland, New Zealand, September 7-12, 12 pages.
Acessar publicaçãoEnsuring Code Integrity in the Era of AI-Assisted Software Development
A. Pilone
16º Congresso Brasileiro de Software: Teoria e Prática (CBSoft). Recife, PE – Mar Hotel. 22/09 a 26/09/2025.
Acessar publicaçãoAgente Autônomo Guiado por LLM para Extração de Notícias
J. V.C.N. Sousa, L.M. Mingardo, C.E.T. Freire, A.J.M. Traina, and C. Traina Jr
Proc. SBBD'2025-Simpósio Brasileiro de Banco de Dados, Fortaleza, CE, Brazil, 29/09 a 02/010/2025, 12 pags.
Acessar publicaçãoConjunto de notícias para avaliação de investimentos em regiões do estado de São Paulo
G. L. Melo, J.V.C.N. Sousa, L.M. Mingardo, W.D. Oliveira, C.E.T. Freire, A.J.M. Traina, and C. Traina Jr
Proc. SBBD'2025-Simpósio Brasileiro de Banco de Dados, Fortaleza, CE, Brazil, 29/09/2025, 10 pags.
Acessar publicaçãoCaminhos Estaduais para Redução da Violência e da Criminalidade
LIMA, RENATO SÉRGIO
ENCONTRO ANUAL DO FÓRUM BRASILEIRO DE SEGURANÇA PÚBLICA (FBSP), XIX. 2025, Manaus.
Tecnologia a Serviço da Segurança Pública: Ferramentas, Desafios e Impactos
MARTINS, JULIANA
ENCONTRO ANUAL DO FÓRUM BRASILEIRO DE SEGURANÇA PÚBLICA (FBSP), XIX. 2025, Manaus.
O papel da sociedade civil organizada na produção de dados e evidências sobre segurança pública
SOBRAL, ISABELA
ENCONTRO ANUAL DO FÓRUM BRASILEIRO DE SEGURANÇA PÚBLICA (FBSP), XIX. 2025, Manaus.
Tecnologias Emergentes no Enfrentamento às Fraudes Digitais: Deepfakes, Dados e Direitos
MARQUES, DAVID
ENCONTRO ANUAL DO FÓRUM BRASILEIRO DE SEGURANÇA PÚBLICA (FBSP), XIX. 2025, Manaus.
Eventos Realizados
Eventos realizados
Lançamento do Centro de Ciência de Dados para Estatísticas Públicas – CCDEP
Organizadores: CCDEP/Seade
Participantes: Representantes da FAPESP, FGV EAESP, Escola Politécnica da USP, FFLCH/USP, ICMC/USP, IGCE/Unesp Rio Claro, IME/USP, Unesp, Cetic.br|NIC.br, Faculdade de Saúde Pública/USP, INSPER
Seminários de Trabalhos em Andamento
Indicadores de mobilidade com dados de telefonia móvel
Resultados preliminares da análise de mobilidade urbana
Arquitetura de dados para indicadores econômicos
Discussão sobre Data Mesh
Coleta automatizada de dados textuais sobre investimentos
Apresentação do sistema multiagente
Pesquisas sobre força de trabalho e testes metodológicos com URA
Metodologias de coleta de dados
Participação em eventos, reuniões e entrevistas
International Training Program on Policies and Applications of Government Data Governance in Belt and Road (B&R) Countries
Organizadores: Department of International Cooperation, Ministry of Science and Technology of China; Institute of Scientific and Technical Information of China (ISTIC); Chinese National Committee of UNESCO IFAP
Participantes: Ricardo Kadouaki
26th Annual International Conference on Digital Government Research (dg.o 2025)
Organizadores: Digital Government Society / Cetic.br
Participantes: Ricardo Kadouaki
FGV EAESP TechDay 2025 – IA do hype à realidade: Geopolítica, organizações e vida cotidiana
Organizadores: FGV EAESP
Participantes: Carlos Eduardo Torres Freire, Luiz Henrique Proença Soares, Ricardo Kadouaki, Irineu Barreto, Eduardo de Rezende Francisco
Reunião de Especialistas sobre a TIC Empresas 2024
Organizadores: NIC.br | Cetic.br
Participantes: Carlos Torres Freire, Irineu Barreto
Entrevista concedida ao Programa Alesp em Pauta
Organizadores: Assembleia Legislativa do Estado de São Paulo – ALESP
Participantes: Carlos Torres Freire
Oficina com foco no uso de Dados de Telefonia Móvel (Mobile Phone Data, MPD) no Brasil
Organizadores: Banco Mundial
Participantes: Carlos Torres Freire (PR), Mateus Humberto
O CCDEP oferece oportunidades de formação em diferentes níveis acadêmicos
Iniciação Científica
Para graduandos interessados em ciência de dados, IA e políticas públicas
Mestrado e Doutorado
Programas de pós-graduação nas instituições parceiras
Treinamento Técnico
Capacitação especializada em áreas do CCDEP
Estágios
Oportunidades para estudantes em diferentes áreas
Fundação Sistema Estadual de Análise de Dados
Av. Prof. Lineu Prestes, 913
Butantã - 05508-000 São Paulo - SP