Introdução

A presente nota técnica é uma matriz, isto é, um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.

Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.

subconjunto temático	sigla	descrição	pasta e marcador
Demográficos	A	Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida.	a_demografico
Sócioeconômicos	B	Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida.	b_socioeconomico
Mortalidade	C	Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida.	c_mortalidade
Morbidade	D	Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida.	d_morbidade
Recursos	E	Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida.	e_recursos
Cobertura	F	Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida.	f_cobertura

No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).

As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.

Endereço eletrônico

A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md

Objetivo

Pradronizar notas técnicas dos indicadores.

Ficha do indicador para o sanitarista

Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.

Conceituação

Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.

Interpretação

Explicação sucinta do tipo de informação obtida e seu significado.

Usos

Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.

Limitações

Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.

Fontes

Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.

Métodos de Cálculo

Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.

Categorias Sugeridas para Análise

Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.

Dados Estatísticos e Comentários

Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica

Literatura relacionada

Referências Scielo, Medline, GoogleScholar, EMBASE, etc, com as respectivas buscas estruturadas.

Ficha do indicador para o cientista de dados

O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.

A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.

Método de processamento de dados

Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql, postgreSQL, Oracle, etc. Se houver gerenciador de ETL, por exemplo, pentaho ou informatica, detalhar os processos (pipeline).

O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".

Método de processamento analítico

Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.

A solução deve ser apontada, por exemplo, disk.frame, Hadoop, Spark, Parquet e RDS, Storm, Cassandra, RapidMiner, MongoDB, Neo4j, SAMOA, HPCC, greenplum, etc.

Método de apresentação de dados

Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny, metabase, Power BI, Tableau, Microstrategy, QlikView / Qlik Sense, DataStudio, SAS, Elastic/Kibana, etc.

Método de análise matemática e estatística

Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R, python, matlab, scilab, Stata, SPSS, PSPP, Epiinfo, etc.

Método de descoberta de conhecimento em bancos de dados (KDD)

Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.

É desejável segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.

Exemplos de tipos de algoritmos são C4.5, Random Forest, K-mean Algorithm, Support Vector Machines SVM, Apriori Algorithm, Expectation-Maximization Algorithm, kNN, PCA, SVD.

Base de dados

Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).

Ver também

Predefinição:Div col

Predefinição:Div col fim

Predefinição:Notas Predefinição:Referências

Ligações externas

Predefinição:Correlatos

Apêndice

Rastreabilidade

atributo	valor
Identificador	código sequencial da pri.td_indicador
Código RIPSA
Nome RIPSA
URL RIPSA	http://fichas.ripsa.org.br/2007/
tabela CIEGES

Nomenclatura Sugerida

Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.

Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _.

Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
Caracteres recomendados: de a a z de 0 a 9 e underline
Caracteres não recomendados: ç, á, é, ã, â, espaço, etc

Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL é utilizada aspas duplas ", enquanto no MySQL é utilizada crase ```.

Exemplos de prefixos para bancos e tabelas:

bd_ - banco de dados (por exemplo, bd_medicamento, bd_obito, bd_covid19).
td_ - tabela de dimensão ou domínio (por exemplo, td_cid10, td_municipio, td_estabelecimento).
tf_ - tabela de fatos contendo transações (por exemplo, tf_dispensação, tf_notificacao_dengue).
tm_ - tabelas provisórias (por exemplo, tm_sia_am, tm_sia_aq).
vw_ - tabela de fatos contendo visões de dados (por exemplo, vw_dispensação_homens, tf_notificacao_dengue_amazonas).

Exemplos de prefixos para atributos:

co_ - código (por exemplo, co_cid10, co_procedimento_sigtap).
co_seq_ - código sequencial (por exemplo, co_seq_usuario, co_seq_estabelecimento).
dt_ - data (por exemplo, dt_nascimento, dt_dispensacao).
no_ - nome (por exemplo, no_usuário_sus, no_trabalhador, no_equipamento).
ds_ - descrição (por exemplo, ds_posologia, ds_relato_clinico).
qt_ - quantidade, usualmente, discreta (por exemplo, qt_comprimido, qt_area, qt_população).
vl_ - valor, usualmente, passível de ser decimal (por exemplo, vl_gasto, vl_densidade_demografica).
nu_ - número, usualmente contado ou calculado (por exemplo, nu_idade).
tx_ - taxa ou fração (por exemplo, tx_letalidade, tx_mortalidade).
st_ - situação ou status (por exemplo, st_ativo, st_gravida).
sg_ - sigla (por exemplo, sg_faixa_etaria, sg_sexo).

Lista de indicadores

A Demográficos

População ao ano

B Sócioeconômicos

C Mortalidade

Taxa de Mortalidade Infantil (TMI)

Taxa de mortalidade neonatal precoce

Taxa de mortalidade neonatal tardia

Taxa de mortalidade pós-neonatal

Taxa de mortalidade na infância

D Morbidade

E Recursos

F Cobertura

G Fatores de Risco e de Proteção

Predefinição:Ficha Predefinição:Indicador Predefinição:Matriz

Indicador:Ficha de indicador

Índice

Introdução

Endereço eletrônico

Objetivo

Ficha do indicador para o sanitarista

Conceituação

Interpretação

Usos

Limitações

Fontes

Métodos de Cálculo

Categorias Sugeridas para Análise

Dados Estatísticos e Comentários

Literatura relacionada

Ficha do indicador para o cientista de dados

Método de processamento de dados

Método de processamento analítico

Método de apresentação de dados

Método de análise matemática e estatística

Método de descoberta de conhecimento em bancos de dados (KDD)

Base de dados

Ver também

Ligações externas

Apêndice

Rastreabilidade

Nomenclatura Sugerida

Lista de indicadores

A Demográficos

B Sócioeconômicos

C Mortalidade

D Morbidade

E Recursos

F Cobertura

G Fatores de Risco e de Proteção

Menu de navegação

Indicador:Ficha de indicador

Introdução

Endereço eletrônico

Objetivo

Ficha do indicador para o sanitarista

Conceituação

Interpretação

Usos

Limitações

Fontes

Métodos de Cálculo

Categorias Sugeridas para Análise

Dados Estatísticos e Comentários

Literatura relacionada

Ficha do indicador para o cientista de dados

Método de processamento de dados

Método de processamento analítico

Método de apresentação de dados

Método de análise matemática e estatística

Método de descoberta de conhecimento em bancos de dados (KDD)

Base de dados

Ver também

Ligações externas

Apêndice

Rastreabilidade

Nomenclatura Sugerida

Lista de indicadores

A Demográficos

B Sócioeconômicos

C Mortalidade

D Morbidade

E Recursos

F Cobertura

G Fatores de Risco e de Proteção

Menu de navegação

Pesquisa