Introdução

A presente nota técnica é uma matriz, isto é, um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.

Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.

subconjunto temático	sigla	descrição	pasta e marcador
Demográficos	A	Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida.	a_demografico
Sócioeconômicos	B	Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida.	b_socioeconomico
Mortalidade	C	Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida.	c_mortalidade
Morbidade	D	Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida.	d_morbidade
Recursos	E	Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida.	e_recursos
Cobertura	F	Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida.	f_cobertura
Fatores de Risco e de Proteção	G	Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos.	g_fatores

No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).

As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.

Endereço eletrônico

A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md

Objetivo

Pradronizar notas técnicas dos indicadores.

Ficha do indicador para o sanitarista

Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.

Conceituação

Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.

Interpretação

Explicação sucinta do tipo de informação obtida e seu significado.

Usos

Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.

Limitações

Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.

Fontes

Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.

Métodos de Cálculo

Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.

Categorias Sugeridas para Análise

Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.

Dados Estatísticos e Comentários

Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica

Literatura relacionada

Referências Scielo, Medline, GoogleScholar, EMBASE, etc, com as respectivas buscas estruturadas.

Ficha do indicador para o cientista de dados

O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.

A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.

Método de processamento de dados

Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql, postgreSQL, Oracle, etc. Se houver gerenciador de ETL, por exemplo, pentaho ou informatica, detalhar os processos (pipeline).

O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".

Método de processamento analítico

Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.

A solução deve ser apontada, por exemplo, disk.frame, Hadoop, Spark, Parquet e RDS, Storm, Cassandra, RapidMiner, MongoDB, Neo4j, SAMOA, HPCC, greenplum, etc.

Método de apresentação de dados

Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny, metabase, Power BI, Tableau, Microstrategy, QlikView / Qlik Sense, DataStudio, SAS, Elastic/Kibana, etc.

Método de análise matemática e estatística

Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R, python, matlab, scilab, Stata, SPSS, PSPP, Epiinfo, etc.

Método de descoberta de conhecimento em bancos de dados (KDD)

Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.

É desejavel segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.

Exemplos de tipos de algoritmos são C4.5, Random Forest, K-mean Algorithm, Support Vector Machines SVM, Apriori Algorithm, Expectation-Maximization Algorithm, kNN, PCA, SVD.

Base de dados

Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).

Apêndice

Rastreabilidade

atributo	valor
Identificador	código sequencial da pri.td_indicador
Código RIPSA
Nome RIPSA
URL RIPSA	http://fichas.ripsa.org.br/2007/
tabela CIEGES

Nomenclatura Sugerida

Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.

Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _.

Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
Caracteres recomendados: de a a z de 0 a 9 e underline
Caracteres não recomendados: ç, á, é, ã, â, espaço, etc

Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL é utilizada aspas duplas ", enquanto no MySQL é utilizada crase ```.

Exemplos de prefixos para bancos e tabelas:

bd_ - banco de dados (por exemplo, bd_medicamento, bd_obito, bd_covid19).
td_ - tabela de dimensão ou domínio (por exemplo, td_cid10, td_municipio, td_estabelecimento).
tf_ - tabela de fatos contendo transações (por exemplo, tf_dispensação, tf_notificacao_dengue).
tm_ - tabelas provisórias (por exemplo, tm_sia_am, tm_sia_aq).
vw_ - tabela de fatos contendo visões de dados (por exemplo, vw_dispensação_homens, tf_notificacao_dengue_amazonas).

Exemplos de prefixos para atributos:

co_ - código (por exemplo, co_cid10, co_procedimento_sigtap).
co_seq_ - código sequencial (por exemplo, co_seq_usuario, co_seq_estabelecimento).
dt_ - data (por exemplo, dt_nascimento, dt_dispensacao).
no_ - nome (por exemplo, no_usuário_sus, no_trabalhador, no_equipamento).
ds_ - descrição (por exemplo, ds_posologia, ds_relato_clinico).
qt_ - quantidade, usualmente, discreta (por exemplo, qt_comprimido, qt_area, qt_população).
vl_ - valor, usualmente, passível de ser decimal (por exemplo, vl_gasto, vl_densidade_demografica).
nu_ - número, usualmente contado ou calculado (por exemplo, nu_idade).
tx_ - taxa ou fração (por exemplo, tx_letalidade, tx_mortalidade).
st_ - situação ou status (por exemplo, st_ativo, st_gravida).
sg_ - sigla (por exemplo, sg_faixa_etaria, sg_sexo).

Lista de indicadores

Indicador:Taxa de Mortalidade Infantil (TMI)

Indicador:Taxa de mortalidade neonatal precoce

Indicador:Taxa de mortalidade neonatal tardia

Indicador:Ficha de indicador

Índice

Introdução

Endereço eletrônico

Objetivo

Ficha do indicador para o sanitarista

Conceituação

Interpretação

Usos

Limitações

Fontes

Métodos de Cálculo

Categorias Sugeridas para Análise

Dados Estatísticos e Comentários

Literatura relacionada

Ficha do indicador para o cientista de dados

Método de processamento de dados

Método de processamento analítico

Método de apresentação de dados

Método de análise matemática e estatística

Método de descoberta de conhecimento em bancos de dados (KDD)

Base de dados

Apêndice

Rastreabilidade

Nomenclatura Sugerida

Lista de indicadores

Menu de navegação

Indicador:Ficha de indicador

Introdução

Endereço eletrônico

Objetivo

Ficha do indicador para o sanitarista

Conceituação

Interpretação

Usos

Limitações

Fontes

Métodos de Cálculo

Categorias Sugeridas para Análise

Dados Estatísticos e Comentários

Literatura relacionada

Ficha do indicador para o cientista de dados

Método de processamento de dados

Método de processamento analítico

Método de apresentação de dados

Método de análise matemática e estatística

Método de descoberta de conhecimento em bancos de dados (KDD)

Base de dados

Apêndice

Rastreabilidade

Nomenclatura Sugerida

Lista de indicadores

Menu de navegação

Pesquisa