Indicador:Ficha de indicador
Introdução
A presente nota técnica é uma matriz, isto é, um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.
subconjunto temático | sigla | descrição | pasta e marcador | |
---|---|---|---|---|
Demográficos | A | Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. | a_demografico | |
Sócioeconômicos | B | Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. | b_socioeconomico | |
Mortalidade | C | Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. | c_mortalidade | |
Morbidade | D | Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. | d_morbidade | |
Recursos | E | Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. | e_recursos | |
Cobertura | F | Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. | f_cobertura |
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).
As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.
Endereço eletrônico
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md
Objetivo
Pradronizar notas técnicas dos indicadores.
Ficha do indicador para o sanitarista
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.
Conceituação
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
Interpretação
Explicação sucinta do tipo de informação obtida e seu significado.
Usos
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
Limitações
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
Fontes
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.
Métodos de Cálculo
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.
Categorias Sugeridas para Análise
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
Dados Estatísticos e Comentários
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
Literatura relacionada
Referências Scielo
, Medline
, GoogleScholar
, EMBASE
, etc, com as respectivas buscas estruturadas.
Ficha do indicador para o cientista de dados
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.
Método de processamento de dados
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql
, postgreSQL
, Oracle
, etc. Se houver gerenciador de ETL, por exemplo, pentaho
ou informatica
, detalhar os processos (pipeline).
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".
Método de processamento analítico
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.
A solução deve ser apontada, por exemplo, disk.frame
, Hadoop
, Spark
, Parquet e RDS
, Storm
, Cassandra
, RapidMiner
, MongoDB
, Neo4j
, SAMOA
, HPCC
, greenplum
, etc.
Método de apresentação de dados
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny
, metabase
, Power BI
, Tableau
, Microstrategy
, QlikView / Qlik Sense
, DataStudio
, SAS
, Elastic/Kibana
, etc.
Método de análise matemática e estatística
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R
, python
, matlab
, scilab
, Stata
, SPSS
, PSPP
, Epiinfo
, etc.
Método de descoberta de conhecimento em bancos de dados (KDD)
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
É desejável segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.
Exemplos de tipos de algoritmos são C4.5
, Random Forest
, K-mean Algorithm
, Support Vector Machines SVM
, Apriori Algorithm
, Expectation-Maximization Algorithm
, kNN
, PCA
, SVD
.
Base de dados
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Ver também
- Lei de Linus
- Citizendium
- A Verdade em Números: A História da Wikipédia
- Wikipédia:A Wikipédia na academia
- Wikipédia:A Wikipédia na imprensa
- Delecionismo e inclusionismo na Wikipédia
- Wikipédia em português
Predefinição:Notas Predefinição:Referências
Ligações externas
- Portal multilíngue da Wikipédia
- Wikipédia móvel
- Predefinição:Twitter
- Predefinição:Facebook
- Predefinição:Dmoz
Apêndice
Rastreabilidade
atributo | valor |
---|---|
Identificador | código sequencial da pri.td_indicador |
Código RIPSA | |
Nome RIPSA | |
URL RIPSA | http://fichas.ripsa.org.br/2007/ |
tabela CIEGES |
Nomenclatura Sugerida
Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.
Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.
Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _
.
- Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
- Caracteres recomendados: de a a z de 0 a 9 e underline
- Caracteres não recomendados: ç, á, é, ã, â, espaço, etc
Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL
é utilizada aspas duplas "
, enquanto no MySQL
é utilizada crase ```.
Exemplos de prefixos para bancos e tabelas:
bd_
- banco de dados (por exemplo,bd_medicamento
,bd_obito
,bd_covid19
).td_
- tabela de dimensão ou domínio (por exemplo,td_cid10
,td_municipio
,td_estabelecimento
).tf_
- tabela de fatos contendo transações (por exemplo,tf_dispensação
,tf_notificacao_dengue
).tm_
- tabelas provisórias (por exemplo,tm_sia_am
,tm_sia_aq
).vw_
- tabela de fatos contendo visões de dados (por exemplo,vw_dispensação_homens
,tf_notificacao_dengue_amazonas
).
Exemplos de prefixos para atributos:
co_
- código (por exemplo,co_cid10
,co_procedimento_sigtap
).co_seq_
- código sequencial (por exemplo,co_seq_usuario
,co_seq_estabelecimento
).dt_
- data (por exemplo,dt_nascimento
,dt_dispensacao
).no_
- nome (por exemplo,no_usuário_sus
,no_trabalhador
,no_equipamento
).ds_
- descrição (por exemplo,ds_posologia
,ds_relato_clinico
).qt_
- quantidade, usualmente, discreta (por exemplo,qt_comprimido
,qt_area
,qt_população
).vl_
- valor, usualmente, passível de ser decimal (por exemplo,vl_gasto
,vl_densidade_demografica
).nu_
- número, usualmente contado ou calculado (por exemplo,nu_idade
).tx_
- taxa ou fração (por exemplo,tx_letalidade
,tx_mortalidade
).st_
- situação ou status (por exemplo,st_ativo
,st_gravida
).sg_
- sigla (por exemplo,sg_faixa_etaria
,sg_sexo
).
Lista de indicadores
A Demográficos
B Sócioeconômicos
C Mortalidade
Taxa de Mortalidade Infantil (TMI)
Taxa de mortalidade neonatal precoce
Taxa de mortalidade neonatal tardia
Taxa de mortalidade pós-neonatal
Taxa de mortalidade na infância
D Morbidade
E Recursos
F Cobertura
G Fatores de Risco e de Proteção
Predefinição:Ficha Predefinição:Indicador Predefinição:Matriz