Indicador:Ficha de indicador: mudanças entre as edições

De Wiki
Ir para navegação Ir para pesquisar
(Criou página com '= Nota técnica matriz de indicador = == Introdução == A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão. Segundo o [https://edisciplinas.usp.br/pluginfile.php/490669/mod_resource/content/1/RIPSA%20Indicadores%20basicos%20para%20a%20saude%20no%20Brasil.pdf caderno verde] da Rede Interagencial de Inf...')
 
Sem resumo de edição
Linha 1: Linha 1:
= Nota técnica matriz de indicador =
= Introdução =
 
== Introdução ==


A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
Linha 53: Linha 51:
As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''.
As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''.


=== Endereço eletrônico ===
== Endereço eletrônico ==


A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md


=== Objetivo ===
== Objetivo ==


Pradronizar notas técnicas dos indicadores.
Pradronizar notas técnicas dos indicadores.


== Ficha do indicador para o sanitarista ==
= Ficha do indicador para o sanitarista =


Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA].
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA].


=== Conceituação ===
== Conceituação ==


Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.


=== Interpretação ===
== Interpretação ==


Explicação sucinta do tipo de informação obtida e seu significado.
Explicação sucinta do tipo de informação obtida e seu significado.


=== Usos ===
== Usos ==


Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.


=== Limitações ===
== Limitações ==


Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.


=== Fontes ===
== Fontes ==


Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.


=== Métodos de Cálculo ===
== Métodos de Cálculo ==


Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.


=== Categorias Sugeridas para Análise ===
== Categorias Sugeridas para Análise ==


Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.


=== Dados Estatísticos e Comentários ===
== Dados Estatísticos e Comentários ==


Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica


=== Literatura relacionada ===
== Literatura relacionada ==


Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas.
Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas.


== Ficha do indicador para o cientista de dados ==
= Ficha do indicador para o cientista de dados =


O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial.
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial.
Linha 107: Linha 105:
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre.
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre.


=== Método de processamento de dados ===
== Método de processamento de dados ==


Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline'').
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline'').
Linha 113: Linha 111:
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm &quot;On-line Transaction Processing&quot;.
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm &quot;On-line Transaction Processing&quot;.


=== Método de processamento analítico ===
== Método de processamento analítico ==


Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, &quot;On-line Analytical Processing&quot; como descrição das etapas de formação das tabelas de fato e dimensão.
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, &quot;On-line Analytical Processing&quot; como descrição das etapas de formação das tabelas de fato e dimensão.
Linha 119: Linha 117:
A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc.
A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc.


=== Método de apresentação de dados ===
== Método de apresentação de dados ==


Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc.
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc.


=== Método de análise matemática e estatística ===
== Método de análise matemática e estatística ==


Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc.
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc.


=== Método de descoberta de conhecimento em bancos de dados (KDD) ===
== Método de descoberta de conhecimento em bancos de dados (KDD) ==


Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
Linha 135: Linha 133:
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>.
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>.


=== Base de dados ===
== Base de dados ==


Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).


== Apêndice ==
= Apêndice =


=== Rastreabilidade ===
== Rastreabilidade ==


{|
{|
Linha 166: Linha 164:
|}
|}


=== Nomenclatura Sugerida ===
== Nomenclatura Sugerida ==


Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde.
Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde.

Edição das 20h08min de 10 de janeiro de 2023

Introdução

A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.

Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.

subconjunto temático sigla descrição pasta e marcador
Demográficos A Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. a_demografico
Sócioeconômicos B Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. b_socioeconomico
Mortalidade C Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. c_mortalidade
Morbidade D Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. d_morbidade
Recursos E Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. e_recursos
Cobertura F Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. f_cobertura
Fatores de Risco e de Proteção G Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. g_fatores

No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).

As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.

Endereço eletrônico

A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md

Objetivo

Pradronizar notas técnicas dos indicadores.

Ficha do indicador para o sanitarista

Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.

Conceituação

Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.

Interpretação

Explicação sucinta do tipo de informação obtida e seu significado.

Usos

Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.

Limitações

Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.

Fontes

Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.

Métodos de Cálculo

Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.

Categorias Sugeridas para Análise

Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.

Dados Estatísticos e Comentários

Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica

Literatura relacionada

Referências Scielo, Medline, GoogleScholar, EMBASE, etc, com as respectivas buscas estruturadas.

Ficha do indicador para o cientista de dados

O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.

A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.

Método de processamento de dados

Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql, postgreSQL, Oracle, etc. Se houver gerenciador de ETL, por exemplo, pentaho ou informatica, detalhar os processos (pipeline).

O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".

Método de processamento analítico

Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.

A solução deve ser apontada, por exemplo, disk.frame, Hadoop, Spark, Parquet e RDS, Storm, Cassandra, RapidMiner, MongoDB, Neo4j, SAMOA, HPCC, greenplum, etc.

Método de apresentação de dados

Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny, metabase, Power BI, Tableau, Microstrategy, QlikView / Qlik Sense, DataStudio, SAS, Elastic/Kibana, etc.

Método de análise matemática e estatística

Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R, python, matlab, scilab, Stata, SPSS, PSPP, Epiinfo, etc.

Método de descoberta de conhecimento em bancos de dados (KDD)

Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.

É desejavel segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.

Exemplos de tipos de algoritmos são C4.5, Random Forest, K-mean Algorithm, Support Vector Machines SVM, Apriori Algorithm, Expectation-Maximization Algorithm, kNN, PCA, SVD.

Base de dados

Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).

Apêndice

Rastreabilidade

atributo valor
Identificador código sequencial da pri.td_indicador
Código RIPSA
Nome RIPSA
URL RIPSA http://fichas.ripsa.org.br/2007/
tabela CIEGES

Nomenclatura Sugerida

Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.

Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _.

  • Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
  • Caracteres recomendados: de a a z de 0 a 9 e underline
  • Caracteres não recomendados: ç, á, é, ã, â, espaço, etc

Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL é utilizada aspas duplas ", enquanto no MySQL é utilizada crase ```.

Exemplos de prefixos para bancos e tabelas:

  • bd_ - banco de dados (por exemplo, bd_medicamento, bd_obito, bd_covid19).
  • td_ - tabela de dimensão ou domínio (por exemplo, td_cid10, td_municipio, td_estabelecimento).
  • tf_ - tabela de fatos contendo transações (por exemplo, tf_dispensação, tf_notificacao_dengue).
  • tm_ - tabelas provisórias (por exemplo, tm_sia_am, tm_sia_aq).
  • vw_ - tabela de fatos contendo visões de dados (por exemplo, vw_dispensação_homens, tf_notificacao_dengue_amazonas).

Exemplos de prefixos para atributos:

  • co_ - código (por exemplo, co_cid10, co_procedimento_sigtap).
  • co_seq_ - código sequencial (por exemplo, co_seq_usuario, co_seq_estabelecimento).
  • dt_ - data (por exemplo, dt_nascimento, dt_dispensacao).
  • no_ - nome (por exemplo, no_usuário_sus, no_trabalhador, no_equipamento).
  • ds_ - descrição (por exemplo, ds_posologia, ds_relato_clinico).
  • qt_ - quantidade, usualmente, discreta (por exemplo, qt_comprimido, qt_area, qt_população).
  • vl_ - valor, usualmente, passível de ser decimal (por exemplo, vl_gasto, vl_densidade_demografica).
  • nu_ - número, usualmente contado ou calculado (por exemplo, nu_idade).
  • tx_ - taxa ou fração (por exemplo, tx_letalidade, tx_mortalidade).
  • st_ - situação ou status (por exemplo, st_ativo, st_gravida).
  • sg_ - sigla (por exemplo, sg_faixa_etaria, sg_sexo).