Página principal: mudanças entre as edições

De Wiki
Ir para navegação Ir para pesquisar
Sem resumo de edição
Linha 9: Linha 9:
* [https://www.mediawiki.org/wiki/Special:MyLanguage/Localisation#Translation_resources Traduza o MediaWiki para seu idioma]
* [https://www.mediawiki.org/wiki/Special:MyLanguage/Localisation#Translation_resources Traduza o MediaWiki para seu idioma]


h1. Nota técnica matriz de indicador
= Nota técnica matriz de indicador =
h2. Introdução
 
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [wiki Conass|https://wiki.conass.org.br] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
== Introdução ==
Segundo o [caderno verde|https://edisciplinas.usp.br/pluginfile.php/490669/mod_resource/content/1/RIPSA%20Indicadores%20basicos%20para%20a%20saude%20no%20Brasil.pdf] da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: *demográficos*, *socioeconômicos*, *mortalidade*, *morbidade* e *fatores de risco*, *recursos* e *cobertura*, onde cada indicador é caracterizado pela *denominação*, *conceituação*, *método de cálculo*, *categorias de análise* e *fontes de dados*.  
 
||subconjunto temático||sigla||descrição||pasta e marcador|
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
|Demográficos|A|Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida.|a_demografico|
 
|Sócioeconômicos|B|Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida.|b_socioeconomico|
Segundo o [https://edisciplinas.usp.br/pluginfile.php/490669/mod_resource/content/1/RIPSA%20Indicadores%20basicos%20para%20a%20saude%20no%20Brasil.pdf caderno verde] da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: '''demográficos''', '''socioeconômicos''', '''mortalidade''', '''morbidade''' e '''fatores de risco''', '''recursos''' e '''cobertura''', onde cada indicador é caracterizado pela '''denominação''', '''conceituação''', '''método de cálculo''', '''categorias de análise''' e '''fontes de dados'''.
|Mortalidade|C|Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida.|c_mortalidade|
 
|Morbidade|D|Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida.|d_morbidade|
{|
|Recursos|E|Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida.|e_recursos|
!width="9%"| subconjunto temático
|Cobertura|F|Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida.|f_cobertura|
!width="9%"| sigla
|Fatores de Risco e de Proteção|G|Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos.|g_fatores|
!width="9%"| descrição
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o *método de processamento de dados*, *método de processamento analítico*, *método de apresentação de dados*, *método de análise estatística* e o *método de descoberta de conhecimento em bancos de dados (KDD)*.
!width="9%"| pasta e marcador
As fichas foram, portanto segmentadas segundo o público, a saber, _sanitarista_ e _cientista de dados_.
|-
h3. Endereço eletrônico
| Demográficos
A presente nota técnica é acessível pelo endereço [https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md|https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md]
| A
h3. Objetivo
| Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida.
| a_demografico
|-
| Sócioeconômicos
| B
| Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida.
| b_socioeconomico
|-
| Mortalidade
| C
| Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida.
| c_mortalidade
|-
| Morbidade
| D
| Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida.
| d_morbidade
|-
| Recursos
| E
| Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida.
| e_recursos
|-
| Cobertura
| F
| Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida.
| f_cobertura
|-
| Fatores de Risco e de Proteção
| G
| Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos.
| g_fatores
|}
 
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o '''método de processamento de dados''', '''método de processamento analítico''', '''método de apresentação de dados''', '''método de análise estatística''' e o '''método de descoberta de conhecimento em bancos de dados (KDD)'''.
 
As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''.
 
=== Endereço eletrônico ===
 
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md
 
=== Objetivo ===
 
Pradronizar notas técnicas dos indicadores.
Pradronizar notas técnicas dos indicadores.
h2. Ficha do indicador para o sanitarista
 
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [Indicadores e Dados Básicos - Brasil (IDB)|http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm], bem como das [fichas da RIPSA|http://fichas.ripsa.org.br/2012/].
== Ficha do indicador para o sanitarista ==
h3. Conceituação
 
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA].
 
=== Conceituação ===
 
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
h3. Interpretação
 
=== Interpretação ===
 
Explicação sucinta do tipo de informação obtida e seu significado.
Explicação sucinta do tipo de informação obtida e seu significado.
h3. Usos
 
=== Usos ===
 
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
h3. Limitações
 
=== Limitações ===
 
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
h3. Fontes
 
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e
=== Fontes ===
pelos sistemas de informação a que correspondem.
 
h3. Métodos de Cálculo
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.
Fórmula utilizada para calcular o indicador, definindo os elementos que a
 
compõem.
=== Métodos de Cálculo ===
h3. Categorias Sugeridas para Análise
 
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.
 
=== Categorias Sugeridas para Análise ===
 
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
h3. Dados Estatísticos e Comentários
 
=== Dados Estatísticos e Comentários ===
 
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
h3. Literatura relacionada
 
Referências {{Scielo}} , {{Medline}} , {{GoogleScholar}} , {{EMBASE}} , etc, com as respectivas buscas estruturadas.
=== Literatura relacionada ===
h2. Ficha do indicador para o cientista de dados
 
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de _big data_ e soluções de aprendizado de máquina e inteligência artificial.
Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas.
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma _git_ e de acesso livre.
 
h3. Método de processamento de dados
== Ficha do indicador para o cientista de dados ==
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, {{mysql}} , {{postgreSQL}} , {{Oracle}} , etc. Se houver gerenciador de ETL, por exemplo, {{pentaho}}  ou {{informatica}} , detalhar os processos (_pipeline_).
 
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial.
 
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre.
 
=== Método de processamento de dados ===
 
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline'').
 
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm &quot;On-line Transaction Processing&quot;.
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm &quot;On-line Transaction Processing&quot;.
h3. Método de processamento analítico
 
=== Método de processamento analítico ===
 
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, &quot;On-line Analytical Processing&quot; como descrição das etapas de formação das tabelas de fato e dimensão.
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, &quot;On-line Analytical Processing&quot; como descrição das etapas de formação das tabelas de fato e dimensão.
A solução deve ser apontada, por exemplo, {{disk.frame}} , {{Hadoop}} , {{Spark}} , {{Parquet e RDS}} , {{Storm}} , {{Cassandra}} , {{RapidMiner}} , {{MongoDB}} , {{Neo4j}} , {{SAMOA}} , {{HPCC}} , {{greenplum}} , etc.
 
h3. Método de apresentação de dados
A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc.
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo {{R Shiny}} , {{metabase}} , {{Power BI}} , {{Tableau}} , {{Microstrategy}} , {{QlikView / Qlik Sense}} , {{DataStudio}} , {{SAS}} , {{Elastic/Kibana}} , etc.
 
h3. Método de análise matemática e estatística
=== Método de apresentação de dados ===
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como {{projeto R}} , {{python}} , {{matlab}} , {{scilab}} , {{Stata}} , {{SPSS}} , {{PSPP}} , {{Epiinfo}} , etc.
 
h3. Método de descoberta de conhecimento em bancos de dados (KDD)
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc.
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.  
 
É desejavel segmentar as tarefas segundo a modalidade *descritiva*, *preditiva* ou *prescritiva*.
=== Método de análise matemática e estatística ===
Exemplos de tipos de algoritmos são {{C4.5}} , {{Random Forest}} , {{K-mean Algorithm}} , {{Support Vector Machines SVM}} , {{Apriori Algorithm}} , {{Expectation-Maximization Algorithm}} , {{kNN}} , {{PCA}} , {{SVD}} .
 
h3. Base de dados
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc.
 
=== Método de descoberta de conhecimento em bancos de dados (KDD) ===
 
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
 
É desejavel segmentar as tarefas segundo a modalidade '''descritiva''', '''preditiva''' ou '''prescritiva'''.
 
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>.
 
=== Base de dados ===
 
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
h2. Apêndice
 
h3. Rastreabilidade
== Apêndice ==
||atributo||valor|
 
|Identificador|código sequencial da pri.td_indicador|
=== Rastreabilidade ===
|Código RIPSA||
 
|Nome RIPSA||
{|
|URL RIPSA|[http://fichas.ripsa.org.br/2007/|http://fichas.ripsa.org.br/2007/]|
! atributo
|tabela CIEGES||
! valor
h3. Nomenclatura Sugerida
|-
Sugere-se adotar a [Norma de padronização de nomenclatura (MAD)|https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/] do DATASUS, Ministério da Saúde.
| Identificador
Atenção ao nomear atributos e tabelas para evitar problemas
| código sequencial da pri.td_indicador
ao referência-las.
|-
Recomenda-se padronizar os atributos usando apenas letras minúsculas,
| Código RIPSA
sem espaços separando-se por _underline_  {{_}} .
|
 
|-
| Nome RIPSA
|
 
|-
| URL RIPSA
| http://fichas.ripsa.org.br/2007/
|-
| tabela CIEGES
|
 
|}
 
=== Nomenclatura Sugerida ===
 
Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde.
 
Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.
 
Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por ''underline'' <code>_</code>.
 
* Caracteres proibidos: @, #, ~, ^, &lt;, &gt;, =, !, espaço
* Caracteres proibidos: @, #, ~, ^, &lt;, &gt;, =, !, espaço
* Caracteres recomendados: de a a z de 0 a 9 e _underline_
* Caracteres recomendados: de a a z de 0 a 9 e ''underline''
* Caracteres não recomendados: ç, á, é, ã, â, espaço, etc
* Caracteres não recomendados: ç, á, é, ã, â, espaço, etc


Caso queria utilizar caracteres especiais ou espaço
Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No <code>PostgreSQL</code> é utilizada aspas duplas <code>&quot;</code>, enquanto no <code>MySQL</code> é utilizada crase ```.
você deve conhecer como o SGBD faz para identificar a referência à tabela
 
ou atributo. No {{PostgreSQL}}  é utilizada aspas duplas {{&quot;}} ,
enquanto no {{MySQL}}  é utilizada crase {{`}} .
Exemplos de prefixos para bancos e tabelas:
Exemplos de prefixos para bancos e tabelas:
* {{bd_}}  - banco de dados (por exemplo, {{bd_medicamento}} , {{bd_obito}} , {{bd_covid19}} ).
 
* {{td_}}  - tabela de dimensão ou domínio (por exemplo, {{td_cid10}} , {{td_municipio}} , {{td_estabelecimento}} ).
* <code>bd_</code> - banco de dados (por exemplo, <code>bd_medicamento</code>, <code>bd_obito</code>, <code>bd_covid19</code>).
* {{tf_}}  - tabela de fatos contendo transações (por exemplo, {{tf_dispensação}} , {{tf_notificacao_dengue}} ).
* <code>td_</code> - tabela de dimensão ou domínio (por exemplo, <code>td_cid10</code>, <code>td_municipio</code>, <code>td_estabelecimento</code>).
* {{tm_}}  - tabelas provisórias (por exemplo, {{tm_sia_am}} , {{tm_sia_aq}} ).
* <code>tf_</code> - tabela de fatos contendo transações (por exemplo, <code>tf_dispensação</code>, <code>tf_notificacao_dengue</code>).
* {{vw_}}  - tabela de fatos contendo visões de dados (por exemplo, {{vw_dispensação_homens}} , {{tf_notificacao_dengue_amazonas}} ).
* <code>tm_</code> - tabelas provisórias (por exemplo, <code>tm_sia_am</code>, <code>tm_sia_aq</code>).
* <code>vw_</code> - tabela de fatos contendo visões de dados (por exemplo, <code>vw_dispensação_homens</code>, <code>tf_notificacao_dengue_amazonas</code>).


Exemplos de prefixos para atributos:
Exemplos de prefixos para atributos:
* {{co_}}  - código (por exemplo, {{co_cid10}} , {{co_procedimento_sigtap}} ).
 
* {{co_seq_}}  - código sequencial (por exemplo, {{co_seq_usuario}} , {{co_seq_estabelecimento}} ).
* <code>co_</code> - código (por exemplo, <code>co_cid10</code>, <code>co_procedimento_sigtap</code>).
* {{dt_}}  - data (por exemplo, {{dt_nascimento}} , {{dt_dispensacao}} ).
* <code>co_seq_</code> - código sequencial (por exemplo, <code>co_seq_usuario</code>, <code>co_seq_estabelecimento</code>).
* {{no_}}  - nome (por exemplo, {{no_usuário_sus}} , {{no_trabalhador}} , {{no_equipamento}} ).
* <code>dt_</code> - data (por exemplo, <code>dt_nascimento</code>, <code>dt_dispensacao</code>).
* {{ds_}}  - descrição (por exemplo, {{ds_posologia}} , {{ds_relato_clinico}} ).
* <code>no_</code> - nome (por exemplo, <code>no_usuário_sus</code>, <code>no_trabalhador</code>, <code>no_equipamento</code>).
* {{qt_}}  - quantidade, usualmente, discreta (por exemplo, {{qt_comprimido}} , {{qt_area}} , {{qt_população}} ).
* <code>ds_</code> - descrição (por exemplo, <code>ds_posologia</code>, <code>ds_relato_clinico</code>).
* {{vl_}}  - valor, usualmente, passível de ser decimal (por exemplo, {{vl_gasto}} , {{vl_densidade_demografica}} ).
* <code>qt_</code> - quantidade, usualmente, discreta (por exemplo, <code>qt_comprimido</code>, <code>qt_area</code>, <code>qt_população</code>).
* {{nu_}}  - número, usualmente contado ou calculado (por exemplo, {{nu_idade}} ).
* <code>vl_</code> - valor, usualmente, passível de ser decimal (por exemplo, <code>vl_gasto</code>, <code>vl_densidade_demografica</code>).
* {{tx_}}  - taxa ou fração (por exemplo, {{tx_letalidade}} , {{tx_mortalidade}} ).
* <code>nu_</code> - número, usualmente contado ou calculado (por exemplo, <code>nu_idade</code>).
* {{st_}}  - situação ou status (por exemplo, {{st_ativo}} , {{st_gravida}} ).
* <code>tx_</code> - taxa ou fração (por exemplo, <code>tx_letalidade</code>, <code>tx_mortalidade</code>).
* {{sg_}}  - sigla (por exemplo, {{sg_faixa_etaria}} , {{sg_sexo}} ).
* <code>st_</code> - situação ou status (por exemplo, <code>st_ativo</code>, <code>st_gravida</code>).
* <code>sg_</code> - sigla (por exemplo, <code>sg_faixa_etaria</code>, <code>sg_sexo</code>).

Edição das 18h32min de 10 de janeiro de 2023

O MediaWiki foi instalado.

Consulte o Manual de Usuário para informações de como usar o software wiki.

Começando

Nota técnica matriz de indicador

Introdução

A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.

Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.

subconjunto temático sigla descrição pasta e marcador
Demográficos A Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. a_demografico
Sócioeconômicos B Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. b_socioeconomico
Mortalidade C Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. c_mortalidade
Morbidade D Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. d_morbidade
Recursos E Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. e_recursos
Cobertura F Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. f_cobertura
Fatores de Risco e de Proteção G Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. g_fatores

No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).

As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.

Endereço eletrônico

A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md

Objetivo

Pradronizar notas técnicas dos indicadores.

Ficha do indicador para o sanitarista

Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.

Conceituação

Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.

Interpretação

Explicação sucinta do tipo de informação obtida e seu significado.

Usos

Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.

Limitações

Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.

Fontes

Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.

Métodos de Cálculo

Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.

Categorias Sugeridas para Análise

Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.

Dados Estatísticos e Comentários

Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica

Literatura relacionada

Referências Scielo, Medline, GoogleScholar, EMBASE, etc, com as respectivas buscas estruturadas.

Ficha do indicador para o cientista de dados

O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.

A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.

Método de processamento de dados

Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql, postgreSQL, Oracle, etc. Se houver gerenciador de ETL, por exemplo, pentaho ou informatica, detalhar os processos (pipeline).

O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".

Método de processamento analítico

Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.

A solução deve ser apontada, por exemplo, disk.frame, Hadoop, Spark, Parquet e RDS, Storm, Cassandra, RapidMiner, MongoDB, Neo4j, SAMOA, HPCC, greenplum, etc.

Método de apresentação de dados

Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny, metabase, Power BI, Tableau, Microstrategy, QlikView / Qlik Sense, DataStudio, SAS, Elastic/Kibana, etc.

Método de análise matemática e estatística

Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R, python, matlab, scilab, Stata, SPSS, PSPP, Epiinfo, etc.

Método de descoberta de conhecimento em bancos de dados (KDD)

Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.

É desejavel segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.

Exemplos de tipos de algoritmos são C4.5, Random Forest, K-mean Algorithm, Support Vector Machines SVM, Apriori Algorithm, Expectation-Maximization Algorithm, kNN, PCA, SVD.

Base de dados

Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).

Apêndice

Rastreabilidade

atributo valor
Identificador código sequencial da pri.td_indicador
Código RIPSA
Nome RIPSA
URL RIPSA http://fichas.ripsa.org.br/2007/
tabela CIEGES

Nomenclatura Sugerida

Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.

Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _.

  • Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
  • Caracteres recomendados: de a a z de 0 a 9 e underline
  • Caracteres não recomendados: ç, á, é, ã, â, espaço, etc

Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL é utilizada aspas duplas ", enquanto no MySQL é utilizada crase ```.

Exemplos de prefixos para bancos e tabelas:

  • bd_ - banco de dados (por exemplo, bd_medicamento, bd_obito, bd_covid19).
  • td_ - tabela de dimensão ou domínio (por exemplo, td_cid10, td_municipio, td_estabelecimento).
  • tf_ - tabela de fatos contendo transações (por exemplo, tf_dispensação, tf_notificacao_dengue).
  • tm_ - tabelas provisórias (por exemplo, tm_sia_am, tm_sia_aq).
  • vw_ - tabela de fatos contendo visões de dados (por exemplo, vw_dispensação_homens, tf_notificacao_dengue_amazonas).

Exemplos de prefixos para atributos:

  • co_ - código (por exemplo, co_cid10, co_procedimento_sigtap).
  • co_seq_ - código sequencial (por exemplo, co_seq_usuario, co_seq_estabelecimento).
  • dt_ - data (por exemplo, dt_nascimento, dt_dispensacao).
  • no_ - nome (por exemplo, no_usuário_sus, no_trabalhador, no_equipamento).
  • ds_ - descrição (por exemplo, ds_posologia, ds_relato_clinico).
  • qt_ - quantidade, usualmente, discreta (por exemplo, qt_comprimido, qt_area, qt_população).
  • vl_ - valor, usualmente, passível de ser decimal (por exemplo, vl_gasto, vl_densidade_demografica).
  • nu_ - número, usualmente contado ou calculado (por exemplo, nu_idade).
  • tx_ - taxa ou fração (por exemplo, tx_letalidade, tx_mortalidade).
  • st_ - situação ou status (por exemplo, st_ativo, st_gravida).
  • sg_ - sigla (por exemplo, sg_faixa_etaria, sg_sexo).