Indicador:Ficha de indicador: mudanças entre as edições
(Criou página com '= Nota técnica matriz de indicador = == Introdução == A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão. Segundo o [https://edisciplinas.usp.br/pluginfile.php/490669/mod_resource/content/1/RIPSA%20Indicadores%20basicos%20para%20a%20saude%20no%20Brasil.pdf caderno verde] da Rede Interagencial de Inf...') |
Sem resumo de edição |
||
Linha 1: | Linha 1: | ||
= Introdução = | |||
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão. | A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão. | ||
Linha 53: | Linha 51: | ||
As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''. | As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''. | ||
== Endereço eletrônico == | |||
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md | A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md | ||
== Objetivo == | |||
Pradronizar notas técnicas dos indicadores. | Pradronizar notas técnicas dos indicadores. | ||
= Ficha do indicador para o sanitarista = | |||
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA]. | Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA]. | ||
== Conceituação == | |||
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo. | Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo. | ||
== Interpretação == | |||
Explicação sucinta do tipo de informação obtida e seu significado. | Explicação sucinta do tipo de informação obtida e seu significado. | ||
== Usos == | |||
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador. | Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador. | ||
== Limitações == | |||
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas. | Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas. | ||
== Fontes == | |||
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem. | Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem. | ||
== Métodos de Cálculo == | |||
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem. | Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem. | ||
== Categorias Sugeridas para Análise == | |||
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis. | Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis. | ||
== Dados Estatísticos e Comentários == | |||
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica | Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica | ||
== Literatura relacionada == | |||
Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas. | Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas. | ||
= Ficha do indicador para o cientista de dados = | |||
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial. | O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial. | ||
Linha 107: | Linha 105: | ||
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre. | A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre. | ||
== Método de processamento de dados == | |||
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline''). | Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline''). | ||
Linha 113: | Linha 111: | ||
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing". | O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing". | ||
== Método de processamento analítico == | |||
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão. | Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão. | ||
Linha 119: | Linha 117: | ||
A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc. | A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc. | ||
== Método de apresentação de dados == | |||
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc. | Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc. | ||
== Método de análise matemática e estatística == | |||
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc. | Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc. | ||
== Método de descoberta de conhecimento em bancos de dados (KDD) == | |||
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc. | Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc. | ||
Linha 135: | Linha 133: | ||
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>. | Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>. | ||
== Base de dados == | |||
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface). | Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface). | ||
= Apêndice = | |||
== Rastreabilidade == | |||
{| | {| | ||
Linha 166: | Linha 164: | ||
|} | |} | ||
== Nomenclatura Sugerida == | |||
Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde. | Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde. |
Edição das 20h08min de 10 de janeiro de 2023
Introdução
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.
subconjunto temático | sigla | descrição | pasta e marcador |
---|---|---|---|
Demográficos | A | Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. | a_demografico |
Sócioeconômicos | B | Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. | b_socioeconomico |
Mortalidade | C | Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. | c_mortalidade |
Morbidade | D | Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. | d_morbidade |
Recursos | E | Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. | e_recursos |
Cobertura | F | Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. | f_cobertura |
Fatores de Risco e de Proteção | G | Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. | g_fatores |
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).
As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.
Endereço eletrônico
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md
Objetivo
Pradronizar notas técnicas dos indicadores.
Ficha do indicador para o sanitarista
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.
Conceituação
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
Interpretação
Explicação sucinta do tipo de informação obtida e seu significado.
Usos
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
Limitações
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
Fontes
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.
Métodos de Cálculo
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.
Categorias Sugeridas para Análise
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
Dados Estatísticos e Comentários
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
Literatura relacionada
Referências Scielo
, Medline
, GoogleScholar
, EMBASE
, etc, com as respectivas buscas estruturadas.
Ficha do indicador para o cientista de dados
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.
Método de processamento de dados
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql
, postgreSQL
, Oracle
, etc. Se houver gerenciador de ETL, por exemplo, pentaho
ou informatica
, detalhar os processos (pipeline).
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".
Método de processamento analítico
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.
A solução deve ser apontada, por exemplo, disk.frame
, Hadoop
, Spark
, Parquet e RDS
, Storm
, Cassandra
, RapidMiner
, MongoDB
, Neo4j
, SAMOA
, HPCC
, greenplum
, etc.
Método de apresentação de dados
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny
, metabase
, Power BI
, Tableau
, Microstrategy
, QlikView / Qlik Sense
, DataStudio
, SAS
, Elastic/Kibana
, etc.
Método de análise matemática e estatística
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R
, python
, matlab
, scilab
, Stata
, SPSS
, PSPP
, Epiinfo
, etc.
Método de descoberta de conhecimento em bancos de dados (KDD)
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
É desejavel segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.
Exemplos de tipos de algoritmos são C4.5
, Random Forest
, K-mean Algorithm
, Support Vector Machines SVM
, Apriori Algorithm
, Expectation-Maximization Algorithm
, kNN
, PCA
, SVD
.
Base de dados
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Apêndice
Rastreabilidade
atributo | valor |
---|---|
Identificador | código sequencial da pri.td_indicador |
Código RIPSA | |
Nome RIPSA | |
URL RIPSA | http://fichas.ripsa.org.br/2007/ |
tabela CIEGES |
Nomenclatura Sugerida
Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.
Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.
Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _
.
- Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
- Caracteres recomendados: de a a z de 0 a 9 e underline
- Caracteres não recomendados: ç, á, é, ã, â, espaço, etc
Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL
é utilizada aspas duplas "
, enquanto no MySQL
é utilizada crase ```.
Exemplos de prefixos para bancos e tabelas:
bd_
- banco de dados (por exemplo,bd_medicamento
,bd_obito
,bd_covid19
).td_
- tabela de dimensão ou domínio (por exemplo,td_cid10
,td_municipio
,td_estabelecimento
).tf_
- tabela de fatos contendo transações (por exemplo,tf_dispensação
,tf_notificacao_dengue
).tm_
- tabelas provisórias (por exemplo,tm_sia_am
,tm_sia_aq
).vw_
- tabela de fatos contendo visões de dados (por exemplo,vw_dispensação_homens
,tf_notificacao_dengue_amazonas
).
Exemplos de prefixos para atributos:
co_
- código (por exemplo,co_cid10
,co_procedimento_sigtap
).co_seq_
- código sequencial (por exemplo,co_seq_usuario
,co_seq_estabelecimento
).dt_
- data (por exemplo,dt_nascimento
,dt_dispensacao
).no_
- nome (por exemplo,no_usuário_sus
,no_trabalhador
,no_equipamento
).ds_
- descrição (por exemplo,ds_posologia
,ds_relato_clinico
).qt_
- quantidade, usualmente, discreta (por exemplo,qt_comprimido
,qt_area
,qt_população
).vl_
- valor, usualmente, passível de ser decimal (por exemplo,vl_gasto
,vl_densidade_demografica
).nu_
- número, usualmente contado ou calculado (por exemplo,nu_idade
).tx_
- taxa ou fração (por exemplo,tx_letalidade
,tx_mortalidade
).st_
- situação ou status (por exemplo,st_ativo
,st_gravida
).sg_
- sigla (por exemplo,sg_faixa_etaria
,sg_sexo
).