Indicador:Ficha de indicador: mudanças entre as edições

De Wiki
Ir para navegação Ir para pesquisar
Sem resumo de edição
Sem resumo de edição
Linha 129: Linha 129:
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.


É desejavel segmentar as tarefas segundo a modalidade '''descritiva''', '''preditiva''' ou '''prescritiva'''.
É desejável segmentar as tarefas segundo a modalidade '''descritiva''', '''preditiva''' ou '''prescritiva'''.


Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>.
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>.
Linha 136: Linha 136:


Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
== Ver também ==
{{Div col}}
* [[Lei de Linus]]
* [[Citizendium]]
* [[Truth in Numbers: The Wikipedia Story|''A Verdade em Números: A História da Wikipédia'']]
* [[Wikipédia:A Wikipédia na academia]]
* [[Wikipédia:A Wikipédia na imprensa]]
* [[Delecionismo e inclusionismo na Wikipédia]]
* [[Wikipédia em português]]
{{Div col fim}}
{{Notas}}
{{Referências}}
== Ligações externas ==
{{Correlatos|título=Wikipédia|commons=Wikipedia|meta=Wikipedia|wikiquote=Wikipédia|wikinotíciascat=Wikipédia|wikidata=Q52|wikcionário=Wikipédia|media=Differences between Wikipedia, Wikimedia, MediaWiki, and wiki}}
* [http://www.wikipedia.org/ Portal multilíngue da Wikipédia]
* [https://web.archive.org/web/20110829015926/http://mobile.wikipedia.org/ Wikipédia móvel]
* {{Twitter|Wikipedia}}
* {{Facebook|Wikipedia}}
* {{Dmoz|Computers/Open_Source/Open_Content/Encyclopedias/Wikipedia}}


= Apêndice =
= Apêndice =
Linha 227: Linha 251:


=== G Fatores de Risco e de Proteção ===
=== G Fatores de Risco e de Proteção ===
{{Ficha}}
{{Indicador}}
{{Matriz}}
[[Categoria:Indicador| ]]
[[Categoria:Matriz]]

Edição das 11h19min de 11 de janeiro de 2023

Introdução

A presente nota técnica é uma matriz, isto é, um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.

Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.

subconjunto temático sigla descrição pasta e marcador
Demográficos A Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. a_demografico
Sócioeconômicos B Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. b_socioeconomico
Mortalidade C Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. c_mortalidade
Morbidade D Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. d_morbidade
Recursos E Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. e_recursos
Cobertura F Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. f_cobertura
Fatores de Risco e de Proteção G Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. g_fatores

No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).

As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.

Endereço eletrônico

A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md

Objetivo

Pradronizar notas técnicas dos indicadores.

Ficha do indicador para o sanitarista

Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.

Conceituação

Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.

Interpretação

Explicação sucinta do tipo de informação obtida e seu significado.

Usos

Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.

Limitações

Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.

Fontes

Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.

Métodos de Cálculo

Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.

Categorias Sugeridas para Análise

Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.

Dados Estatísticos e Comentários

Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica

Literatura relacionada

Referências Scielo, Medline, GoogleScholar, EMBASE, etc, com as respectivas buscas estruturadas.

Ficha do indicador para o cientista de dados

O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.

A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.

Método de processamento de dados

Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql, postgreSQL, Oracle, etc. Se houver gerenciador de ETL, por exemplo, pentaho ou informatica, detalhar os processos (pipeline).

O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".

Método de processamento analítico

Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.

A solução deve ser apontada, por exemplo, disk.frame, Hadoop, Spark, Parquet e RDS, Storm, Cassandra, RapidMiner, MongoDB, Neo4j, SAMOA, HPCC, greenplum, etc.

Método de apresentação de dados

Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny, metabase, Power BI, Tableau, Microstrategy, QlikView / Qlik Sense, DataStudio, SAS, Elastic/Kibana, etc.

Método de análise matemática e estatística

Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R, python, matlab, scilab, Stata, SPSS, PSPP, Epiinfo, etc.

Método de descoberta de conhecimento em bancos de dados (KDD)

Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.

É desejável segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.

Exemplos de tipos de algoritmos são C4.5, Random Forest, K-mean Algorithm, Support Vector Machines SVM, Apriori Algorithm, Expectation-Maximization Algorithm, kNN, PCA, SVD.

Base de dados

Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).


Ver também

Predefinição:Div col

Predefinição:Div col fim

Predefinição:Notas Predefinição:Referências

Ligações externas

Predefinição:Correlatos

Apêndice

Rastreabilidade

atributo valor
Identificador código sequencial da pri.td_indicador
Código RIPSA
Nome RIPSA
URL RIPSA http://fichas.ripsa.org.br/2007/
tabela CIEGES

Nomenclatura Sugerida

Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.

Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _.

  • Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
  • Caracteres recomendados: de a a z de 0 a 9 e underline
  • Caracteres não recomendados: ç, á, é, ã, â, espaço, etc

Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL é utilizada aspas duplas ", enquanto no MySQL é utilizada crase ```.

Exemplos de prefixos para bancos e tabelas:

  • bd_ - banco de dados (por exemplo, bd_medicamento, bd_obito, bd_covid19).
  • td_ - tabela de dimensão ou domínio (por exemplo, td_cid10, td_municipio, td_estabelecimento).
  • tf_ - tabela de fatos contendo transações (por exemplo, tf_dispensação, tf_notificacao_dengue).
  • tm_ - tabelas provisórias (por exemplo, tm_sia_am, tm_sia_aq).
  • vw_ - tabela de fatos contendo visões de dados (por exemplo, vw_dispensação_homens, tf_notificacao_dengue_amazonas).

Exemplos de prefixos para atributos:

  • co_ - código (por exemplo, co_cid10, co_procedimento_sigtap).
  • co_seq_ - código sequencial (por exemplo, co_seq_usuario, co_seq_estabelecimento).
  • dt_ - data (por exemplo, dt_nascimento, dt_dispensacao).
  • no_ - nome (por exemplo, no_usuário_sus, no_trabalhador, no_equipamento).
  • ds_ - descrição (por exemplo, ds_posologia, ds_relato_clinico).
  • qt_ - quantidade, usualmente, discreta (por exemplo, qt_comprimido, qt_area, qt_população).
  • vl_ - valor, usualmente, passível de ser decimal (por exemplo, vl_gasto, vl_densidade_demografica).
  • nu_ - número, usualmente contado ou calculado (por exemplo, nu_idade).
  • tx_ - taxa ou fração (por exemplo, tx_letalidade, tx_mortalidade).
  • st_ - situação ou status (por exemplo, st_ativo, st_gravida).
  • sg_ - sigla (por exemplo, sg_faixa_etaria, sg_sexo).

Lista de indicadores

A Demográficos

População ao ano

B Sócioeconômicos

C Mortalidade

Taxa de Mortalidade Infantil (TMI)

Taxa de mortalidade neonatal precoce

Taxa de mortalidade neonatal tardia

Taxa de mortalidade pós-neonatal

Taxa de mortalidade na infância

D Morbidade

E Recursos

F Cobertura

G Fatores de Risco e de Proteção

Predefinição:Ficha Predefinição:Indicador Predefinição:Matriz