Página principal: mudanças entre as edições
Sem resumo de edição |
|||
Linha 9: | Linha 9: | ||
* [https://www.mediawiki.org/wiki/Special:MyLanguage/Localisation#Translation_resources Traduza o MediaWiki para seu idioma] | * [https://www.mediawiki.org/wiki/Special:MyLanguage/Localisation#Translation_resources Traduza o MediaWiki para seu idioma] | ||
= Nota técnica matriz de indicador = | |||
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [ | == Introdução == | ||
Segundo o [ | |||
||subconjunto temático | A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no [https://wiki.conass.org.br wiki Conass] que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão. | ||
|Demográficos|A|Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida.|a_demografico| | |||
|Sócioeconômicos|B|Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida.|b_socioeconomico| | Segundo o [https://edisciplinas.usp.br/pluginfile.php/490669/mod_resource/content/1/RIPSA%20Indicadores%20basicos%20para%20a%20saude%20no%20Brasil.pdf caderno verde] da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: '''demográficos''', '''socioeconômicos''', '''mortalidade''', '''morbidade''' e '''fatores de risco''', '''recursos''' e '''cobertura''', onde cada indicador é caracterizado pela '''denominação''', '''conceituação''', '''método de cálculo''', '''categorias de análise''' e '''fontes de dados'''. | ||
|Mortalidade|C|Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida.|c_mortalidade| | |||
|Morbidade|D|Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida.|d_morbidade| | {| | ||
|Recursos|E|Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida.|e_recursos| | !width="9%"| subconjunto temático | ||
|Cobertura|F|Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida.|f_cobertura| | !width="9%"| sigla | ||
|Fatores de Risco e de Proteção|G|Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos.|g_fatores| | !width="9%"| descrição | ||
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o | !width="9%"| pasta e marcador | ||
As fichas foram, portanto segmentadas segundo o público, a saber, | |- | ||
| Demográficos | |||
A presente nota técnica é acessível pelo endereço | | A | ||
| Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. | |||
| a_demografico | |||
|- | |||
| Sócioeconômicos | |||
| B | |||
| Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. | |||
| b_socioeconomico | |||
|- | |||
| Mortalidade | |||
| C | |||
| Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. | |||
| c_mortalidade | |||
|- | |||
| Morbidade | |||
| D | |||
| Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. | |||
| d_morbidade | |||
|- | |||
| Recursos | |||
| E | |||
| Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. | |||
| e_recursos | |||
|- | |||
| Cobertura | |||
| F | |||
| Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. | |||
| f_cobertura | |||
|- | |||
| Fatores de Risco e de Proteção | |||
| G | |||
| Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. | |||
| g_fatores | |||
|} | |||
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o '''método de processamento de dados''', '''método de processamento analítico''', '''método de apresentação de dados''', '''método de análise estatística''' e o '''método de descoberta de conhecimento em bancos de dados (KDD)'''. | |||
As fichas foram, portanto segmentadas segundo o público, a saber, ''sanitarista'' e ''cientista de dados''. | |||
=== Endereço eletrônico === | |||
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md | |||
=== Objetivo === | |||
Pradronizar notas técnicas dos indicadores. | Pradronizar notas técnicas dos indicadores. | ||
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [ | == Ficha do indicador para o sanitarista == | ||
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos [http://tabnet.datasus.gov.br/cgi/idb2012/apresent.htm Indicadores e Dados Básicos - Brasil (IDB)], bem como das [http://fichas.ripsa.org.br/2012/ fichas da RIPSA]. | |||
=== Conceituação === | |||
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo. | Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo. | ||
=== Interpretação === | |||
Explicação sucinta do tipo de informação obtida e seu significado. | Explicação sucinta do tipo de informação obtida e seu significado. | ||
=== Usos === | |||
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador. | Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador. | ||
=== Limitações === | |||
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas. | Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas. | ||
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e | === Fontes === | ||
pelos sistemas de informação a que correspondem. | |||
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem. | |||
Fórmula utilizada para calcular o indicador, definindo os elementos que a | |||
compõem. | === Métodos de Cálculo === | ||
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem. | |||
=== Categorias Sugeridas para Análise === | |||
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis. | Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis. | ||
=== Dados Estatísticos e Comentários === | |||
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica | Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica | ||
Referências | === Literatura relacionada === | ||
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de | Referências <code>Scielo</code>, <code>Medline</code>, <code>GoogleScholar</code>, <code>EMBASE</code>, etc, com as respectivas buscas estruturadas. | ||
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma | |||
== Ficha do indicador para o cientista de dados == | |||
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, | |||
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de ''big data'' e soluções de aprendizado de máquina e inteligência artificial. | |||
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma ''git'' e de acesso livre. | |||
=== Método de processamento de dados === | |||
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, <code>mysql</code>, <code>postgreSQL</code>, <code>Oracle</code>, etc. Se houver gerenciador de ETL, por exemplo, <code>pentaho</code> ou <code>informatica</code>, detalhar os processos (''pipeline''). | |||
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing". | O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing". | ||
=== Método de processamento analítico === | |||
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão. | Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão. | ||
A solução deve ser apontada, por exemplo, | |||
A solução deve ser apontada, por exemplo, <code>disk.frame</code>, <code>Hadoop</code>, <code>Spark</code>, <code>Parquet e RDS</code>, <code>Storm</code>, <code>Cassandra</code>, <code>RapidMiner</code>, <code>MongoDB</code>, <code>Neo4j</code>, <code>SAMOA</code>, <code>HPCC</code>, <code>greenplum</code>, etc. | |||
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo | |||
=== Método de apresentação de dados === | |||
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como | |||
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo <code>R Shiny</code>, <code>metabase</code>, <code>Power BI</code>, <code>Tableau</code>, <code>Microstrategy</code>, <code>QlikView / Qlik Sense</code>, <code>DataStudio</code>, <code>SAS</code>, <code>Elastic/Kibana</code>, etc. | |||
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc. | |||
É desejavel segmentar as tarefas segundo a modalidade | === Método de análise matemática e estatística === | ||
Exemplos de tipos de algoritmos são | |||
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como <code>projeto R</code>, <code>python</code>, <code>matlab</code>, <code>scilab</code>, <code>Stata</code>, <code>SPSS</code>, <code>PSPP</code>, <code>Epiinfo</code>, etc. | |||
=== Método de descoberta de conhecimento em bancos de dados (KDD) === | |||
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc. | |||
É desejavel segmentar as tarefas segundo a modalidade '''descritiva''', '''preditiva''' ou '''prescritiva'''. | |||
Exemplos de tipos de algoritmos são <code>C4.5</code>, <code>Random Forest</code>, <code>K-mean Algorithm</code>, <code>Support Vector Machines SVM</code>, <code>Apriori Algorithm</code>, <code>Expectation-Maximization Algorithm</code>, <code>kNN</code>, <code>PCA</code>, <code>SVD</code>. | |||
=== Base de dados === | |||
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface). | Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface). | ||
== Apêndice == | |||
| | |||
|Identificador|código sequencial da pri.td_indicador| | === Rastreabilidade === | ||
|Código RIPSA|| | |||
|Nome RIPSA|| | {| | ||
|URL RIPSA| | ! atributo | ||
|tabela CIEGES|| | ! valor | ||
|- | |||
Sugere-se adotar a [ | | Identificador | ||
Atenção ao nomear atributos e tabelas para evitar problemas | | código sequencial da pri.td_indicador | ||
ao referência-las. | |- | ||
Recomenda-se padronizar os atributos usando apenas letras minúsculas, | | Código RIPSA | ||
sem espaços separando-se por | | | ||
|- | |||
| Nome RIPSA | |||
| | |||
|- | |||
| URL RIPSA | |||
| http://fichas.ripsa.org.br/2007/ | |||
|- | |||
| tabela CIEGES | |||
| | |||
|} | |||
=== Nomenclatura Sugerida === | |||
Sugere-se adotar a [https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura/ Norma de padronização de nomenclatura (MAD)] do DATASUS, Ministério da Saúde. | |||
Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las. | |||
Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por ''underline'' <code>_</code>. | |||
* Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço | * Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço | ||
* Caracteres recomendados: de a a z de 0 a 9 e | * Caracteres recomendados: de a a z de 0 a 9 e ''underline'' | ||
* Caracteres não recomendados: ç, á, é, ã, â, espaço, etc | * Caracteres não recomendados: ç, á, é, ã, â, espaço, etc | ||
Caso queria utilizar caracteres especiais ou espaço | Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No <code>PostgreSQL</code> é utilizada aspas duplas <code>"</code>, enquanto no <code>MySQL</code> é utilizada crase ```. | ||
você deve conhecer como o SGBD faz para identificar a referência à tabela | |||
ou atributo. No | |||
enquanto no | |||
Exemplos de prefixos para bancos e tabelas: | Exemplos de prefixos para bancos e tabelas: | ||
* | |||
* | * <code>bd_</code> - banco de dados (por exemplo, <code>bd_medicamento</code>, <code>bd_obito</code>, <code>bd_covid19</code>). | ||
* | * <code>td_</code> - tabela de dimensão ou domínio (por exemplo, <code>td_cid10</code>, <code>td_municipio</code>, <code>td_estabelecimento</code>). | ||
* | * <code>tf_</code> - tabela de fatos contendo transações (por exemplo, <code>tf_dispensação</code>, <code>tf_notificacao_dengue</code>). | ||
* | * <code>tm_</code> - tabelas provisórias (por exemplo, <code>tm_sia_am</code>, <code>tm_sia_aq</code>). | ||
* <code>vw_</code> - tabela de fatos contendo visões de dados (por exemplo, <code>vw_dispensação_homens</code>, <code>tf_notificacao_dengue_amazonas</code>). | |||
Exemplos de prefixos para atributos: | Exemplos de prefixos para atributos: | ||
* | |||
* | * <code>co_</code> - código (por exemplo, <code>co_cid10</code>, <code>co_procedimento_sigtap</code>). | ||
* | * <code>co_seq_</code> - código sequencial (por exemplo, <code>co_seq_usuario</code>, <code>co_seq_estabelecimento</code>). | ||
* | * <code>dt_</code> - data (por exemplo, <code>dt_nascimento</code>, <code>dt_dispensacao</code>). | ||
* | * <code>no_</code> - nome (por exemplo, <code>no_usuário_sus</code>, <code>no_trabalhador</code>, <code>no_equipamento</code>). | ||
* | * <code>ds_</code> - descrição (por exemplo, <code>ds_posologia</code>, <code>ds_relato_clinico</code>). | ||
* | * <code>qt_</code> - quantidade, usualmente, discreta (por exemplo, <code>qt_comprimido</code>, <code>qt_area</code>, <code>qt_população</code>). | ||
* | * <code>vl_</code> - valor, usualmente, passível de ser decimal (por exemplo, <code>vl_gasto</code>, <code>vl_densidade_demografica</code>). | ||
* | * <code>nu_</code> - número, usualmente contado ou calculado (por exemplo, <code>nu_idade</code>). | ||
* | * <code>tx_</code> - taxa ou fração (por exemplo, <code>tx_letalidade</code>, <code>tx_mortalidade</code>). | ||
* | * <code>st_</code> - situação ou status (por exemplo, <code>st_ativo</code>, <code>st_gravida</code>). | ||
* <code>sg_</code> - sigla (por exemplo, <code>sg_faixa_etaria</code>, <code>sg_sexo</code>). |
Edição das 18h32min de 10 de janeiro de 2023
O MediaWiki foi instalado.
Consulte o Manual de Usuário para informações de como usar o software wiki.
Começando
- Lista de opções de configuração
- FAQ do MediaWiki
- Lista de discussão com avisos de novas versões do MediaWiki
- Traduza o MediaWiki para seu idioma
Nota técnica matriz de indicador
Introdução
A Nota ténica matriz é um artefato para ser copiado e colado em uma nova nota técnica no wiki Conass que envolva indicador. Dessa forma, é assegurado o preenchimento dos tópicos padrão.
Segundo o caderno verde da Rede Interagencial de Informações para a Saúde (RIPSA), existem seis subconjuntos temáticos: demográficos, socioeconômicos, mortalidade, morbidade e fatores de risco, recursos e cobertura, onde cada indicador é caracterizado pela denominação, conceituação, método de cálculo, categorias de análise e fontes de dados.
subconjunto temático | sigla | descrição | pasta e marcador |
---|---|---|---|
Demográficos | A | Medem a distribuição de fatores determinantes da situação de saúde relacionados à dinâmica populacional na área geográfica referida. | a_demografico |
Sócioeconômicos | B | Medem a distribuição dos fatores determinantes da situação de saúde relacionados ao perfil econômico e social da população residente na área geográfica referida. | b_socioeconomico |
Mortalidade | C | Informam a ocorrência e distribuição das causas de óbito no perfil da mortalidade da população residente na área geográfica referida. | c_mortalidade |
Morbidade | D | Informam a ocorrência e distribuição de doenças e agravos à saúde na população residente na área geográfica referida. | d_morbidade |
Recursos | E | Medem a oferta e a demanda de recursos humanos, físicos e financeiros para atendimento às necessidades básicas de saúde da população na área geográfica referida. | e_recursos |
Cobertura | F | Medem o grau de utilização dos meios oferecidos pelo setor público e pelo setor privado para atender às necessidades de saúde da população na área geográfica referida. | f_cobertura |
Fatores de Risco e de Proteção | G | Medem os fatores de risco (por ex. tabaco, álcool), e/ou proteção (por ex. alimentação saudável, atividade física, aleitamento) que predispõe à doenças e agravos ou, protegem das doenças e agravos. | g_fatores |
No âmbito da gestão de dados, visando reprodutibilidade e escalabidade, estimula-se a caracterizar o método de processamento de dados, método de processamento analítico, método de apresentação de dados, método de análise estatística e o método de descoberta de conhecimento em bancos de dados (KDD).
As fichas foram, portanto segmentadas segundo o público, a saber, sanitarista e cientista de dados.
Endereço eletrônico
A presente nota técnica é acessível pelo endereço https://git.conass.org.br/ferre/notas-tecnicas-pri-provisorio/-/edit/main/matriz.md
Objetivo
Pradronizar notas técnicas dos indicadores.
Ficha do indicador para o sanitarista
Nesta categoria enquadram-se o sanitarista e o usuário tradicional dos Indicadores e Dados Básicos - Brasil (IDB), bem como das fichas da RIPSA.
Conceituação
Informações que definem o indicador e a forma como ele se expressa, se necessário agregando elementos para a compreensão de seu conteúdo.
Interpretação
Explicação sucinta do tipo de informação obtida e seu significado.
Usos
Principais finalidades de utilização dos dados, a serem consideradas na análise do indicador.
Limitações
Fatores que restringem a interpretação do indicador, referentes tanto ao próprio conceito quanto às fontes utilizadas.
Fontes
Instituições responsáveis pela produção dos dados utilizados no cálculo do indicador e pelos sistemas de informação a que correspondem.
Métodos de Cálculo
Fórmula utilizada para calcular o indicador, definindo os elementos que a compõem.
Categorias Sugeridas para Análise
Níveis de desagregação definidos pela sua potencial contribuição para interpretação dos dados e que estão efetivamente disponíveis.
Dados Estatísticos e Comentários
Tabela resumida e comentada, que ilustra a aplicação do indicador em situação real. Idealmente, a tabela apresenta dados para grandes regiões do Brasil, em anos selecionados desde o início da série histórica
Literatura relacionada
Referências Scielo
, Medline
, GoogleScholar
, EMBASE
, etc, com as respectivas buscas estruturadas.
Ficha do indicador para o cientista de dados
O público-alvo é o estatístico, gerente de banco de dados, desenvolvedor de software, analista de inteligência de negócios, informata em saúde, bioinformata e demais perfis relacionados ao processamento de dados massivos com técnicas de big data e soluções de aprendizado de máquina e inteligência artificial.
A URL do código-fonte completo deve ser apontada aqui, preferencialmente em plataforma git e de acesso livre.
Método de processamento de dados
Detalhamento das etapas de extração, transformação e carga com exemplos mínimos comtemplanto códigos-fonte, incluindo consultas de bancos de dados ou operações manuais, ferramentas, algoritmos, descrição dos atributos. Importante detalhar qual o Sistema Gerenciador de Banco de Dados (SGBD) usado, por exemplo, mysql
, postgreSQL
, Oracle
, etc. Se houver gerenciador de ETL, por exemplo, pentaho
ou informatica
, detalhar os processos (pipeline).
O detalhamento pode incluir diagramas de entidade e relacionamento, bem como informações complementares da modelagem relacional, incluindo etapas OLTP, do inglêsm "On-line Transaction Processing".
Método de processamento analítico
Detalhamento da transposição da modelagem relacional e transacional para a analítica na formação do repositório de dados (Data Warehouse - DW), incluindo méritros estabelecidos mas técnicas OLAP, do inglês, "On-line Analytical Processing" como descrição das etapas de formação das tabelas de fato e dimensão.
A solução deve ser apontada, por exemplo, disk.frame
, Hadoop
, Spark
, Parquet e RDS
, Storm
, Cassandra
, RapidMiner
, MongoDB
, Neo4j
, SAMOA
, HPCC
, greenplum
, etc.
Método de apresentação de dados
Deve ser elencada e detalhada a técnica de construção da ferramenta utilizada, por exemplo R Shiny
, metabase
, Power BI
, Tableau
, Microstrategy
, QlikView / Qlik Sense
, DataStudio
, SAS
, Elastic/Kibana
, etc.
Método de análise matemática e estatística
Exemplos de código-fonte e respectiva explicação deve ser detalhado, citando a ferramenta, como projeto R
, python
, matlab
, scilab
, Stata
, SPSS
, PSPP
, Epiinfo
, etc.
Método de descoberta de conhecimento em bancos de dados (KDD)
Os processos e algoritmos de mineração de dados devem ser descritos aqui, sejam métodos de classificação supervisionados, isto é, a partir de classes previamente anotadas, ou métodos de classificação não supervisionados, bem como de regressão, redução de dimensionalidade, etc.
É desejavel segmentar as tarefas segundo a modalidade descritiva, preditiva ou prescritiva.
Exemplos de tipos de algoritmos são C4.5
, Random Forest
, K-mean Algorithm
, Support Vector Machines SVM
, Apriori Algorithm
, Expectation-Maximization Algorithm
, kNN
, PCA
, SVD
.
Base de dados
Acesso aos dados tabulados ou via Interface de Programação de Aplicação (API, Application Programming Interface).
Apêndice
Rastreabilidade
atributo | valor |
---|---|
Identificador | código sequencial da pri.td_indicador |
Código RIPSA | |
Nome RIPSA | |
URL RIPSA | http://fichas.ripsa.org.br/2007/ |
tabela CIEGES |
Nomenclatura Sugerida
Sugere-se adotar a Norma de padronização de nomenclatura (MAD) do DATASUS, Ministério da Saúde.
Atenção ao nomear atributos e tabelas para evitar problemas ao referência-las.
Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem espaços separando-se por underline _
.
- Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço
- Caracteres recomendados: de a a z de 0 a 9 e underline
- Caracteres não recomendados: ç, á, é, ã, â, espaço, etc
Caso queria utilizar caracteres especiais ou espaço você deve conhecer como o SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL
é utilizada aspas duplas "
, enquanto no MySQL
é utilizada crase ```.
Exemplos de prefixos para bancos e tabelas:
bd_
- banco de dados (por exemplo,bd_medicamento
,bd_obito
,bd_covid19
).td_
- tabela de dimensão ou domínio (por exemplo,td_cid10
,td_municipio
,td_estabelecimento
).tf_
- tabela de fatos contendo transações (por exemplo,tf_dispensação
,tf_notificacao_dengue
).tm_
- tabelas provisórias (por exemplo,tm_sia_am
,tm_sia_aq
).vw_
- tabela de fatos contendo visões de dados (por exemplo,vw_dispensação_homens
,tf_notificacao_dengue_amazonas
).
Exemplos de prefixos para atributos:
co_
- código (por exemplo,co_cid10
,co_procedimento_sigtap
).co_seq_
- código sequencial (por exemplo,co_seq_usuario
,co_seq_estabelecimento
).dt_
- data (por exemplo,dt_nascimento
,dt_dispensacao
).no_
- nome (por exemplo,no_usuário_sus
,no_trabalhador
,no_equipamento
).ds_
- descrição (por exemplo,ds_posologia
,ds_relato_clinico
).qt_
- quantidade, usualmente, discreta (por exemplo,qt_comprimido
,qt_area
,qt_população
).vl_
- valor, usualmente, passível de ser decimal (por exemplo,vl_gasto
,vl_densidade_demografica
).nu_
- número, usualmente contado ou calculado (por exemplo,nu_idade
).tx_
- taxa ou fração (por exemplo,tx_letalidade
,tx_mortalidade
).st_
- situação ou status (por exemplo,st_ativo
,st_gravida
).sg_
- sigla (por exemplo,sg_faixa_etaria
,sg_sexo
).