Data Warehouse em Saúde: diferenças entre revisões

Fonte: aprendis
Saltar para a navegaçãoSaltar para a pesquisa
Sem resumo de edição
Sem resumo de edição
Linha 3: Linha 3:
|Aplicações=Armazenamento de dados, Sistemas de Apoio à Decisão
|Aplicações=Armazenamento de dados, Sistemas de Apoio à Decisão
}}
}}
O conceito de Data Warehouse (DW) surge no final dos anos 80, sendo um sistema que funciona como um repositório de dados construído para o suporte à tomada de decisão <ref name="Inmon2005">Inmon, W. H. (2005). Building the Data Warehouse. New York: Wiley.</ref>. Devido à crescente quantidade de informação disponível, surge a necessidade de estruturar os dados num formato válido e consistente para permitir atividades como consultas (pré-definidas ou ''ad-hoc''), processamento analítico, e elaboração de relatórios. Outra maneira de explorar os dados armazenados no DW é recorrendo a técnicas de [[Data Mining|Data Mining]] (DM)<ref name="Inmon2005"/>. Assim, o DW surgiu de forma a permitir aceder a dados rigorosos que espalhem a realidade não só das instituições de saúde, como a de muitas outras instituições.


O conceito de Data Warehouse (DW) surge no final dos anos 80, sendo um sistema que funciona como um repositório de dados construído para o suporte à tomada de decisão <ref name="Inmon2005">Inmon, W. H. (2005). Building the Data Warehouse. New York: Wiley.</ref>. Devido à crescente quantidade de informação disponível, surge a necessidade de estruturar os dados num formato válido e consistente para permitir atividades como consultas (pré-definidas ou ''ad-hoc''), processamento analítico, e elaboração de relatórios. Outra maneira de explorar os dados armazenados no DW é recorrendo a técnicas de [[Data Mining|Data Mining]] (DM)<ref name="Inmon2005"/>.  
Os profissionais de saúde necessitam de uma ferramenta fiável, centrada no paciente, que preste todo o apoio e permita melhorar o seu fluxo de trabalho. Atualmente o formato em papel já não é um suporte fiável para o registo e gestão da grande quantidade de informação que as instituições de saúde produzem. Os problemas de legibilidade são constantes, o acesso a informação é difícil e por causa disso, localizar ou acompanhar um evento recente pode ser muito complicado.  


Os profissionais de saúde necessitam de uma ferramenta fiável, centrada no paciente, que preste todo o apoio e permita melhorar o seu fluxo de trabalho. Atualmente o formato em papel já não é um suporte fiável para o registo e gestão da grande quantidade de informação que as instituições de saúde produzem. Os problemas de legibilidade são constantes, o acesso a informação é difícil e por causa disso, localizar ou acompanhar um evento recente pode ser muito complicado. As informações recolhidas provêm de hospitalizações (tipo de admissão e tempo de internamento), diagnósticos, exames, vacinas, sinais vitais, entre outras.
O sistema de DW pode ser aplicado em diversas áreas, sendo as duas principais funções<ref name="Inmon2005"/>:


O ambiente organizacional está em constante mudança tornando-se cada vez mais complexo e em permanente necessidade de informação e conhecimento. Assim, o DW surgiu de forma a permitir aceder a dados rigorosos que espalhem a realidade não só das instituições de saúde, como a de muitas outras organizações.
# Manter registos prévios e atuais;
# Ajudar organizações a tomar decisões através de análises de dados precisos.


'''Aplicabilidade'''


O sistema de DW pode ser aplicado em diversas àreas, sendo as duas principais funções<ref name="Inmon2005"/>:


# Manter registos prévios e atuais;
'''Características'''
# Ajudar organizações a tomar decisões através de análises de dados precisos.


O Data Warehouse contém quatro atributos fundamentais, definindo DW como um conjunto de dados integrado, orientado por assunto, não volátil e estruturado temporalmente de maneira a suportar os gestores no seu processo de tomada de decisão<ref name="Inmon2005"/>.
O Data Warehouse contém quatro atributos fundamentais, definindo DW como um conjunto de dados integrado, orientado por assunto, não volátil e estruturado temporalmente de maneira a suportar os gestores no seu processo de tomada de decisão<ref name="Inmon2005"/>.


* '''Orientado por assunto:''' Os dados são organizados por assuntos, como por exemplo o serviço, o profissional ou os pacientes.
* '''Orientado por assunto:''' Os dados são organizados por assuntos, como por exemplo o serviço, o profissional ou os pacientes.
* '''Integrado:''' Similar ao conceito “orientado por assunto”,  
* '''Integrado:''' Similar ao conceito “orientado por assunto”,  
* '''Estruturado temporalmente:'''
* '''Estruturado temporalmente:'''
* '''Não volátil:'''
* '''Não volátil:'''


Para manter esta consistência, todos os dados passam por um processo de "limpeza" dividido em três passos: extrair, transformar e limpar, e carregar ('''ETL - Extract, Transform and Load''')<ref name="Inmon2005"/>.
Para manter esta consistência, todos os dados passam por um processo de "limpeza" dividido em três passos: extrair, transformar e limpar, e carregar ('''ETL - Extract, Transform and Load''')<ref name="Inmon2005"/>.
# Extrair: As informações recolhidas provêm de hospitalizações (tipo de admissão, tempo de internamento), diagnósticos, exames, vacinas, sinais vitais, entre outras.
# Transformar:
# Carregar:




'''Data Warehouse vs Base de Dados Operacional'''
'''Tipos de Sistemas'''


Geralmente, o DW é mantido separadamente da Base de Dados Organizacional (BDO) da organização devido à finalidade dos dois sistemas.
*''''Data Mart:'''' Sempre que existe a necessidade de separar a informação, o armazenamento é feito num repositório de dados mais pequeno do que os DW, sendo designado de ''Data Mart''. Estes repositórios reúnem todos os dados de um subconjunto específico da organização, como por exemplo um tipo de serviço (p.e. ortopedia)<ref name="Garner1998">Gardner, S. R. (1998). Building the Data Warehouse. Communications of the ACM, 41(9), 52-60.</ref>.
#;Tipos de Sistemas


*''''Data Mart:'''' Sempre que existe a necessidade de separar a informação, o armazenamento é feito num repositório de dados mais pequeno do que os DW, sendo designado de ''Data Mart''. Estes repositórios reúnem todos os dados de um subconjunto específico da organização, como por exemplo um tipo de serviço (p.e. ortopedia).
<u>Data Mart vs Data Warehouse</u>
 
{| class="wikitable"
! Data Mart
! Data Warehouse
|+Tabela 1 - Data Mart vs Data Warehouse
|-
| Dados de um departamento
| Dados de toda a instituição
|-
| Uma única área
| Várias áreas
|-
| Fácil de construir
| Difícil de construir
|-
| Mais rápido de construir
| Mais demorado
|-
| Memória grande
| Memória limitada
|}


*'''Sistema Operacional:''' Os sistemas operacionais, ou ''On-line Transactional Processing (OLTP)'', devem centrar-se no registo das transações que ocorrem no seu funcionamento diário.
*'''Sistema Operacional:''' Os sistemas operacionais, ou ''On-line Transactional Processing (OLTP)'', devem centrar-se no registo das transações que ocorrem no seu funcionamento diário.
Linha 39: Linha 65:
*'''Sistema Analítico:''' O DW é normalmente apresentado como analítico, ou ''On-line Analytical Processing (OLAP)'', para efetuar análises e tomar decisões.
*'''Sistema Analítico:''' O DW é normalmente apresentado como analítico, ou ''On-line Analytical Processing (OLAP)'', para efetuar análises e tomar decisões.


A próxima tabela resume as principais diferenças entre estes conceitos<ref name="WuBuchman1997">Wu, M. C., & Buchman, A. P. (1997). Research Issues in Data Warehousing. Paper presented at the BTW'97, Ulm, Germany.</ref>.
 
<u>Base de Dados Organizacional vs Data Warehouse</u>
 
Geralmente, o DW é mantido separadamente da Base de Dados Organizacional (BDO) da organização devido à finalidade dos dois sistemas. A tabela 2 resume as principais diferenças entre estes conceitos<ref name="WuBuchman1997">Wu, M. C., & Buchman, A. P. (1997). Research Issues in Data Warehousing. Paper presented at the BTW'97, Ulm, Germany.</ref>.


{| class="wikitable"
{| class="wikitable"
Linha 45: Linha 74:
! Base de Dados Operacional
! Base de Dados Operacional
! Data Warehouse
! Data Warehouse
|+Tabela 1 - Base de Dados Operacional vs Data Warehouse (adaptado de wu e Buchman, 1997)<ref name="WuBuchman1997"/>
|+Tabela 2 - Base de Dados Operacional vs Data Warehouse (adaptado de wu e Buchman, 1997)<ref name="WuBuchman1997"/>
|-
|-
| Função
| Função

Revisão das 15h44min de 16 de abril de 2016

Data Warehouse em Saúde
Sigla DW
Aplicações Armazenamento de dados, Sistemas de Apoio à Decisão
Conceitos relacionados

O conceito de Data Warehouse (DW) surge no final dos anos 80, sendo um sistema que funciona como um repositório de dados construído para o suporte à tomada de decisão [1]. Devido à crescente quantidade de informação disponível, surge a necessidade de estruturar os dados num formato válido e consistente para permitir atividades como consultas (pré-definidas ou ad-hoc), processamento analítico, e elaboração de relatórios. Outra maneira de explorar os dados armazenados no DW é recorrendo a técnicas de Data Mining (DM)[1]. Assim, o DW surgiu de forma a permitir aceder a dados rigorosos que espalhem a realidade não só das instituições de saúde, como a de muitas outras instituições.

Os profissionais de saúde necessitam de uma ferramenta fiável, centrada no paciente, que preste todo o apoio e permita melhorar o seu fluxo de trabalho. Atualmente o formato em papel já não é um suporte fiável para o registo e gestão da grande quantidade de informação que as instituições de saúde produzem. Os problemas de legibilidade são constantes, o acesso a informação é difícil e por causa disso, localizar ou acompanhar um evento recente pode ser muito complicado.

O sistema de DW pode ser aplicado em diversas áreas, sendo as duas principais funções[1]:

  1. Manter registos prévios e atuais;
  2. Ajudar organizações a tomar decisões através de análises de dados precisos.


Características

O Data Warehouse contém quatro atributos fundamentais, definindo DW como um conjunto de dados integrado, orientado por assunto, não volátil e estruturado temporalmente de maneira a suportar os gestores no seu processo de tomada de decisão[1].

  • Orientado por assunto: Os dados são organizados por assuntos, como por exemplo o serviço, o profissional ou os pacientes.
  • Integrado: Similar ao conceito “orientado por assunto”,
  • Estruturado temporalmente:
  • Não volátil:


Para manter esta consistência, todos os dados passam por um processo de "limpeza" dividido em três passos: extrair, transformar e limpar, e carregar (ETL - Extract, Transform and Load)[1].

  1. Extrair: As informações recolhidas provêm de hospitalizações (tipo de admissão, tempo de internamento), diagnósticos, exames, vacinas, sinais vitais, entre outras.
  2. Transformar:
  3. Carregar:


Tipos de Sistemas

  • 'Data Mart:' Sempre que existe a necessidade de separar a informação, o armazenamento é feito num repositório de dados mais pequeno do que os DW, sendo designado de Data Mart. Estes repositórios reúnem todos os dados de um subconjunto específico da organização, como por exemplo um tipo de serviço (p.e. ortopedia)[2].

Data Mart vs Data Warehouse

Data Mart Data Warehouse
Tabela 1 - Data Mart vs Data Warehouse
Dados de um departamento Dados de toda a instituição
Uma única área Várias áreas
Fácil de construir Difícil de construir
Mais rápido de construir Mais demorado
Memória grande Memória limitada
  • Sistema Operacional: Os sistemas operacionais, ou On-line Transactional Processing (OLTP), devem centrar-se no registo das transações que ocorrem no seu funcionamento diário.
  • Sistema Analítico: O DW é normalmente apresentado como analítico, ou On-line Analytical Processing (OLAP), para efetuar análises e tomar decisões.


Base de Dados Organizacional vs Data Warehouse

Geralmente, o DW é mantido separadamente da Base de Dados Organizacional (BDO) da organização devido à finalidade dos dois sistemas. A tabela 2 resume as principais diferenças entre estes conceitos[3].

Base de Dados Operacional Data Warehouse
Tabela 2 - Base de Dados Operacional vs Data Warehouse (adaptado de wu e Buchman, 1997)[3]
Função Operações Diárias

OLTP

Suporte à Decisão

OLAP

Design da Base de Dados Orientada às aplicações

Optimizada para atualizações

Orientada aos assuntos

Optimizada para processamento de queries

Dados Correntes

Atualizados

Atómicos

Relacionais (Normalizados)

Isolados

Históricos

Sumarizados

Multidimensionais

Integrados

Utilização Repetitivo

Dia-a-dia

Ad-hoc
Acessos Leitura/Escrita

Transacções simples (envolvendo 1 a 3 tabelas)

Maioria de Leitura

Queries complexas (envolvendo várias tabelas)

De forma a explorar os dados e a informação de um DW são usadas técnicas como o processamento analítico de dados OLAP, juntamente com algoritmos de DM. A tecnologia OLAP permite realizar análises multidimensionais aos dados e oferece a capacidade de realizar cálculos complexos, analisar tendências e de modelar os dados refinadamente. A partir da modelação multidimensional esta tecnologia cria cubos para analisar a informação necessária à tomada de decisão sobre várias perspetivas.


Referências

  1. 1,0 1,1 1,2 1,3 1,4 Inmon, W. H. (2005). Building the Data Warehouse. New York: Wiley.
  2. Gardner, S. R. (1998). Building the Data Warehouse. Communications of the ACM, 41(9), 52-60.
  3. 3,0 3,1 Wu, M. C., & Buchman, A. P. (1997). Research Issues in Data Warehousing. Paper presented at the BTW'97, Ulm, Germany.