![]() |
||
| Principal Home DataMart Ferramentas Utilizadas Andamento Desenvolvedores Objetivo Bibliografia Arquitetura Cases Coordenador Links | ||
|
Arquitetura Podemos definir duas formas de apresentação da arquitetura de DWs, uma conceitual e outra física do modelo relacional que representa o sistema. Visão
Conceitual A arquitetura conceitual do DW é baseadas nos seguintes componentes [CHA97]: Existem ferramentas para extração de dados de diversas bases de dados operacionais e de fontes externas, ferramentas para limpeza, transformação e integração destes dados, para carga de dados no DW e ainda outras para atualização periódica do warehouse a fim de refletir as atualizações ocorridas nas fontes. Além do DW podem existir vários Data Marts (DMs), que departamentalizam os dados separando-os por setor dentro da organização. Os dados contidos no DW e nos DMs são gerenciados por um ou mais servidores de warehouse, os quais apresentam visões multidimensionais dos dados para uma variedade de ferramentas front end. A visão multidimensional em forma de cubo de dados indica que as informações são visualizadas em linhas e colunas como o formato tradicional das planilhas, porém existem mais dimensões, sendo que o cubo teria apenas mais uma dimensão. Esta característica organiza e facilita a consulta aos dados de maneira que se pode ter, por exemplo, numa dimensão do cubo os meses do ano, na segunda dimensão estariam as cidades de origem dos clientes e na terceira dimensão o médico que encaminhou o cliente para o hospital. Finalmente, existe um repositório para armazenagem e gerenciamento dos metadados acompanhados de ferramentas para monitorização e administração do sistema. Visão
em Camadas As diversas aplicações existentes podem enquadrar-se na visão em camadas demonstrada a seguir [CAM97]: Camada de
Bancos de Dados Operacionais e Fontes Externas: contém as bases
de dados operacionais e pode ser composta também de informações
de fontes externas, estes dados recebem um tratamento especial para
poderem ser incorporados ao DW; Camada de Acesso aos Dados: compõe
o elo de ligação entre as ferramentas de acesso à
informação e os bancos de dados operacionais, comunicando-se
com diversos Sistemas de Gerenciamento de Banco de Dados (SGBDs) e sistemas
de arquivos, sendo que a este conjunto de características dá-se
o nome de acesso universal de dados; Estrutura
Física dos Dados do DW A respeito da disposição física dos dados, o DW pode ter uma estrutura centralizada em um único local ou então ser implementado de forma distribuída. Se optarmos pelo primeiro modelo, o centralizado, teremos um warehouse consolidado e o Banco de Dados (BD) formará um DW integrado. Definindo o projeto desta forma pode-se maximizar o poder de processamento e acelerar os processos de busca por informações analíticas. Definindo-se uma arquitetura federativa, pode-se distribuir a informação por função, separando os dados do setor financeiro em um servidor, os dados de marketing em outro local, e dados de manufatura em um terceiro lugar. Existe ainda uma terceira metodologia, na qual considera-se uma arquitetura de DW separada por camadas, armazenando os dados mais resumidos em um servidor, dispondo os dados um pouco mais detalhados, em nível de detalhe intermediário, em um segundo servidor, e por fim colocamos os dados mais detalhados (atômicos) em um terceiro servidor. O primeiro servidor geralmente atende à maior parte das consultas, sendo que teremos um menor número de pedidos de acesso solicitados para a camada 2 e camada 3. O dimensionamento dos servidores é o seguinte: na primeira camada podemos ter uma configuração para suportar um grande número de usuários que farão diversas consultas, as quais trabalharão com um volume relativamente pequeno de dados. Já os servidores das outras duas camadas devem ser configurados para permitir processar grandes volumes de dados, porém não é necessária uma preocupação em configurar o sistema para suportar o acesso de um número maior de usuários. Isto explica-se pelo fato de que a maioria dos usuários terá suas perguntas respondidas pelas consultas iniciais da camada 1. Se algum usuário não se satisfizer com o nível de detalhe das respostas da camada 1, pode buscar maiores informações na camada 2 e até mesmo na camada Concluímos então que poucos usuários farão acessos regulares à última camada, sendo que alguns nunca o farão além do nível inicial. Esta metodologia em camadas é bastante utilizada, sendo defendida por diversos autores. É sabido que, além das camadas do DW propriamente dito, tem-se ainda a camada dos dados transacionais de onde os dados atômicos são coletados. Arquitetura
de Duas Camadas Existe uma
arquitetura de implantação de sistemas de DW que consiste
em utilizar um computador de alta capacidade como servidor. Este método
disponibiliza aplicações aos usuários finais na
forma de ferramentas front end, que servem para realizar as consultas,
em conjunto com os componentes do servidor com ferramentas back end,
que servem para municiar o DW com informações. A arquitetura,
pode ser usada para construir um sistema de DW em duas camadas, o qual
possui os componentes dos clientes (front end) e os componentes do servidor
(back end). Arquitetura
de Três Camadas Para tentar
solucionar os problemas de performance resultantes do gargalo da arquitetura
de duas camadas, existe uma arquitetura de informação
em múltiplas camadas. Esta arquitetura é bastante flexível
e suporta um grande número de serviços integrados, onde
a interface do usuário (ferramentas front end), as funções
de processamento do negócio e as funções de gerenciamento
do BD são separadas em processos, os quais podem ser distribuídos
através da arquitetura de informação. Um
Modelo Alternativo de Arquitetura A
partir do modelo de camadas descrito anteriormente, é possível
definir um modelo alternativo que facilita o entendimento e reduz o
número de componentes a serem considerados, simplificando a sua
descrição. Há um exemplo desta arquitetura [VAL96],
na qual pode-se visualizar na parte inferior as bases de dados que formam
as fontes externas e internas, acima destas fontes de dados estão
os módulos extratores que detectam automaticamente as alterações
ocorridas nas bases de dados. Sempre que ocorrer uma mudança
no conteúdo da base, a informação que foi incluída
ou atualizada é propagada para o integrador, desde que reflita
em modificações na base de dados do DW. |
||