Banco de Dados e Business Intelligence



Banco de Dados
1. Banco de Dados:
Conjunto de dados ou informações relacionados entre si e organizados de forma a facilitar a sua utilização por parte do utilizador. Visa:
1.1. Diminuir o espaço ocupado pela informação;
1.2. Facilitar a atualização da informação;
1.3. Aumentar a velocidade de pesquisa;
1.4. Evitar a redundância de informação.
2. Sistema Gerencial de Banco de Dados (SGBD):
Programas ou conjuntos integrados de programas que permitem criar e manipular bases de dados, em que os dados são estruturados com independência relativamente aos programas de aplicação que os manipulam.
3. Structured Query Language (SQL):
Linguagem específica para definir o esquema conceitual e físico de um SGBD. Divide-se em:
3.1. Linguagem de Definição de Dados (DDL): Realiza operações de definição e alteração da estrutura de um banco de dados.
3.2. Linguagem de Manipulação de Dados (DML): Realiza operações de manipulação de dados sem alteração da estrutura do banco de dados.
3.3. Linguagem de Controle dos Dados (DCL): Responsável por permitir o acesso de usuários ao banco de dados.
4. Entidade:
Conjunto de dados divididos em campos ou atributos que de alguma forma se encontram relacionados.
5. Registro:
Cada ocorrência relativa a uma entidade.
6. Atributo Identificador (ID):
Atributo responsável por identificar sem ambigüidades cada entidade concreta. Para cada entidade deve existir sempre um atributo deste tipo. Geralmente, este atributo desempenha o papel de chave numa entidade ou tabela.
7. Chave Primária (PK):
Atributo identificador que representa univocamente cada ocorrência ou registro de uma tabela.
Chaves primárias podem ser simples (apenas um atributo) ou compostas (dois ou mais atributos).
8. Chave Estrangeira (FK):
Atributo de uma tabela que referencia a chave primária de uma outra tabela através de uma relação.


Business Intelligence
1. Business Intelligence (BI):
Conjunto de conceitos e metodologias que, fazendo uso de acontecimentos e sistemas baseados nos mesmos, apóia a tomada de decisões em negócios. Tem como principais características extrair e integrar dados de múltiplas fontes, fazer uso da experiência, analisar dados contextualizados, trabalhar com hipóteses, procurar relações de causa e efeito e transformar os registros obtidos em informações úteis para o conhecimento empresarial.


2. Fontes de Dados:
Representam as fontes que fornecem entradas para o processo de BI, podendo ser aplicativos operacionais, softwares de automação de escritórios, ou até outros bancos de dados.
3. Extração, Transformação e Carregamento (ETL):
3.1. Extração: Processo responsável por extrair os dados de suas fontes.
3.2. Transformação: Processo encarregado de traduzir os dados externos, alterando-os de acordo com regras de negócios.
3.3. Carregamento: Processo de carregar os dados transformados ao nosso banco de dados (Data Warehouse/Data Marts).
4. Data Warehouse (DW):
Cópia dos dados de transações, selecionados e depurados, estruturada especificamente para consultas e análises. Sendo, portanto, uma coleção de dados extraídos do ambiente de produção da empresa e de informações provenientes de planilhas eletrônicas, documentos textuais e etc., que aplicadas em conjunto com técnicas de análise e extração de dados geram um sistema que nos proporcionam informações para dar suporte na tomada de decisões.
5. Data Marts:
Pequeno subconjunto de um Data Warehouse utilizado por um número pequeno de usuários.
Os Data Marts atendem as necessidades de unidades específicas de negócio ao invés das da corporação inteira. Eles otimizam a entrega de informação de suporte à decisão e se focam na gerência sumarizada e/ou dados exemplificativos ao invés do histórico de níveis atomizados.
6. Multidimensionalidade:
A visão multidimensional consiste de consultas que fornecem dados a respeito de medidas de desempenho, decompostas por uma ou mais dimensões dessas medidas, podendo também, serem filtradas pela dimensão e/ou pelo valor da medida. As visões multidimensionais fornecem as técnicas básicas para cálculo e análise requeridos pelas aplicações de BI.
7. Cubo:
Coleção de dados que agregados através de múltiplas dimensões de forma a permitir que uma query seja realizada rapidamente. Por exemplo, um cubo de vendas pode ser agregado através de uma dimensão de lojas e de uma dimensão de clientes, tornando o cubo rápido quando são perguntadas questões envolvendo vendas por lojas ou vendas para uma classe de cliente. Os Cubos são ordenados em dimensões e medidas.
8. Dimensão:
Unidade de análise que agrupa dados de negócio relacionados. Por exemplo, os níveis linhas de produtos, tipos de produtos, marcas, modelos e etc., ficam localizados na dimensão "Produtos".
Tipicamente, uma dimensão tem uma hierarquia natural de forma que resultados em um nível inferior possam ser agregados em resultados de um nível superior.
9. Hierarquia:
Composta por todos os níveis de uma dimensão, podendo ser balanceada ou não. Na hierarquia balanceada, os níveis mais baixos são equivalentes, porém, isto não ocorre nas hierarquias não balanceadas onde a equivalência hierárquica não existe. Por exemplo, em uma dimensão geográfica, o nível "País" não possui o subnível "Estado" para um determinado membro e possui para outro. No caso específico, pode-se citar o país Liechtenstein que não possui Estado e o Brasil, que possui uma série de Estados.
10. Membro:
Subconjunto de uma dimensão. Cada nível hierárquico possui membros apropriados a si mesmo.
11. Medida:
Dimensão especial utilizada para realizar comparações. Ela inclui membros como custos, lucros ou taxas.
12. Tabela Fato:
Contém a informação básica que se quer totalizar. Pode ser um detalhe de pedido, um registro de folha de pagamento, ou qualquer outra informação que seja passível de totalização, ou de ter sua média calculada. Qualquer tabela que possa ser usada em uma query com uma função de "soma" ou "média" é uma boa candidata a uma tabela fato.
Tabelas fato e tabelas de dimensão são relacionadas, já que as tabelas de dimensão são usadas para agrupar informação da tabela fato.
13. Esquema Estrela:
Esquema no qual cada tabela de dimensão é relacionada diretamente à tabela fato.
14. Esquema Floco de Neve:
Esquema no qual algumas dimensões estão relacionadas indiretamente com a tabela fato.
15. Metadados:
São dados a respeito de dados. Exemplos de metadados são as descrições de elementos de dados, descrições de tipos de dados, atributos/propriedades, faixas/domínios, métodos e processos.
16. Multidimensional Expression (MDX):
Projetada pela Microsoft como um padrão para consultas e troca de dados em uma fonte de dados multidimensional.
17. Online Analytical Processing (OLAP):
Aplicação que atende às requisições dos usuários de síntese, análise e consolidação de dados. Possui a capacidade de visualização das informações a partir de diferentes perspectivas. A funcionalidade de uma ferramenta OLAP é caracterizada pela análise multidimensional dinâmica dos dados, apoiando o usuário final nas suas atividades, tais como:
17.1. Drill Up/Down: Consiste em explorar diferentes níveis de detalhes da informação. Com o drill down divide-se um item de resumo em seus componentes detalhados, como por exemplo, um ano é dividido em semestres, que divide-se em trimestres, depois em meses, até chegar em dias. Drill up é o mesmo processo, porém no sentido oposto;
17.2. Drill Through: Ocorre quando o usuário passa de uma informação contida em uma dimensão para uma outra. Por exemplo, analisando-se a dimensão "Tempo", decide-se analisar a informação por "Região";
17.3. Drill Across: Quando o usuário pula um nível intermediário dentro de uma mesma dimensão. Por exemplo, a dimensão tempo é composta por ano, semestre, trimestre, mês e dia. O usuário estará executando um drill across quando ele passar de ano direto para semestre ou mês;
17.4. Slice & Dice: Possibilita a alteração da perspectiva de visão. Serve para modificar a posição de uma informação, trocar linhas por colunas de maneira a facilitar a compreensão dos usuários e girar o cubo sempre que necessário;
17.5. Alertas: São utilizados para indicar situações de destaque em elementos dos relatórios, baseados em condições envolvendo objetos e variáveis. Servem para indicar valores mediante condições, mas não para isolar dados pelas mesmas;
17.6. Ranking: Permite agrupar resultados por ordem de maiores/menores, baseado em medidas. Esta opção impacta somente um relatório, não afetando a pesquisa;
17.7. Filtros: Os dados selecionados por uma query podem ser submetidos a condições para a leitura na fonte de dados. Os dados já recuperados pelo usuário podem ser novamente "filtrados" para facilitar análises diretamente no documento;
17.8. Sorts: Servem para ordenar uma informação. Esta ordenação pode ser customizada, crescente ou decrescente;
17.9. Consultas Ad-Hoc: Geradas pelos usuários finais de acordo com suas necessidades de cruzar informações de uma forma não vista e que os leve a descoberta do que procuram.
18. Servidor e Arquitetura OLAP:
Mecanismo de manipulação de dados de alta capacidade destinado a suportar e operar sobre estruturas de dados multidimensionais. É dividido por sua arquitetura como:
18.1. MOLAP: Dados armazenados de forma multidimensional. Sua implementação varia de acordo com a sua ferramenta de OLAP, mas é freqüentemente implementado em um banco de dados relacional;
18.2. ROLAP: Dados armazenados no modelo relacional, assim como o processamento de suas consultas;
18.3. DOLAP: Variação que existe para fornecer portabilidade aos dados. A vantagem que oferece esta arquitetura é a redução do tráfico na rede;
18.4. HOLAP: Arquitetura mais recente, na qual ocorre uma combinação entre ROLAP e MOLAP (dados armazenados de forma híbrida). A vantagem é que com a mistura de tecnologias pode-se extrair o que há de melhor em cada uma: a alta performance do MOLAP e a escalabilidade do ROLAP.
19. Data Mining:
É o processo de varrer grandes bases de dados em busca de padrões como regras de associação, seqüências temporais, para classificação de itens ou agrupamentos. Na etapa de Data Mining, várias técnicas são utilizadas, como Estatística, Recuperação de Informação, Inteligência Artificial e Reconhecimento de Padrões. São exemplos de técnicas de "mineração de dados": Redes Neurais, Regras de Associação, Clustering, Algoritmo genético, Árvores de decisão e Indução de Regras, entre outras.

Autor: Lucas Assis


Artigos Relacionados


Banco De Dados

Linguagem De Acesso A Banco De Dados Relacional:

Integração De Banco De Dados De Fontes Heterogêneas

Criação De Bando De Dados Msql No Cpanel

Como A Tecnologia Da Informação, Através Da Inteligência Empresarial – “business Intelligence” ( Bi ), Tem Provocado Impacto Na Gestão Das Empresas?

Como A Tecnologia Da Informação, Através Da Inteligência Empresarial – “business Intelligence” ( Bi ), Tem Provocado Impacto Na Gestão Das Empresas?

Como Será O Futuro Sem Eles? Dados, Informação E Conhecimento A Alma Do Data Warehouse