Datacenter – Banco De Dados

Consultas Rápidas

Entre com palavras-chave em PROCURAR (evite preposições), ou selecione um item em CATEGORIAS, na coluna da direita.

Sistemas de Banco de Dados

O que é um banco de dados e qual a sua importância?

A maioria de nós está familiarizada com algum tipo de sistema de manutenção de registros. Algumas pessoas armazenam todos os seus recibos como preparação para o pagamento de impostos. Outros que gerem uma empresa podem manter o controle de suas vendas e despesas para se certificar de que estão atingindo suas metas. Médicos mantem os arquivos de todos os seus pacientes, e assim por diante.

Um sistema de banco de dados não é nada mais do que um armário de arquivamento eletrônico e os “pedidos” são interações com o armário para adicionar, remover, atualizar ou recuperar um arquivo.

Que tipo de dados que você pode coletar?

Normalmente, você deseja salvar os dados que vai ser de algum valor para você no futuro. Isso é chamado de dados persistentesporque ele é salvo por um tempo maior do que o comprimento da sessão do usuário ou de um dia inteiro de atividade.

Devido ao “poder dos dados e da análise” em gerar eficiência, insights e oportunidades, a importância das bases de dados é fundamental para todas as empresas de hoje.

Este é uma questão a ser prospectada tanto na perspectiva de vendas quanto na perspectiva técnica.

Bom Programa!

Big data

Como o big data difere dos dados normais?

A quantidade de informações que temos hoje é muito maior e não é capaz de ser processada pelos métodos tradicionais. Bancos de dados relacionais são demasiado caros e restritivos para tratar essa nova demanda. Os modelos não-relacionais mais escaláveis ??e flexíveis estão vindo à tona.

Para dar uma ideia de escala e crescimento, estima-se que 1,2 zettabytes (1,2 × 10 21bytes) de dados foram criados em 2010. A título de comparação, estima-se que haja entre 10 20 e 10 24 grãos de areia em nosso planeta. Imagine peneirar tudo isso! 

Existem alguns termos usados ??para descrever dados. O primeiro é o volume, que é uma característica óbvia do nome big data. A quantidade de informação é o maior problema e levou os engenheiros a investir em sistemas distribuídos como a solução. Em seguida, é a velocidade, que se refere à taxa em que os novos dados são criados. A velocidade de dados do Facebook é muito superior do que de um site de uma empresa tradicional. Com tantas interações no Facebook todos os dias, o Facebook precisa de fazer uma importante decisão: o que manter e o que jogar fora? Sites de compras online enfrentam um dilema semelhante. Cada vez que um usuário clica em um item ou escreve um termo de pesquisa, a empresa deve decidir se deseja salvar essa informação. No entanto, quanto maior o volume para salvar, maior velocidade é necessária para converter dados em insights. Se os varejistas são lentos para personalizar a experiência da web para seus clientes devido a um atraso no processamento de dados, os concorrentes mais rápidos são susceptíveis de ganhar. Por último, existe variedade. Se os dados provêm de várias fontes e em várias formas, apresenta um conjunto de questões a resolver muito mais complicado.

Até logo!

Arquitetura distribuída e Hadoop!

Como a ferramenta Hadoop usa o processamento distribuído para processar grandes massas de informação?

Vamos supor que você tenha um grande volume de dados de variedade significativa. As chances de você poder gerar informação ou insights são poucas ou nenhuma, especialmente se não for identificado um padrão óbvio.

Uma palavra importante em big data é Hadoop, Uma plataforma de software que permite às organizações executarem testes em seus dados com a esperança de responder perguntas.

A arquitetura distribuída é a chave por trás da capacidade de armazenar e processar grandes quantidades de informação. Hadoop permite que as organizações gerem um sentido aos seus dados espalhando-os ao longo de um grupo de poderosos processadores que funcionam em paralelo para estudar as informações. O método geral Hadoop usa o chamado Mapear Reduzir (MapReduce), que consiste em duas partes: mapear e reduzir. Suponha que você tem alguma pergunta que você deseja determinar a partir de seu conjunto de dados e seus projetistas escrevem uma função que teoricamente vai dar a resposta certa. A função Map vai separar a tarefa em várias partes e distribuí-la através de várias máquinas. Quando esta fase estiver completa, a função reduzir irá combinar os resultados em uma única tarefa para concluir a análise. Nenhuma máquina única é capaz de fazer uma grande quantidade de trabalho em tempo hábil, de modo que a estratégia de dividir e conquistar do Hadoop é uma ferramenta muito poderosa.

Bom Programa!

Sistema de Gerenciamento de BD – SGBD

Qual a função do sistema de gerenciamento de banco de dados num sistema de informação?

Num banco de dados o SGBD é responsável pela definição do banco de dados, armazenamento, manipulação, e compartilhamento dos dados entre usuários e aplicações.

Pense o SGBD como o chefe da gestão de arquivo, responsável por gerenciar os pedidos de acesso ao banco de dados. Quando um usuário clica em “aceitar amigo” no Facebook, um pedido é criado e dirigido para o banco de dados. O SGBD deve aceitar e analisar todos os pedidos antes de enviar a solicitação ao longo do seu caminho para o banco de dados, em que ponto ele é interpretado(Como para o que é dizer o banco de dados para fazer) e executado. O código que realmente acessa a base de dados sobre o nome de DMB é chamado um sublíngua dados; uma versão popular é SQL.

O SGBD fornece uma maneira de controlar a simultaneidade (Várias solicitações ao banco de dados acontecendo ao mesmo tempo), redundância(O mesmo pedaço de informação armazenada várias vezes no banco de dados), a segurançaa recuperação(Proteção contra algum tipo de falha de banco de dados), e otimização-aspects que melhorar muito o valor para o desenvolvedor.

Bom Programa!

Tipos de armazenamentos em Banco de Dados

Como podem ser classificados os sistemas de armazenamento?

O hardware de armazenamento pode ser classificados de diversas formas: primário, secundário e terciário.

Armazenamento primário. Fornece acesso rápido aos dados porque unidade central de processamento do computador (CPU) interage diretamente com ele. A CPU executa as instruções de um programa de computador, por isso pense nisso como o cérebro do processo ou a executora do programa. Quando um computador tem de executar uma tarefa que você pediu, ele irá acessar o armazenamento primário para as instruções específicas sobre o que fazer antes que a CPU executE. Termos associados com o armazenamento primário incluem registradores, memória cache (também referida como memória de acesso aleatório estática ou RAM), e RAM dinâmica (DRAM) ou memória principal. Estas várias partes estão associados com tarefas diferentes, mas todos eles servem para manter os dados e programas que a CPU está usando ativamente pronto para execução. Dizemos que o armazenamento primário é volátil, porque depois que a máquina seja desligada ou fica sem energia, os conteúdos são perdidos. O armazenamento primário é muito caro, no entanto, e, portanto, tende a ser limitado nas suas dimensões.

Armazenamento secundário. Não é volátil, mais barato, e não está diretamente acessado pela CPU. Como os dados persistem mesmo depois que o computador está desligado e porque nós normalmente gostaríamos que a segurança de nossos dados para ser independente do poder de nosso computador, pode não ser surpreendente saber que o armazenamento secundário serve como nosso local de armazenamento em massa. A CPU não pode acessar diretamente o conteúdo do armazenamento secundário; portanto, os dados devem primeiro ser copiadas para armazenamento primário antes da execução, que implica numa velocidade menor para acessar mais lento. Unidades de disco rígido, memória flash e disquetes são exemplos de armazenamento secundário.

Armazenamento terciário. É semelhante ao armazenamento secundária na medida em que não é acessado diretamente pela CPU. É utilizado para o armazenamento de dados em massa e é muito mais lento do que o armazenamento secundário.

O tradeoff chave para distinguir essas três classes de armazenamento é tempo de acesso vs. despesa.

Bom Programa!

Os Quatro Componentes do Bancos de Dados

Bases de dados consistem em quatro componentes: dados, hardware, software e usuários.

Dados

Dados é a condição sine qua non de um banco de dados – sendo a informação real que você deseja salvar no banco de dados. Além dos dados, você também guarda informações sobre os dados e banco de dados. Você salva este “metadados”em um lugar chamado o “catalogo -para o caso de você precisar refrescar sua memória sobre o que você está coletando e como está sendo armazenado.

Metadados, são dados sobre outros dados. Um item de um metadado pode dizer do que se trata aquele dado, geralmente uma informação inteligível por um computador. Os metadados facilitam o entendimento dos relacionamentos e a utilidade das informações dos dados.

Equipamento (hardware)

Os dados são fisicamente armazenados em algum componente de hardware que tipicamente em armazenamento secundário, tais como discos magnéticos. O hardware de armazenamento pode ser classificados de diversas formas: primária, secundária e terciária.

Programas

Quando os usuários interagem com um site por exemplo, eles vão executar determinadas ações que devem ser salvas no banco de banco de dados. Um sistema de gerenciamento de banco de dados (DMBS) constitui a camada de software de interface entre os usuários e o banco de dados real.

Usuários

Os usuários finais são os usuários que interagem com uma aplicação, geram solicitações para o banco de dados em segundo plano. Quando um novo usuário se registra, por exemplo, uma solicitação de banco de dados é emitida solicitando ao SGBD adicionar um novo usuário ao banco de dados.

Até logo!