Arquivo mensal 28/06/2021

porRicardo Jorge

Backup – fazer reter recuperar e descartar

Neste artigo sobre Backup – fazer reter recuperar e descartar, serão abordados aspectos importantes sobre a metodologia e uso do backup.

Não serão abordadas ferramentas para backup e recuperação, porque existem inúmeras delas no mercado e cada usuário e empresa utiliza aquela que melhor se adéqua em preço e características para seu caso de uso.

Independente da ferramenta, a maioria dos usuários imagina que fazendo um backup, estará seguro para todo o sempre.

Os procedimento de backup não devem ter foco exclusivo em salvar os dados, mas em poder recuperá-los de forma rápida e segura quando for necessário.

Sim, o backup é importante, mas ter uma forma segura e consistente para recuperar os dados e as informações é muito diferente de apenas fazer uma recuperação dos dados salvos.

E porque isto acontece ?

Porque os dados armazenados nos backups, dependem de algum tipo de aplicativo para serem utilizados, além das mídias que suportam estes backups.

Casos como arquivos de texto, planilhas e apresentações, são mais fáceis de serem contornados, mas mesmo assim, estes arquivos podem depender de alguma versão ou configuração específica do aplicativo onde foram criados e que agora precisam existir para podermos ter acesso ao dado recém recuperado.

Quando falamos sobre recuperar dados de um Banco de Dados, a versão do Sistema de Gerenciamento de Banco de Dados ( SGBD ) é o primeiro ponto a ser avaliado antes de uma tentativa de recuperação. Para estes caso, é sempre melhor utilizar a própria ferramenta do SGBD, para fazer a salva e a recuperação dos dados.

Conforme a idade do backup, ou o tempo desde que esta cópia de segurança foi feita, pode ser que o aplicativo já tenha mudado de versão ou até que o computador já não tenha mais o sistema operacional onde aquele aplicativo possa ser executado.

Pode ser impossível recuperar as informações de um backup muito antigo !

O outro lado de um backup muito antigo é que os dados a serem recuperados causarão a perda dos dados atuais.

Esta perda não é só devida ao fato dos dados serem sobrescritos, mas também pelo fato dos dados antigos já não fazerem mais sentido para o momento.

Isto ocorre por mudanças de legislação, onde os dados tinham uma certa quantidade de informações e a estrutura atual exige mais / outros campos, ou ainda sistemas externos, como órgãos públicos, que necessitam receber os dados em um determinado formato, que é diferente daquele salvo no backup antigo.

É fundamental considerar as mídias onde os backups foram salvos !

Backups antigos também podem ter sido salvos em mídias que terão dificuldade ou até mesmo impossibilidade de acesso no futuro.

Lembrando que este “futuro”, pode ser nosso presente, caso o backup tenha sido feito a 5 ou mais anos atrás.

Estas dificuldades podem ser de vários níveis, como :

  • Formato dos dados, caso tenha sido usada alguma ferramenta proprietária para salvar os dados.
    • Podemos ficar encantados com alguma facilidade proporcionada por um produto e / ou fabricante específico, mas é importante entender se esta forma de armazenar os dados, permitirá sua recuperação no momento necessário.
  • A mídia física onde os dados foram salvos. Exemplos : CD, DVD, discos de 5 1/4 e 3 1/2, fitas para backup
    • No caso dos CDs e DVDs, muitos computadores já são vendidos sem estas unidades
    • Para as fitas, o tempo e a forma de armazenamento podem criar danos irreparáveis
  • Mesmo no caso dos USB, temos visto várias mudanças como : USB-2, USB-3 e mais recente USB-C
    • Isto serve tanto para os Pen Drive como para os HDs externos tão populares para backup.

Não basta ter uma única cópia dos dados

Quando levamos um backup a sério, devemos ter em mente que muitas situações podem ocorrer com os dados salvos e com a mídias onde salvamos estes dados.

Uma forma muito usada para preservar seus backups é a regra 3-2-1.

A regra 3-2-1 pode ajudar muito, pois afirma que deve haver pelo menos 3 cópias dos dados, armazenados em 2 tipos diferentes de mídia de armazenamento, e uma cópia deve ser mantida fora do local, em um local remoto.

Este local remoto pode variar muito, e devemos considerar a facilidade de acesso e o custo para hospedagem.

Com o aumento de invasões e sequestros de dados, ter cópias que não possam ser acessadas de maneira remota pelos hackers, pode ser uma boa opção para proteção adicional.

Para backup em fita, existem empresas especializadas em buscar e devolver as fitas utilizadas, sendo que as fitas ficam em local próprio para seu armazenamento, considerando temperatura, umidade e segurança física.

Hoje existe cada vez mais a facilidade de armazenamento em Nuvem, que deve ser considerado dependendo do volume dos dados e da frequência na qual se deseja acessar estes backups.

O armazenamento em Nuvem pode apresentar custos para envio e recuperação dos dados, assim como pelo tempo de retenção e também pelo volume armazenado.

Também vale lembrar que, para enviar e recuperar os dados que estão na Nuvem, você precisará de um acesso Internet que precisará estar disponível e ser confiável no momento crítico de uma recuperação.

No geral, o descarte do backup é uma decisão do negócio e uma política da empresa e do setor onde esta empresa atua

Quando pensamos em ambientes corporativos, deve existir algum procedimento que defina o momento do descarte dos dados armazenados nos vários backups e arquivamentos já feitos.

Existem inúmeras regras e legislações que precisam ser consideradas para um descarte.

No lado da retenção dos dados, uma opção é criar processos de archiving ( arquivamento ), para aliviar os backups com dados mais recentes.

Cada setor da indústria terá diferentes regras para arquivamento e política de retenção.

Isto definirá quais dados estarão em meios que sejam mais ou menos rápidos para consulta e recuperação.

Esta definição também tem relação com os custos para o armazenamento destes dados.

Backup não é algo que você só faz quando tem tempo !

Por fim, todos sabemos que um backup pode ser demorado e consumir tempo, mas é algo que deve ser tratado com seriedade.

Planejar com cuidado e prever os vários usos e necessidades para uma restauração, definirá boa parte de suas rotinas de backup e também como e onde armazenar seus dados.


Outros artigos :

Pare de chamar tudo de Inteligência Artificial

TensorFlow.js – introdução a machine learning


Image by Reimund Bertrams from Pixabay
porRicardo Jorge

TensorFlow.js – introdução a machine learning

Neste artigo sobre TensorFlow.js – introdução a machine learning, será feita uma introdução a este poderoso Framework para machine learning ( ou Aprendizado de máquina em português ).

Até bem recentemente, apenas começar a escrever sua primeira linha de código de aprendizado de máquina exigia um grande investimento inicial em tempo e dinheiro.

A boa notícia é que para iniciar o aprendizado de máquina, nunca foi tão fácil.

Na verdade, se você está lendo este artigo, significa que já tem as ferramentas de que precisa para mergulhar de cabeça.

Agora você pode aprender a estrutura de aprendizado de máquina TensorFlow diretamente no seu navegador, usando Javascript.

O TensorFlow.js foi lançado no Google I / O 2018.

Executar o aprendizado de máquina no navegador abre um mundo de casos de uso e é uma ótima oportunidade de usar Javascript para aprender sobre os conceitos e estruturas de aprendizado de máquina.

Dando os primeiros passos

Tudo que você precisa para executar o Tensorflow.js é seu navegador WEB.

É fácil perder de vista toda a conversa sobre transpiladores, empacotadores e demais ferramentas, mas tudo que você precisa é um navegador da WEB para executar TensorFlow.js.

O código que você desenvolve localmente é o mesmo código que você poderá enviar aos usuários para executar em seus navegadores.

Se você é novo no Javascript ou se já faz um tempo desde que escreveu qualquer código de front-end, algumas das mudanças recentes nas linguagens podem confundi-lo.

Um pouco da história do Javascript

À medida que nossas expectativas para os aplicativos da web aumentaram na última década, o ecossistema de front-end explodiu em complexidade.

A linguagem Javascript, em particular, amadureceu muito como linguagem de programação, adotando uma série de mudanças com visão de futuro para a linguagem, enquanto continua a oferecer suporte a uma das maiores bases de usuários de qualquer linguagem de programação.

Novas alterações nas especificações da linguagem Javascript são referenciadas com acrônimos como ES5, ES6, ES2015, E2016.

ES significa ECMAScript e Javascript é baseado neste padrão. 5 e 6 eram tradicionalmente usados ​​para se referir a versões do padrão, mas hoje em dia os anos são usados ​​para maior clareza.

Nem todos os navegadores WEB suportam da mesma forma as várias versões de ECMAScript e alguns problemas de compatibilidade podem ocorrer.

Por que os modelos de código em JavaScript

Muitos modelos foram implementados em Python porque Python é uma escolha popular entre cientistas de dados e tem o melhor suporte em termos de funções.

No entanto, a ampla adoção do aprendizado profundo ( deep learning ) em todos os tipos de aplicativos atraiu desenvolvedores de diferentes origens em linguagens de programação.

Além disso, as práticas de implementação de modelos tornaram-se mais bem compreendidas e amplamente disponíveis, permitindo que mais desenvolvedores construam seu próprio modelo que se adapta melhor a sua aplicação.

Felizmente, o TensorFlow foi projetado para oferecer suporte a diferentes vinculações de linguagem, em particular, programação Python, C, R, JavaScript e Java ™.

Como cada linguagem oferece seu próprio conjunto de vantagens, os desenvolvedores têm seus motivos para escolher a linguagem de programação.

Portanto, é importante permitir que os desenvolvedores permaneçam com seus ambientes de programação familiares, em vez de exigir que eles aprendam uma nova linguagem.

Por que APIs de alto nível ?

Codificar um modelo em uma API de alto nível permite que você seja mais produtivo, concentrando-se no design de alto nível e evitando as porcas e parafusos da implementação de baixo nível.

O código é muito mais curto e fácil de ler e manter.

O que são os Tensores ?

Os tensores são os principais blocos de construção do TensorFlow.

Eles são contêineres de dados n-dimensionais. Você pode pensar neles como arrays multidimensionais em linguagens como PHP, JavaScript e outras.

O que isso significa é que você pode usar tensores como valores escalares, vetoriais e matriciais, uma vez que são uma generalização deles.

Cada tensor contém as seguintes propriedades

  • rank – número de dimensões
  • shape – tamanho de cada dimensão
  • dtype – tipo de dados dos valores

Conclusão : TensorFlow.js é um Framework que permite inúmeras possibilidades e neste artigo foi feita apenas uma breve introdução, deixando links para materiais que podem ser consultados para uma experiência mais completa sobre este assunto.

É importante conhecer e saber que existem várias opções, quando o assunto é “aprendizado de máquina”.


Material consultado :

Hello World with Tensorflow.js

Coding a deep learning model using TensorFlow.js

Getting Started with TensorFlow.js

Introduction to Tensorflow.js and Machine Learning


Artigos relacionados :

Pare de chamar tudo de Inteligência Artificial

IoT o que fazer após a instalação?

IoT e os dados dos sensores e do CLP


Image by Gerd Altmann from Pixabay