Transformar dados em informações
Data is the new oil, traduzida literalmente para "os dados são o novo petróleo" é uma frase icónica que todos nós já ouvimos e que parece ser cada vez mais atual, apesar de ter sido dita pela primeira vez há mais de uma década (em 2006, por Clive Humby, Senior Marketer na Tesco). Mas será mesmo verdade?
Enquanto consumidores, experienciamos todos os dias em primeira mão como os nossos dados influenciam as organizações a melhorar os seus produtos e serviços.
Diariamente, milhões de pessoas em todo o mundo utilizam redes sociais e motores de pesquisa. Atualmente as grandes organizações a nível mundial atribuem grande parte do seu sucesso à recolha e análise de dados em grande escala acerca de como as suas plataformas são utilizadas, pois estas fornecem bases sólidas para tomar decisões que melhoram a experiência dos utilizadores.
Podemos afirmar que os dados passaram a ter um papel essencial em todas as esferas de atividade.
No entanto, analisando a frase os dados são o novo petróleoconseguimos identificar uma grande diferença entre os dois sujeitos - o petróleo é valioso, mas escasso, enquanto que os dados têm tendência a gerar cada vez mais valor com o tempo e utilização. As organizações que recolhem grandes quantidades de dados geram mais e melhores insights que podem ser traduzidos em valor direto para as organizações. À recolha e análise de dados em grande escala dá-se o nome de big data.
A importância de um armazém de dados moderno
Os armazéns de dados (armazéns de dados) têm um papel chave a desempenhar no processo de criação de valor para as organizações, pois são em primeiro lugar os responsáveis pela agregação de dados das mais diversas fontes de informação, podendo ser geridos tanto on-premises como na Cloud. Essencial para que os possam ser analisados em grande escala, um armazém de dados moderno: suporta qualquer fonte de dados; é facilmente escalável e de simples acesso; centraliza todos os dados (internos ou externos), relevantes para a organização; fornece insights em tempo real através de dashboard; suporta modelos de analítica avançada como aprendizagem automática ou Inteligência Artificial.
Um armazém de dados moderno deve armazenar dados de forma a que estes sejam facilmente acessíveis pelos seus consumidores e simultaneamente possuir a capacidade de processar e interpretar todo o tipo de dados de forma ágil e eficiente.
Como estruturar os dados em grande escala?
No passado, as únicas fontes de dados para as aplicações eram bases de dados. Mas atualmente, existem centenas, se não milhares, de diferentes fontes e cada uma com tipos de dados diferentes, podendo ser estruturados ou não estruturados.
Os dados estruturados têm padrões que podem ser facilmente interpretados. Como por exemplo: nome de clientes; moradas; geolocalização; datas; contactos telefónicos; nomes de produtos; Stock Units (SKUs).
Contudo, nem todos os dados das organizações podem ser classificados numérica ou semanticamente, e é aqui que entram os dados não estruturados como: imagens; vídeos; e-mails e documentos; dispositivos IoT e sensores.
Estes dados são extremamente relevantes serem consolidados e integrados com os demais dados, permitindo obter uma visão holística sobre componentes de negócio, como por exemplo os seus clientes.
Para atingir esse objetivo é essencial assegurar que as soluções de dados são capazes de integrar estes dois tipos de dados num único ponto central.
Construir uma Pipeline de dados
Após identificar todas as diferentes fontes de dados, é essencial criar uma pipeline de dados. Os passos necessários nesta fase são:
1. transferir os dados de todas as fontes (estruturadas e não estruturadas) para a armazém de dados;
2. armazenar os dados num lago de dados;
3. aplicar processos e procedimentos de qualidade dos dadospreparando-os para serem utilizados em modelos analíticos avançados;
4. aplicar regras e conceitos de negócio, disponibilizando-os para serem consumidos pelos seus utilizadores;
5. exploração e visualização dos dados em plataformas como o Power BI. Visualização de dados fornece uma representação rica e relevante dos dados que permitem a tomada de decisões orientadas para os dadosadicionando valor ao negócio e aos clientes.
Através desta abordagem, é construída uma arquitetura altamente escalável que serve todos os utilizadores: desde utilizadores finais, a engenheiros de dados e cientistas de dados que exploram os dados, a analistas que os interpretam para o negócio e até ao CEO que pretende compreender melhor o que acontece no seu negócio em tempo real.
Artigo de branded content na IT Insight, página 44.
Contactar-nos:
+351 210 171 610
Comentários