Seminário em Grupo 6: IoT, Big Data, IA e Ciência de Dados
Postagem realizada em: 13/07/2021 às 02:08:01
Autor: Laiza Silva do Carmo
O sexto e último seminário realizado no semestre teve como tema: IoT, Big Data, IA e Ciência de Dados, a apresentação foi feita pelos discentes Adriana Miranda, Daniel Zaidan e Laíz Colosovski.
Para iniciar apresentação o grupo explicou o conceito de Big Data a área do conhecimento que estuda como tratar, analisar e obter informações a partir de conjuntos de dados grandes demais para serem analisados por sistemas tradicionais.
Logo após, abordaram o tema IoT (Internet of Things), a Internet das coisas é um conceito que se refere à interconexão digital de objetos cotidianos com a internet, conexão dos objetos mais do que das pessoas.
E posteriormente, explicaram o conceito básico de IA (Inteligência Artificial), uma inteligência similar à humana exibida por sistemas de software, além de também ser um campo de estudo acadêmico.
E para finalizar a apresentação do seminário, exibiram informações sobre Ciências de Dados, é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão.
A parte que chamou a atenção e será ressaltada aqui nesse post é o Apache Hadoop:
Hadoop é uma plataforma de software de código aberto para o armazenamento e processamento distribuído de grandes conjuntos de dados, utilizando clusters de computadores com hardware commodity.
Os benefícios da utilização da Hadoop são:
- Escalabilidade e desempenho: o que permite armazenar, gerenciar, processar e analisar dados em escala petabyte;
- A confiabilidade: a Hadoop é fundamentalmente resistente – quando um nó falha de processamento é redirecionado para os nós restantes no cluster e os dados são automaticamente re-replicado em preparação para falhas de nó futuras;
- Flexibilidade: é possível armazenar dados em qualquer formato, incluindo formatos semi-estruturados ou não estruturados, e em seguida, analisar e aplicar esquema para os dados quando ler.
- Baixo custo: ao contrário de software proprietário, o Hadoop é open source e é executado em hardware commodity de baixo custo.
Grandes companhias como a Mastecard, NASA, o Twitter e o Netflix, fazem a utilização quase que obrigatória do Hadoop, apesar dos seguimentos diferentes todas essas empresas estão interessadas em desenvolver capacidades analíticas de dados e aprofundar o conhecimento com base em dados.
Às vezes questionamos porque que o seu smartphone está fazendo propaganda exatamente daquela jaqueta, sapato ou aparelho doméstico que comentamos com um familiar e algum tempo depois como um passo de mágica começam a surgir propagandas em qualquer aplicativo que você acessa, curioso não? Esse é um recurso de armazenamento de dados fornecido pelo Hadoop, as empresas tem acesso às suas necessidades de consumo, em palavras mais “bonitas” coleta de insights sobre clientes para melhorar a linguagem e a abordagem nas estratégias de relacionamento. Toda essa relação com os nossos dados é muito assustadora, no entanto esse tipo de software ainda está em evolução, o que será que ele poderá fazer daqui há algum tempo?