Introdução à Ciencia de Dados: mineração de dados e big data

Capa
Alta Books Editora, 26 de out. de 2016 - 1879 páginas

O fenômeno apontado como a quarta revolução industrial e também conhecido como Big Data está trazendo mudanças profundas no mundo em que vivemos. Ainda é difícil fazer previsões precisas de como o fenômeno vai afetar nossas vidas e nosso mundo, mas sabendo que Big Data vai afetar sua vida pessoal, sua casa, seu carro, seu emprego, sua saúde, suas amizades, sua alimentação, seu sono e até seu lazer. Dados produzidos em grande escala, com velocidade e variedade nunca antes imaginados e que a tecnologia atual tem dificuldade para armazenar e processar. Você houve falar de Big Data todos os dias! Mas do que adianta uma montanha de dados se não formos capazes de extrair valor? Big Data vai mudar a forma como uma indústria produz, como um avião voa, como se planta um alimento, como se trata uma doença, como anunciar um produto e até como ir a Marte. Por trás deste fenômeno está o dado eletrônico, que se por um lado a poucas décadas era produzido por alguns poucos equipamentos e tinha um alto custo de armazenamento, hoje é produzido em tudo que é lugar e o custo de armazená-lo é muito baixo, e a cada dia fica mais barato. Como o dado é produzido? Como é armazenado?
De que forma é consumido? Como extrair informação e conhecimento? Como tratar aspectos de segurança e privacidade? Esta obra traz uma introdução ao mundo do dado, em um estudo que vem desde sua geração ao descarte, com ênfase especial na sua análise.

Esta obra está dividida em duas grandes partes: A primeira parte é uma introdução ao mundo da Ciência de Dados e Big Data, abordando questões que envolvem os modelos pré-relacionais, relacionais e pós-relacionais, como NoSQL, processos de transformação de dados, armazenamento analítico, como o Data Warehouse, e HDFS, sem deixar de tratar de maneira clara a Mineração de Dados e outras técnicas analíticas.

A segunda parte é prática, onde o leitor pode implementar os conceitos estudados, desenvolvendo diversas técnicas de análise de dados como Classificação, Agrupamentos, Lei de Benford, entre outras.

 

 

O que estão dizendo - Escrever uma resenha

Não encontramos nenhuma resenha nos lugares comuns.

Conteúdo

INTRODUÇÃO
3
PRODUÇÃO DE DADOS
19
Dados Não Estruturados e Semiestruturados 33 Além do Armazenamento 34 Transformação 35 ETL 35 Conclusão 37 4 ARMAZENAMENTO ANA...
39
Data Warehouse versus MapReduce 60 5 ANÁLISE DE DADOS
61
Além de Prever Fazer Acontecer 71 6 ANÁLISES EXPLÍCITAS
73
Analisando o Ponto Eletrônico 78 7 ANÁLISES IMPLÍCITAS
81
OUTRAS TÉCNICAS
117
Grafos para Cartéis 125 9 VISUALIZAÇÃO DE DADOS
127
Criando Funções 209 12 CURSO DE WEKA
213
Weka KnowledgeFlow 220 13 ANÁLISES EXPLORATÓRIAS
221
Caras de Chernoff 234 14 ANÁLISES EXPLÍCITAS NA PRÁTICA
237
Recalculando Sub_Total 238 Recalculando Total 240 15 REGRESSÃO
243
CLASSIFICAÇÃO
251
Vizinho mais Próximo
263
Métodos de Grupos 264 Redes Neurais Artificias 265 Regras de Classificação 266 17 AGRUPAMENTOS
271
RECRAS DE ASSOCIAÇÃO
279

BAM em Folha de Pagamento 133 10 ASPECTOS DIVERSOS
135
Obrigações Acessórias
144

Outras edições - Visualizar todos

Termos e frases comuns

Sobre o autor (2016)

Fernando Amaral, há mais de 15 anos atua com ciência da computação. Tem especial interesse por temas relacionados à análise de dados e tecnologias como R, C#, Hadoop, Visualização, Data Mining, Estatística, BI, OLAP, NoSQL, Weka entre outros. Tem grande experiência em projetos de mineração de dados em áreas como telefonia, contabilidade, marketing, people analytics entre outros. Atualmente ocupa o cargo de Diretor de TI na Shelter IT. Além disso, palestra e leciona cursos de mineração de dados e big data, além de manter diversas mídias sociais com temas relacionados à mineração de dados.

Informações bibliográficas