Materiais recomendados
Nesta página, você encontra diversos materiais complementares que podem te auxiliar no processo de aprendizagem de R. Os temas estão divididos nas seguintes seções: gerais, visualização de dados, estatística, reprodutibilidade e comunicação, aprendizado de máquina e metanálise. Todos os materiais são de acesso aberto sem custo algum. A lista abaixo é mantida pelo autor Bruno Montezano.
Gerais
- R for Data Science (segunda edição): trata-se de um livro escrito por Hadley Wickham, Mine Çetinkaya-Rundel e Garrett Grolemund que foca em uma coleção de pacotes (
tidyverse
) voltados para ciência de dados com R. - Advanced R: escrito por Hadley Wickham, aborda aspectos mais avançados referentes à programação em R de forma mais aprofundada.
- Reproducible Medical Research with R: Livro escrito por um médico sobre fluxos de trabalho em R para criação de pipelines reprodutíveis.
- The Epidemiologist R Handbook: Livro de referência para códigos em R que facilitam rotinas de análise de dados para epidemiologia.
- Introdução ao R: em português, escrito por Sergio Miranda Freire, trata aspectos introdutórios da programação em R com aplicações.
- R for Health Data Science: livro breve escrito por Ewen Harrison e Riinu Pius sobre aplicação de programação em R na manipulação, análise e interpretação de dados em saúde.
- Hands-On Programming with R: escrito por Garrett Grolemund, trata-se de um livro breve de introdução a programação em R com aplicações e exemplos práticos que pode ser utilizado como material auxiliar.
- Materiais sobre R por Beatriz Milz: criado pela professora e doutoranda Beatriz Milz e mantido pela comunidade, trata-se de uma página que armazena diversas fontes de informação sobre R nos idiomas português, inglês e espanhol.
Visualização de dados
- Data Visualization: A Practical Introduction: um livro muito completo escrito por Kieran Healy sobre visualização de dados com
ggplot2
. Caso opte por apenas uma referência em visualização, recomendo este livro. - R Graphics Cookbook (segunda edição): escrito por Winston Chang, é um guia prático com mais de 150 receitas para gerar gráficos em R rapidamente.
- ggplot2: Elegant Graphics for Data Analysis: livro escrito por Hadley Wickham, trata-se da terceira edição da obra que explica a gramática dos gráficos por trás do
ggplot2
. Material para entender os detalhes que constituem o pacote. - Fundamentals of Data Visualization: escrito por Claus O. Wilke, trata-se de um livro que aborda aspectos mais gerais de como criar visualizações que refletem os dados, como contar uma história e montar visualizações profissionais. Os plots do livro foram todos criados usando
ggplot2
. - PDF com cores do R: este documento criado pelo Dr. Ying Wei, lista a maioria das cores nomeadas do R que podem ser utilizadas para personalizar seus gráficos.
Estatística
- OpenIntro Statistics: escrito por Diez et al., um livro livre e de código aberto para introdução à estatística.
- OpenIntro Introduction to Modern Statistics: escrito por Cetinkaya-Rundel et al., também livre e de código aberto, também apresenta conceitos introdutórios enfatizando exemplos com programação em R. Esse livro possui tutoriais interativos em R ao final dos capítulos.
- Fundamentos de Estatística para Ciência de Dados: livro em português, escrito por Filipe Zabala, apresenta diversos capítulos desde análise descritiva até modelos de aprendizado de máquina não-supervisionado com exemplos em R no decorrer do texto.
- Learning Statistics with R: escrito por Danielle Navarro, trata-se de um livro voltado para introdução de conceitos de estatística e probabilidade através de aplicações em R.
- Playlist de Statistics Fundamentals do canal StatQuest: criado por Josh Starmer, trata-se de uma playlist no YouTube que dá uma visão geral de conceitos fundamentais de estatística. A playlist sobre regressão linear e modelos lineares também vale muito a pena assistir.
- Statistical Inference via Data Science: A ModernDive into R and the Tidyverse: livro escrito por Chester Ismay e Albert Y. Kim, demonstra vários exemplos de como usar ferramentas do
tidyverse
e do frameworkmoderndive
para criar rotinas completas de análise de dados englobando a visualização, manipulação, modelagem, inferência e apresentação dos dados. Não assume nenhum conhecimento matemático ou de programação prévio. - Regression and Other Stories: escrito por Andrew Gelman, Jennifer Hill e Aki Vehtari, é um livro sobre como usar modelos de regressão para resolver problemas reais de comparação, estimação, predição e inferência causal. O livro apresenta vários exemplos e códigos em R para todos os capítulos.
- Introduction to Data Science: Data Analysis and Prediction Algorithms with R: livro escrito pelo estatístico Rafael Irizarry, aborda conceitos básicos de R e pacote
tidyverse
, visualização de dados, probabilidade, inferência e regressão, além de comentar sobre machine learning e algumas ferramentas de produtividade. - Beyond Multiple Linear Regression: Applied Generalized Linear Models and Multilevel Models in R: livro escrito por Paul Roback e Julie Legler, é uma introdução a modelos lineares generalizados e modelos multinível em R. Assume conhecimento prévio em regressão linear e logística.
- Bayes Rules! An Introduction to Applied Bayesian Modeling: livro de Alicia Johnson, Miles Ott e Mine Dogucu sobre o poder da estatística bayesiana como uma alternativa para métodos frequentistas de análise de dados. Assume conhecimentos introdutórios de estatística.
Reprodutibilidade e Comunicação
- Building reproducible analytical pipelines with R: escrito por Bruno Rodrigues, é um ótimo material para criar fluxos de trabalho reprodutíveis de maneira robusta. É um livro mais aprofundado do que o Reproducible Medical Research with R, e requer maior conhecimento em computação.
- R Markdown: The Definitive Guide: escrito por Yihui Xie, J. J. Allaire e Garrett Grolemund, trata-se de um guia completo para criar relatórios, artigos, livros, websites, blogs, dashboards em R através de uma sintaxe unificada do RMarkdown.
- Mastering Shiny: escrito por Hadley Wickham, trata-se de um livro para criação de aplicativos web em R a partir do framework
shiny
. - Happy Git and GitHub for the useR: escrito por Jennifer Bryan, é um livro guia de como instalar
git
, trabalhar com GitHub e integrar seus projetos do R com estas ferramentas. Material para quem busca desenvolver fluxos de trabalho de colaboração ou reprodutibilidade. - blogdown: Creating Websites with R Markdown: livro por Yihui Xie, Amber Thomas e Alison Presmanes Hill, é um guia para o pacote
blogdown
, usado para criar websites e blogs com a sintaxe do R Markdown. - bookdown: Authoring Books and Technical Documents with R Markdown: do autor Yihui Xie, é um livro guia para o pacote
bookdown
, que facilita o processo de criação de livros e relatórios técnicos em R com R Markdown. Suporta saídas em PDF, Word, HTML, etc, e apresenta diversas outras funcionalidades. - Good enough practices in scientific computing: escrito por Greg Wilson et al., o paper publicado em 2017 apresenta boas práticas de computação para pesquisadores, independentemente do nível de habilidade em computação, a fim de melhorar a efetividade em trabalhar com dados, software e projetos.
- R Packages (segunda edição): livro escrito por Hadley Wickham e Jennifer Bryan sobre como criar pacotes em R para compartilhar e reutilizar seu código de forma reprodutível e encapsulada.
- Engineering Production-Grade Shiny Apps: livro escrito por Colin Fay, Sébastien Rochette, Vincent Guyader e Cervan Girard, discute o processo de construir uma aplicação web em Shiny que possa ser enviada para produção (deploy). Assume conhecimentos prévios com o framework
shiny
.
Machine Learning
- An Introduction to Statistical Learning: livro escrito por Gareth James, Daniela Witten, Trevor Hastie e Rob Tibshirani sobre introdução ao aprendizado estatístico com exemplos em R em todos os capítulos.
- Aprendizado de máquina: uma abordagem estatística: livro em português escrito pelo prof. Rafael Izbicki da UFSCAR. Segue moldes parecidos com o An Introduction to Statistical Learning, mas trabalha mais conceitos estatísticos.
- Feature Engineering and Selection: A Practical Approach for Predictive Models: livro escrito por Max Kuhn e Kjell Johnson, trata de aspectos relacionados com a engenharia e seleção de variáveis, abordando temas como pré-processamento de dados, divisão dos dados, tunagem de hiperparâmetros, etc.
- Tidy Modeling with R: o melhor livro prático para aprendizado de máquina em R atualmente, escrito por Max Kuhn e Julia Silge, apresenta o framework
tidymodels
para criar modelos, aplicando boas práticas metodológicas e estatísticas. - Supervised Machine Learning for Text Analysis in R: se você tiver interesse em trabalhar com aprendizado de máquina supervisionado e análise de texto, esse livro escrito por Emil Hvitfeldt e Julia Silge é uma boa pedida.
- Deep Learning and Scientific Computing with R torch: Livro sobre o
torch
, um framework em R para criar modelos de deep learning, além de possibilitar rotinas complexas de computação científica. Publicado em abril de 2023. - Text Mining with R: A Tidy Approach: trata-se de um livro escrito por Julia Silge e David Robinson para introduzir a mineração de texto com R usando o pacote
tidytext
. Apresenta diversos exemplos de problemas reais.
Metanálise
Doing Meta-Analysis with R: A Hands-On Guide: livro escrito por Mathias Harrer, Pim Cuijpers, Toshi Furukawa e David Ebert que aborda uma breve introdução em como metanálises podem ser conduzidas no R, abordando métodos avançados.
How to perform a meta-analysis with R: a practical tutorial: artigo publicado em 2019 pela BMJ Mental Health sobre passos práticos para rodar uma metanálise com R.