Materiais recomendados

Nesta página, você encontra diversos materiais complementares que podem te auxiliar no processo de aprendizagem de R. Os temas estão divididos nas seguintes seções: gerais, visualização de dados, estatística, reprodutibilidade e comunicação, aprendizado de máquina e metanálise. Todos os materiais são de acesso aberto sem custo algum. A lista abaixo é mantida pelo autor Bruno Montezano.

Gerais

  • R for Data Science (segunda edição): trata-se de um livro escrito por Hadley Wickham, Mine Çetinkaya-Rundel e Garrett Grolemund que foca em uma coleção de pacotes (tidyverse) voltados para ciência de dados com R.
  • Advanced R: escrito por Hadley Wickham, aborda aspectos mais avançados referentes à programação em R de forma mais aprofundada.
  • Reproducible Medical Research with R: Livro escrito por um médico sobre fluxos de trabalho em R para criação de pipelines reprodutíveis.
  • The Epidemiologist R Handbook: Livro de referência para códigos em R que facilitam rotinas de análise de dados para epidemiologia.
  • Introdução ao R: em português, escrito por Sergio Miranda Freire, trata aspectos introdutórios da programação em R com aplicações.
  • R for Health Data Science: livro breve escrito por Ewen Harrison e Riinu Pius sobre aplicação de programação em R na manipulação, análise e interpretação de dados em saúde.
  • Hands-On Programming with R: escrito por Garrett Grolemund, trata-se de um livro breve de introdução a programação em R com aplicações e exemplos práticos que pode ser utilizado como material auxiliar.
  • Materiais sobre R por Beatriz Milz: criado pela professora e doutoranda Beatriz Milz e mantido pela comunidade, trata-se de uma página que armazena diversas fontes de informação sobre R nos idiomas português, inglês e espanhol.

Visualização de dados

  • Data Visualization: A Practical Introduction: um livro muito completo escrito por Kieran Healy sobre visualização de dados com ggplot2. Caso opte por apenas uma referência em visualização, recomendo este livro.
  • R Graphics Cookbook (segunda edição): escrito por Winston Chang, é um guia prático com mais de 150 receitas para gerar gráficos em R rapidamente.
  • ggplot2: Elegant Graphics for Data Analysis: livro escrito por Hadley Wickham, trata-se da terceira edição da obra que explica a gramática dos gráficos por trás do ggplot2. Material para entender os detalhes que constituem o pacote.
  • Fundamentals of Data Visualization: escrito por Claus O. Wilke, trata-se de um livro que aborda aspectos mais gerais de como criar visualizações que refletem os dados, como contar uma história e montar visualizações profissionais. Os plots do livro foram todos criados usando ggplot2.
  • PDF com cores do R: este documento criado pelo Dr. Ying Wei, lista a maioria das cores nomeadas do R que podem ser utilizadas para personalizar seus gráficos.

Estatística

Reprodutibilidade e Comunicação

  • Building reproducible analytical pipelines with R: escrito por Bruno Rodrigues, é um ótimo material para criar fluxos de trabalho reprodutíveis de maneira robusta. É um livro mais aprofundado do que o Reproducible Medical Research with R, e requer maior conhecimento em computação.
  • R Markdown: The Definitive Guide: escrito por Yihui Xie, J. J. Allaire e Garrett Grolemund, trata-se de um guia completo para criar relatórios, artigos, livros, websites, blogs, dashboards em R através de uma sintaxe unificada do RMarkdown.
  • Mastering Shiny: escrito por Hadley Wickham, trata-se de um livro para criação de aplicativos web em R a partir do framework shiny.
  • Happy Git and GitHub for the useR: escrito por Jennifer Bryan, é um livro guia de como instalar git, trabalhar com GitHub e integrar seus projetos do R com estas ferramentas. Material para quem busca desenvolver fluxos de trabalho de colaboração ou reprodutibilidade.
  • blogdown: Creating Websites with R Markdown: livro por Yihui Xie, Amber Thomas e Alison Presmanes Hill, é um guia para o pacote blogdown, usado para criar websites e blogs com a sintaxe do R Markdown.
  • bookdown: Authoring Books and Technical Documents with R Markdown: do autor Yihui Xie, é um livro guia para o pacote bookdown, que facilita o processo de criação de livros e relatórios técnicos em R com R Markdown. Suporta saídas em PDF, Word, HTML, etc, e apresenta diversas outras funcionalidades.
  • Good enough practices in scientific computing: escrito por Greg Wilson et al., o paper publicado em 2017 apresenta boas práticas de computação para pesquisadores, independentemente do nível de habilidade em computação, a fim de melhorar a efetividade em trabalhar com dados, software e projetos.
  • R Packages (segunda edição): livro escrito por Hadley Wickham e Jennifer Bryan sobre como criar pacotes em R para compartilhar e reutilizar seu código de forma reprodutível e encapsulada.
  • Engineering Production-Grade Shiny Apps: livro escrito por Colin Fay, Sébastien Rochette, Vincent Guyader e Cervan Girard, discute o processo de construir uma aplicação web em Shiny que possa ser enviada para produção (deploy). Assume conhecimentos prévios com o framework shiny.

Machine Learning

  • An Introduction to Statistical Learning: livro escrito por Gareth James, Daniela Witten, Trevor Hastie e Rob Tibshirani sobre introdução ao aprendizado estatístico com exemplos em R em todos os capítulos.
  • Aprendizado de máquina: uma abordagem estatística: livro em português escrito pelo prof. Rafael Izbicki da UFSCAR. Segue moldes parecidos com o An Introduction to Statistical Learning, mas trabalha mais conceitos estatísticos.
  • Feature Engineering and Selection: A Practical Approach for Predictive Models: livro escrito por Max Kuhn e Kjell Johnson, trata de aspectos relacionados com a engenharia e seleção de variáveis, abordando temas como pré-processamento de dados, divisão dos dados, tunagem de hiperparâmetros, etc.
  • Tidy Modeling with R: o melhor livro prático para aprendizado de máquina em R atualmente, escrito por Max Kuhn e Julia Silge, apresenta o framework tidymodels para criar modelos, aplicando boas práticas metodológicas e estatísticas.
  • Supervised Machine Learning for Text Analysis in R: se você tiver interesse em trabalhar com aprendizado de máquina supervisionado e análise de texto, esse livro escrito por Emil Hvitfeldt e Julia Silge é uma boa pedida.
  • Deep Learning and Scientific Computing with R torch: Livro sobre o torch, um framework em R para criar modelos de deep learning, além de possibilitar rotinas complexas de computação científica. Publicado em abril de 2023.
  • Text Mining with R: A Tidy Approach: trata-se de um livro escrito por Julia Silge e David Robinson para introduzir a mineração de texto com R usando o pacote tidytext. Apresenta diversos exemplos de problemas reais.

Metanálise