Tarefas de casa

Bem-vindo à página de tarefas de casa do curso! Aqui você encontrará as tarefas de casa referentes a cada aula do curso, juntamente com um link para o gabarito ao final. As tarefas foram cuidadosamente selecionadas para ajudar você a praticar e aplicar o conhecimento adquirido em cada aula, e são uma parte importante do processo de aprendizado. Certifique-se de completar todas as tarefas e utilizar o gabarito para verificar suas respostas e entender qualquer dúvida que possa ter. Espero que você aproveite este recurso e aprimore suas habilidades em R!

Aula 1: R e RStudio

  1. Dê uma olhada no site do curso.

  2. Crie um vetor de 1 a 25 e armazene em uma variável de nome sequencia (lembre-se do operador :).

  3. Crie um vetor de caractere de dois elementos com seu nome e último nome (chamado nome_completo) e extraia seu sobrenome usando [].

  4. Filtre a base pixar_bilheteria do pacote dados e extraia apenas os filmes que tiveram orçamento menor que 100 milhões de dólares (lembre-se do $, do <, do [] e da função library()).

Acessar o gabarito.

Aula 2: Manipulação de dados

  1. Escolha uma das bases de dados do pacote dados e utilize ao menos uma vez as funções: select(), mutate(), filter(), arrange(), summarise() e group_by() (as bases disponíveis podem ser acessadas no site de referência do pacote).

  2. Nos dados questionario do pacote dados, crie um subconjunto apenas com as observações do ano de 2014 e armazene em um objeto chamado dados_2014.

Acessar o gabarito.

Aula 3: Visualização de dados

  1. A partir dos dados pinguins do pacote dados, crie:
    1. Um gráfico de pontos (dispersão)
    2. Um box plot (variável numérica estratificada por uma variável categórica)
    3. Um histograma
  2. Escolha um dos seus gráficos para ajustá-lo e deixá-lo visualmente mais agradável. Isso pode incluir ajustar os rótulos, tamanho da fonte, cores, adicionar título, e o que mais você achar importante (lembre-se da função labs() e família theme_[estilo_do_tema]()).

Acessar o gabarito.

Aula 4: Análise descritiva

A tarefa da Aula 4 deve ser realizada com os dados pinguins do pacote dados.

  1. Filtre a base para manter apenas as observações do ano de 2009.

  2. Verifique se a variável comprimento_bico da base de dados segue uma distribuição normal através de um histograma e um teste de normalidade de Shapiro-Wilk.

  3. Com a função count(), verifique a frequência da variável sexo na base de dados.

  4. Com a função summarise(), calcule a média, mediana e desvio padrão da variável comprimento_nadadeira.

Acessar o gabarito.

Aula 5: Inferência estatística

A partir da base dos pinguins do pacote dados:

  1. Calcule a correlação produto momento de Pearson entre o comprimento do bico e a profundidade do bico dos pinguins. Crie um gráfico de pontos (dispersão) com ggplot2 para acompanhar sua análise exploratória.

  2. Rode um teste t de duas amostras para verificar a diferença na média do comprimento da nadadeira entre os pinguins macho e fêmea. Usando as funções group_by() e summarise() do pacote dplyr, faça um resumo da média e da mediana dos comprimentos das nadadeiras estratificando pelos grupos (lembre-se que a base pinguins possui onze valores ausentes, os conhecidos NA, na coluna do sexo).

  3. Crie um modelo de ANOVA de uma via para verificar se há diferenças na massa corporal dos pinguins baseado em sua espécie. Caso sim, rode um teste de Tukey para analisar quais grupos diferenciam entre si.

Acessar o gabarito.

Aula 6: Modelos de regressão

  1. Ler Capítulo 8 do livro OpenIntro Statistics sobre Introduction to linear regression (caso queira se aprofundar, ler Capítulo 9 sobre Multiple and logistic regression).

  2. A partir dos dados dados_iris do pacote dados, crie um modelo de regressão linear simples e um modelo de regressão linear múltipla com as variáveis da sua escolha (lembre-se que o desfecho deve ser contínuo, ou seja, numérico).

  3. Crie um gráfico de dispersão/pontos (scatterplot) para acompanhar sua análise de regressão linear simples.

Acessar o gabarito.

Aula 7: Introdução ao aprendizado de máquina

  1. Rodar os códigos dos slides para tentar reproduzir o exemplo
    • Lembre-se de instalar o pacote tidymodels caso não o tenha

Acessar o gabarito.