[1] 275
Aula 1
Grupo Alliance
Programa de Pós-Graduação em Psiquiatria e Ciências do Comportamento
Universidade Federal do Rio Grande do Sul
8 de maio de 2023
Desenvolver habilidades básicas no manejo e visualização de dados em R
Aprender conceitos básicos de programação
Introduzir conceitos e rotinas de análise de dados em saúde
Psicólogo
Mestrando em Psiquiatria e Ciências do Comportamento
Integrante do grupo de pesquisa Alliance
Pesquisa
Como será realizado?
Materiais: https://brunomontezano.github.io/r-workshop/
O que é o R e por que usá-lo?
Visão geral do RStudio
Comandos básicos do R
Todos os materiais do curso estarão no site do curso.
Se algo não estiver funcionado no site, me enviem um email!
Lembrando que todas as aulas serão realizadas às 19h do horário de Brasília.
Vocês vão ler pesquisa quantitativa
Vocês podem fazer pesquisa quantitativa
Negrito indica um termo importante.
Itálico indica ênfase ou instruções para clicar com o mouse.
Código
representa o código em R para ser digitado ou teclas para realizar ações.
Ctrl-P
para abrir a janela de impressão”.R é uma linguagem de programação construída para computação estatística.
Vamos supor que vocês já tenham domínio no Excel, SPSS, Stata, ou SAS, por quê usar R?
O RStudio é um ambiente de desenvolvimento integrado (IDE) para facilitar nossa vida.
Vamos abrir o RStudio e ir em Arquivo > Novo Arquivo > R Script.
Podemos executar (rodar) nosso código de diversas formas:
Selecionar linhas no Editor e clicar em Executar no topo ou pressione Ctrl+Enter
ou ⌘+Enter
para rodar a seleção
Com o seu cursor (|
) na linha que você quer executar, pressione Ctrl+Enter
ou ⌘+Enter
. Notem que o cursor se move para a próxima linha, para que possamos rodar vários códigos em sequência
Escreva linhas individuais no Console e pressione Enter
O Console vai mostrar as linhas que você rodou seguido pela saída.
No Console, vamos digitar 111 + 222 + 333
e pressionar Enter
.
O [1]
na saída indica o índice numérico do primeiro elemento da linha.
sqrt()
é um exemplo de função do R.
Se nós não soubermos o que sqrt()
é, podemos digitar ?sqrt
no Console e ver a aba de Ajuda na direita.
Argumentos são as entradas de uma função. Nesse caso, o único argumento para sqrt()
é x
, que pode ser um número ou um vetor de números.
Arquivos de ajuda provém documentação em como usar as funções e o que a função retorna.
R armazena tudo como um objeto, incluindo dados, funções, modelos, e saídas.
A criação de um objeto pode ser feita usando o operador de atribuição: <-
Operadores como o <-
são funções que parecem símbolos mas geralmente ficam entre argumentos (números ou objetos) ao invés de ter eles entre ()
como na função sqrt(x)
Nós fazemos contas matemáticas com operadores, por exemplo, x + y
.
+
é o operador de adição. Mas temos outros operadores matemáticos:
-
: subtração*
: multiplicação/
: divisão^
: potenciação%%
: módulo (resto da divisão)Nós podemos mostrar ou “chamar” um objeto através do seu nome.
Dicas para nomear objetos:
.
ou _
para dividir palavrasVocê pode tratar o nome do objeto como se ele fosse os valores armazenados no próprio objeto.
Um vetor é uma série de elementos, como números, por exemplo.
Nós podemos criar um vetor usando a função c()
que significa “combinar”.
Atribuir em um nome já existente sobrescreve esse objeto.
Você pode usar um vetor como argumento para várias funções.
Os vetores podem assumir três classes principais no R.
Podem ser de caractere (ou string):
Lembrando que os vetores podem ter um único elemento, como o vetor_numerico
criado acima.
Quando temos vetores de mais de um elemento, pode ser interessante acessar elementos específicos. Para isso, podemos usar os colchetes ([]
).
vetor_exemplo <- c(2, 13, 22, 95)
vetor_exemplo[c(1, 3)] # Dessa forma, extraímos apenas o primeiro e o terceiro elemento
[1] 2 22
animais <- c("Gato", "Cachorro", "Vaca", "Zebra", "Gorila", "Avestruz", "Cabra")
animais[3:5] # Extrair apenas do elemento 3 até o elemento 5
[1] "Vaca" "Zebra" "Gorila"
[1] "Cachorro"
O operador dois pontos (:
) gera um vetor usando a sequência de números inteiros do primeiro até o segundo argumento. 3:5
equivale a c(3, 4, 5)
.
Temos nosso vetor de exemplo:
Podemos querer extrair elementos de um vetor a partir de alguma condição, na forma de expressões lógicas.
Existem vários outros operadores lógicos:
==
: igual a!=
: não é igual a>
, >=
, <
, <=
: menor que, menor que ou igual a, etc%in%
: usado para checar igual a um entre vários valoresPodemos combinar mais de uma condição com os seguintes operadores:
&
: ambas condições precisam ser respeitadas (E)|
: pelo menos uma condição precisa ser respeitada (OU)!
: inverte uma condição lógica (TRUE
vira FALSE
, FALSE
vira TRUE
)[1] 13
[1] 2 13 22 95
[1] 2 13
Agora, vamos dar uma olhada em outra estrutura de dados, os data frames!
data.frame
?Um data frame é uma tabela na qual cada coluna contém valores de uma variável e cada linha contém uma observação. Estrutura de dados mais comum em saúde.
data.frame
Vamos criar um data.frame
no R com cinco variáveis e quatro observações.
df_aula <- data.frame(
nome = c("Bruno", "Marcos", "Pedro", "José"),
idade = c(18, 22, 25, 21),
profissao = c("Psicólogo", "Professor", "Jogador de futebol", "Bombeiro"),
tem_namorada = c("Sim", "Sim", "Não", "Sim"),
gosta_de_r = c("Sim", "Não", "Não", "Não")
)
df_aula
nome idade profissao tem_namorada gosta_de_r
1 Bruno 18 Psicólogo Sim Sim
2 Marcos 22 Professor Sim Não
3 Pedro 25 Jogador de futebol Não Não
4 José 21 Bombeiro Sim Não
Na próxima aula, vamos aprender a carregar nossos próprios dados para dentro do R!
data.frame
Diferente dos vetores, que são objetos unidimensionais, os data frames possuem duas dimensões.
Nesse caso, vamos usar os colchetes ([]
) para indexar a base na forma: objeto_do_dataframe[linha, coluna]
.
nome | idade | profissao | tem_namorada | gosta_de_r |
---|---|---|---|---|
Bruno | 18 | Psicólogo | Sim | Sim |
Marcos | 22 | Professor | Sim | Não |
Pedro | 25 | Jogador de futebol | Não | Não |
José | 21 | Bombeiro | Sim | Não |
data.frame
Também podemos indexar a partir de expressões lógicas assim como nos vetores. Para isso, fazemos uso do operador $
.
nome idade profissao tem_namorada gosta_de_r
1 Bruno 18 Psicólogo Sim Sim
2 Marcos 22 Professor Sim Não
4 José 21 Bombeiro Sim Não
Pacotes são conjuntos de funções ou dados que podem adicionar novas funcionalidades no R.
Instale uma vez!
Use variás vezes!
dados
O pacote dados
disponibiliza diversas bases de dados para aprendizado. E a melhor parte, são todas traduzidas para português!
E então carregamos com a função library()
para usar os dados disponibilizados:
# A tibble: 24 × 5
filme orcamento bilheteria_eua_canada bilheteria_outros_pa…¹
<chr> <dbl> <dbl> <dbl>
1 Toy Story - Um Mundo … 30000000 191796233 181757800
2 Vida de Inseto 120000000 162798565 200460294
3 Toy Story 2 90000000 245852179 251522597
4 Monstros S. A. 115000000 289916256 342400393
5 Procurando Nemo 94000000 339714978 531300000
6 Os Incríveis 92000000 261441092 370165621
7 Carros 120000000 244082982 217900167
8 Ratatouille 150000000 206445654 417280431
9 WALL-E 180000000 223808164 297503696
10 Up - Altas Aventuras 175000000 293004164 442094918
# ℹ 14 more rows
# ℹ abbreviated name: ¹bilheteria_outros_paises
# ℹ 1 more variable: bilheteria_mundial <dbl>
sequencia
:
nome_completo
) e extraia seu sobrenome usando []
pixar_bilheteria
do pacote dados
e extraia apenas os filmes que tiveram orçamento menor que 100 milhões
$
, do <
, do []
e da função library()
O ChatGPT é um chatbot que pode ajudar na aprendizagem de programação
Ele pode responder perguntas sobre sintaxe, funcionalidades e solução de problemas no R
Você pode utilizar o pacote gptstudio
para auxiliar nos códigos, gramática dos documentos, ou para comentar seu código no RStudio.
Ainda, o pacote askgpt
foi criado para auxiliar na interação direta com o ChatGPT dentro do R.