Código
#>Estatística e Probabilidade
Prof. Ben Dêivide (DEFIM/CAP/UFSJ)
A linguagem R é uma ferramenta poderosa e gratuita utilizada mundialmente para estatística, análise de dados e ciência de dados. Ela foi criada por Robert Gentleman e Ross Ihaka na Universidade de Auckland, Nova Zelândia, e hoje é mantida pela R Foundation for Statistical Computing.
O grande diferencial do R é que ele não é apenas um software, mas sim uma linguagem de programação completa, o que significa que você pode escrever comandos para que o computador execute tarefas exatamente como você deseja. Mesmo parecendo complicado no início, com um pouco de prática e seguindo este guia, qualquer pessoa consegue aprender e dominar suas funções básicas.
Este material tem como objetivo apresentar os conceitos fundamentais da linguagem R de forma simples e objetiva. Nosso foco é guiar o iniciante desde o processo de instalação até a compreensão de como o R organiza e trabalha com as informações, fornecendo exemplos práticos para facilitar o aprendizado.
Para começar a usar, primeiro precisamos instalar dois programas:
OBS: Após instalar, ao abrir o RStudio, você verá que ele já conecta automaticamente com o R que você instalou primeiro
Mais detalhes sobre as instalações do R e Rstudio podem ser vistas nas videos aulas e nos livros disponivel em https://bendeivide.github.io/.
O R tem três princípios (CHAMBERS, 2016) fundamentais que é necessario conhecer: o princípio do objeto (tudo que existe em R é um objeto), o princípio da função (tudo que acontece no R é uma chamada de função), e o princípio da interface (interfaces para outros programas são parte do R).
Quando você clica no ícone do R e abre o programa, após instala-lo, aparece uma janela preta ou cinza claro com letras brancas ou pretas. Parece uma “tela de comando” antiga. No topo diz algo como: R x.x.x (o número da versão). Isso só confirma que você abriu o programa certo. Quando abre, aparece um monte de texto escrito automaticamente. Você não precisa ler tudo agora, mas saiba o que significa:

Onde ta escrito copyright: diz que é gratuito, o naturalmente, sem garantia: significa que não tem ninguém responsável se der erro, o type ‘demo()’…: são exemplos prontos para você rodar se quiser ver o que o R faz, type ‘license’…: mostra as regras de uso.
Depois de todo aquele texto, você vai ver uma setinha maior que isso:
#>Esse simbolo “>” é o “prompt”, ele significa: “estou pronto!, escreva aqui o que você quer que eu faça.” É exatamente na frente desse símbolo que você digita seus comandos. Quando você aperta Enter, o R executa e traz o resultado, e depois mostra o simbolo “>”de novo, esperando o próximo comando.
Basicamente, você usa essa janela como se fosse uma calculadora super poderosa.
Exemplo do que fazer:
1- Clique com o mouse na frente do “>”.
2- Digite: “2 + 2”
3- Aperte Enter no teclado.
O resultado:
#> 2 + 2
#[1] 4
#>O R calculou e respondeu “4”, o “[1]” só quer dizer “esse é o primeiro resultado”, e o “>” aparece de novo esperando mais.
Outros exemplos para testar agora:
#> 5 * 10 # Multiplicação
#[1] 50
#> 100 / 4 # Divisão
#[1] 25
#> sqrt(16) # Raiz quadrada
#[1] 4São essas operações basicas que podemos fazer na interface do R, para colocar a mão na massa agente usa o Rstudio que é a “casa” onde vamos escrever os códigos, deixando o programa mais bonito e fácil de usar.
Quando você abre o RStudio, a tela é dividida em 4 partes principais, que chamamos de quadrantes:
Como funciona: Você escreve o comando no Editor, aperta (Ctrl + Enter) e o resultado aparece no Console. Assim como esta na imagem a seguir.

Para teres minima ideia de como é o funcionamento do Rstudio, vamos criar um grafico simples como demostração. Primeira coisa a fazer é cliquar em “File > New File > R Script”, para abrir uma nova janela no primeiro quadrante (em cima lado esquerdo), depois so passar os codigos.
# Vamos criar dois conjuntos de números
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 6)
# Agora vamos fazer um gráfico de pontos
plot(x, y, main="Meu Primeiro Gráfico no RStudio!", col="blue", pch=16)
Para rodar o Código é so colocar o mouse na primeira linha (“x <- …”) e aperte Ctrl + Enter, faça o mesmo na segunda linha (“y <- …”), depois o mesmo na linha do “plot(…)”, ou podes selecionar desde “x” até o final de “plot” e clicar em “Ctrl + Enter” e veras o resultado no painel inferior direito, na aba Plots mostrando um gráfico com pontos azuis, e no painel superior direito (Environment), aparecera “x” e “y” com os valores. È basicamente assim que funciona no Rstudio.
Agora, imagina que tens muitas informaçõe para guardar no computador: números, nomes, datas, resultados de provas, etc. Se jogares tudo misturado no programa, vai ficar uma bagunça e não vais encontrar nada depois.
Precisas guardar essas informações de forma arrumada, é aqui aonde funciona as estruturas de dados do R.
No R, encontramos varios tipos de caixas ou organizadores, que servem para organizar e guardar os dados, encontrar a informação rápida depois, e fazer cálculos e gráficos sem errar, cada caixa contem um formato diferente servindo pra guardar um tipo especifico de dados.
Esses organizadores ou caixas mais usados são:
1- O vetor (Vector), é a estrutura mais básica que guarda valores do mesmo tipo.
Exemplo:
x <- c(1, 2, 3, 4)Podem ser números, como tambem texto.
nomes <- c("Ana", "João", "Carlos")2- A matriz (Matrix), são dados em formato de tabela (linhas e colunas), onde todos os elementos são do mesmo tipo.
Exemplo:
matriz <- matrix(c(1,2,3,4), nrow = 2, ncol = 2)3- O Data Frame, sendo mais usada no dia a dia como a realização de uma tabela do Excel, e pode ter tipos diferentes em cada coluna.
Exemplo:
dados <- data.frame(
nome = c("Ana", "João"),
idade = c(20, 25),
aprovado = c(TRUE, TRUE))Ele acaba misturando texto, número e lógico.
4- A lista (List), que pode guardar qualquer coisa dentro, e possui uma estrutura mais flexível.
Exemplo:
lista <- list(
nome = "Ana",
idade = 20,
notas = c(7, 8, 9))Ela pode ter vetor, número, texto tudo junto.
5- O fator (Factor), sendo usado para categorias.
Exemplo:
sexo <- factor(c("Masculino", "Feminino", "Feminino"))Ele é muito usado em estatística.
Um exemplo usando todos juntos:
# Vetor
notas <- c(7, 8, 9)
# Matriz
mat <- matrix(notas, nrow = 3)
# Data frame
df <- data.frame(nome = c("Ana", "João"), nota = c(7, 8))
# Lista
lista <- list(df, notas)È claro que não existe só esses, temos mais dois que são seus primos, sendo:
1- As expressões (Expressions), são como “códigos guardados” que ainda não rodaram. Imagine que você escreve uma conta em um papel, mas não calcula ainda, você guarda ela para rodar depois. Serve para programação mais avançada.
2- O objetos S4 / classes / tibble, são tipos mais “modernos” ou mais complexos.
O tibble: é praticamente um Data Frame, mas com cara mais bonita e comportamentos melhores. Muito usado no pacote “tidyverse”. O S4: são estruturas muito organizadas, usadas em pacotes grandes, mas são mais difíceis.
No total são sete, mas os cinco primeiros seram oque iras usar em 99% do seu tempo quando trabalhares com R.
Imagine que tens uma panilha pronta no Excel ou no computador com milhares de linhas, não vais querer digitar tudo de novo no R né!
Aqui é que entra uma outra parte da beleza do R, que é a importação e exportação dos dados.
A importação dos dados é o ato de trazer dados de fora para dentro do R. Pegar o arquivo do seu computador e abrir dentro do programa. A exportação de dados é o ato de levar dados do R para fora. Depois que você analisou, arrumou ou fez cálculos, você salva o resultado em um arquivo novo para enviar para alguém ou abrir no Excel. Esses dois atos economizam o seu tempo, te ajuda a trabalhar com dados reais e compartilha resultados.
Para importar esses dados, ou melhor, para trazer esses dados para dentro, usaremos uma linha de codigo para cada caso.
Para arquivos CSV, escrevemos o seguinte:
#meus_dados <- read.csv("dados.csv", header = TRUE)Agora para arquivos Excel precisaremos liberar o pacote ‘readxl’, por isso escrevemos o seguinte:
library(readxl)
#meus_dados <- read_excel("dados.xlsx")Depois de fazer tudo isso o R precura o nosso arquivo, e o encontrando ele da uma observasação, entende, transforma em Data Frame (em formato de tabela), e guarda dentro da caixinha que nomeamos de “meus_dados”.
Se depois do R fazer isso e não enviar nenhuma mensagem é porque deu certo, pois o silencio é a resposta preferida do computador, porem se aparecer vermelho é porque deu alguma coisa errada então precisamos ver oque colocamos errado.
Já na realização da exportação salvando um data frame como CSV, escrevemos o seguinte:
#write.csv(minha_tabela, file = "minha_tabela_pronta.csv")E assim, realizamos a importação e exportação de dados.
Um dos menbros do corpo do R que usas sem saber bem no inicio quando entras no Rstudio, e que é importante conheceres são as funções do R. Pense assim: Função é uma “ferramenta pronta”. Imagine que você quer cortar um pão. Você não precisa fabricar uma faca do zero, né? Você pega a faca pronta, usa ela para cortar e pronto. No R é a mesma coisa.
Funções são “receitas de bolo” prontas. Elas pegam informações, processam e devolvem um resultado. Tudo no R é função! Elas sempre têm parênteses “()”. As funções básicas como “sum()”: soma os valores, “mean()”: calcula a media, e o “sqrt()”: calcula a raiz quagrada, são amplamente utilizadas para operações matemáticas, enquanto funções como “data.frame()”: criar tabelas, e “subset()”: filtrar dados, são empregadas na manipulação e organização de dados. Temos outros como o “max()”: achar o maximo, o “min()”: o “c()”: conbinar valores, o “<-” (atribuição), o “plot()”: graficos basicos, o “summary()”: resumo estatístico, e muitos outros.
Exemplo:
# Criando um vetor de notas
notas <- c(7, 8, 5, 9, 6)
# Soma das notas
soma <- sum(notas)
# Média
media <- mean(notas)
# Maior nota
maior <- max(notas)
# Menor nota
menor <- min(notas)
# Quantidade de alunos
quantidade <- length(notas)
# Mostrando resultados
soma[1] 35
media[1] 7
maior[1] 9
menor[1] 5
quantidade[1] 5
As funções são nativas do R, tornando-o em uma linguagem pratica, pois, se para somares “2 + 2”, e tivesses de ensinar ao computador oque é a soma, isso daria muito trabalho e gastarias muito tempo. Essas funções existe para não reinventares a roda, e sim aproivetar e desfrutar da sua beleza.
È muito importante saber como se cria um projeto no R.
Para manter seu trabalho organizado, é ideal criar um Projeto no RStudio. Cria-se uma pasta específica onde tudo (códigos, dados, resultados) fica salvo junto.
Para criar um projeto primeiramente vamos clicar em “File” -> “New Project”, depois escolhemos “New Directory” -> “New Project”, em seguida damos um nome ao projeto, ex: “MeuPrimeiroProjeto”, e clicamos em “Create Project”“.
Ao seguir esse passos o seu projeto estara pronto para ser elaborado.
Busca compreender esse pensamento: ” imagine o R como se fosse um celular novo. Quando você compra um celular, ele já vem com algumas funções básicas: calculadora, relógio, navegador. Isso é o R Base (o que já vem instalado).
Os Pacotes são como os APLICATIVOS que você baixa na loja. Eles são ferramentas extras que outras pessoas criaram e disponibilizaram de graça para você usar, e serevm para dar poderes novos ao R, ler arquivos do Execel, fazer graficos bonitos e coloridos, organizar e limpar dados muito rapido, e muito mais.
Os Pacotes mais Básicos e Importante do R são:
1- O readxl, Servindo para ler arquivos do Excel ( .xlsx ). Obs: O R “de fábrica” só lê CSV direitinho. Se você quiser abrir uma planilha do Excel, precisa desse pacote!
2- O ggplot2, Servindo para fazer gráficos. É o pacote mais famoso do mundo para criar gráficos com cara de profissional, bonitos e organizados.
3- O dplyr, Servindo para arrumar e manipular dados. Imagine que você tem uma tabela enorme e quer filtrar, ordenar ou juntar informações. Esse pacote faz tudo ficar mais fácil e rápido. Antes de usar cada pacote, o instalamos primeiro digitando: r
install.packages("readxl")
library(readxl)Uma das grandes vantagens do R é a sua flexibilidade e capacidade de se conectar com outras ferramentas. Ele não funciona sozinho; ele “conversa” com outras linguagens de programação, bancos de dados e sistemas, permitindo que você use o melhor de cada mundo em um mesmo projeto.
Isso é muito importante porque cada uma das linguagem tem o seu ponto forte. O R é melhor para estatística e gráficos, o Python é ótimo para machine learning e automação, o SQL é essencial para bancos de dados grandes, e o C/C++ serve para deixar cálculos muito mais rápidos.
Principais Integrações
1- A integração com Python: é a parceria mais famosa! Com o pacote “reticulate”, você pode rodar código Python diretamente dentro do seu script R, usar bibliotecas Python (como Pandas ou Scikit-learn) e trocar dados entre as duas linguagens facilmente.
Exemplo Prático:
# Carregar o pacote
library(reticulate)
# Agora você pode escrever código Python usando py_run_string()
py_run_string("
import numpy as np
numeros = np.array([1, 2, 3, 4, 5])
print(numeros.mean())
")3.0
2- A integração com C e C++: quando você precisa fazer cálculos muito pesados ou rápidos, o R pode chamar funções escritas em C ou C++. Isso é muito usado por desenvolvedores de pacotes para deixar o software mais eficiente. Usando as funções como o “C()” ou “Call()” conectamos com os códigos compilados.
3- A integração com Bancos de Dados (SQL): não precisamos importar todos os dados para o R. Pode se conectar diretamente em servidores como MySQL, PostgreSQL, SQL Server e fazer consultas usando a linguagem SQL sem sair do RStudio.
Exemplo com SQLite:
# Pacote para conexão
library(RSQLite)
# Conectando ao banco
con <- dbConnect(SQLite(), dbname = "meu_banco.db")
# Escrevendo uma consulta SQL dentro do R
#dados <- dbGetQuery(con, "SELECT * FROM tabela_clientes WHERE idade > 18")
# Ver o resultado
#head(dados)4- A integração com LaTeX e Markdown: o R trabalha muito bem com ferramentas de escrita de documentos. Com o pacote “rmarkdown”, você cria relatórios, PDFs, apresentações e sites que misturam texto, código R e os resultados automaticamente. É a base do que chamamos de Ciência Reprodutível.
Tambem temos outras linguagens que o R tem interfaces, como o Java (pacote “rJava”), a Julia (para computação de alto desempenho), e o Fortran (muito usado em cálculos matemáticos antigos e robustos).
Portanto, esses foram as principais estruturas do corpo da linguagem R.
Apresentamos os principais fundamentos da linguagem R, desde a instalação, organização da interface, uso de funções, pacotes e manipulação de dados. Vimos que, apesar de exigir prática inicial, o R é uma ferramenta poderosa, gratuita e versátil, capaz de se integrar com outras linguagens.
Aprender R exige dedicação, mas os benefícios são enormes. Com os conceitos aqui apresentados, você já possui a base necessária para desenvolver projetos, analisar informações e evoluir nos estudos de estatística e ciência de dados.
BRITO, Ben Dêivide. leem: Learning from Elementary Statistics Methodology. Disponível em: https://bendeivide.github.io/leem/. Acesso em: 12 de abr. de 2026.
CHAMBERS, John M. Extending R. Boca Raton: CRC Press, 2016..
DALGAARD, Peter. Estatística Básica com R. Rio de Janeiro: Elsevier, 2008.
KABAKOFF, Robert. R in Action: Data Analysis and Graphics with R. 2. ed. Manning Publications, 2015.
POSIT. RStudio Documentation. Disponível em: https://posit.co/resources/. Acesso em: 12 de abr. de 2026.
R CORE TEAM.R: A Language and Environment for Statistical Computing. Vienna: R Foundation for Statistical Computing, 2025. Disponível em: https://www.R-project.org/. Acesso em: 12 de abr. de 2026.
WICKHAM, Hadley; GROLEMUND, Garrett. R para Ciência de Dados. 1. ed. Disponível em: https://livro.curso-r.com/. Acesso em: 12 de abr. de 2026.
WICKHAM, Hadley. Advanced R. 2. ed. Boca Raton: CRC Press, 2019. Disponível em: https://adv-r.hadley.nz/. Acesso em: 12 de abr. de 2026.