Showing
1 changed file
with
28 additions
and
0 deletions
scripts/ObtencionSecuencias.R
0 → 100644
1 | +# EQUIPO 5 | ||
2 | +# ENFERMEDADES MONOGENICAS | ||
3 | + | ||
4 | +# Este script este creado para obtener las secuencias de los genes seleccionados previamente. | ||
5 | +# Usamos el Gene Ensembl ID para obtener las secuencias de Ensembl | ||
6 | + | ||
7 | +# Llamado de librerias | ||
8 | +library(httr) | ||
9 | +library(jsonlite) | ||
10 | +library(xml2) | ||
11 | + | ||
12 | +# Lectura dearchivos | ||
13 | +##En esta parte colocar path de archivo all_data.txt | ||
14 | +all_data<-read.csv(file = "C:/Users/Fer/Desktop/all_data.txt", header = FALSE, sep = "\t") | ||
15 | +##Seleccion de la columna seis, que contiene los Gene Ensembl IDs de cada uno de nuestrso genes | ||
16 | +IDs<-all_data$V6 | ||
17 | +IDs[15160] | ||
18 | + | ||
19 | + | ||
20 | +## Por cada gen conecta a ensembl y hace una solicitud de la secuencia dado el Gene Enesembl ID | ||
21 | +for (i in 1:length(IDs)){ | ||
22 | + server <- "https://rest.ensembl.org" | ||
23 | + ext <- paste("/sequence/id/", IDs[i], sep = "")%>%paste("?species=homo_sapiens", sep = "") | ||
24 | + r <- GET(paste(server, ext, sep = ""), content_type("text/x-fasta")) | ||
25 | + stop_for_status(r) | ||
26 | + ## vamos generando un archivo con las secuencias em formato fasta. Colocar path donde desee el archivo fasta. | ||
27 | + write.table(x = content(r), file = "C:/Users/Fer/Desktop/seqs_tot.fasta", quote = FALSE, row.names = FALSE, col.names = FALSE, append = TRUE, eol = "") | ||
28 | +} | ||
... | \ No newline at end of file | ... | \ No newline at end of file |
-
Please register or login to post a comment