Showing
1 changed file
with
28 additions
and
0 deletions
scripts/ObtencionSecuencias.R
0 → 100644
| 1 | +# EQUIPO 5 | ||
| 2 | +# ENFERMEDADES MONOGENICAS | ||
| 3 | + | ||
| 4 | +# Este script este creado para obtener las secuencias de los genes seleccionados previamente. | ||
| 5 | +# Usamos el Gene Ensembl ID para obtener las secuencias de Ensembl | ||
| 6 | + | ||
| 7 | +# Llamado de librerias | ||
| 8 | +library(httr) | ||
| 9 | +library(jsonlite) | ||
| 10 | +library(xml2) | ||
| 11 | + | ||
| 12 | +# Lectura dearchivos | ||
| 13 | +##En esta parte colocar path de archivo all_data.txt | ||
| 14 | +all_data<-read.csv(file = "C:/Users/Fer/Desktop/all_data.txt", header = FALSE, sep = "\t") | ||
| 15 | +##Seleccion de la columna seis, que contiene los Gene Ensembl IDs de cada uno de nuestrso genes | ||
| 16 | +IDs<-all_data$V6 | ||
| 17 | +IDs[15160] | ||
| 18 | + | ||
| 19 | + | ||
| 20 | +## Por cada gen conecta a ensembl y hace una solicitud de la secuencia dado el Gene Enesembl ID | ||
| 21 | +for (i in 1:length(IDs)){ | ||
| 22 | + server <- "https://rest.ensembl.org" | ||
| 23 | + ext <- paste("/sequence/id/", IDs[i], sep = "")%>%paste("?species=homo_sapiens", sep = "") | ||
| 24 | + r <- GET(paste(server, ext, sep = ""), content_type("text/x-fasta")) | ||
| 25 | + stop_for_status(r) | ||
| 26 | + ## vamos generando un archivo con las secuencias em formato fasta. Colocar path donde desee el archivo fasta. | ||
| 27 | + write.table(x = content(r), file = "C:/Users/Fer/Desktop/seqs_tot.fasta", quote = FALSE, row.names = FALSE, col.names = FALSE, append = TRUE, eol = "") | ||
| 28 | +} | ||
| ... | \ No newline at end of file | ... | \ No newline at end of file |
-
Please register or login to post a comment