Kevin Meza Landeros

SCRIPT;Obtencion de Secuencias

1 +# EQUIPO 5
2 +# ENFERMEDADES MONOGENICAS
3 +
4 +# Este script este creado para obtener las secuencias de los genes seleccionados previamente.
5 +# Usamos el Gene Ensembl ID para obtener las secuencias de Ensembl
6 +
7 +# Llamado de librerias
8 +library(httr)
9 +library(jsonlite)
10 +library(xml2)
11 +
12 +# Lectura dearchivos
13 +##En esta parte colocar path de archivo all_data.txt
14 +all_data<-read.csv(file = "C:/Users/Fer/Desktop/all_data.txt", header = FALSE, sep = "\t")
15 +##Seleccion de la columna seis, que contiene los Gene Ensembl IDs de cada uno de nuestrso genes
16 +IDs<-all_data$V6
17 +IDs[15160]
18 +
19 +
20 +## Por cada gen conecta a ensembl y hace una solicitud de la secuencia dado el Gene Enesembl ID
21 +for (i in 1:length(IDs)){
22 + server <- "https://rest.ensembl.org"
23 + ext <- paste("/sequence/id/", IDs[i], sep = "")%>%paste("?species=homo_sapiens", sep = "")
24 + r <- GET(paste(server, ext, sep = ""), content_type("text/x-fasta"))
25 + stop_for_status(r)
26 + ## vamos generando un archivo con las secuencias em formato fasta. Colocar path donde desee el archivo fasta.
27 + write.table(x = content(r), file = "C:/Users/Fer/Desktop/seqs_tot.fasta", quote = FALSE, row.names = FALSE, col.names = FALSE, append = TRUE, eol = "")
28 +}
...\ No newline at end of file ...\ No newline at end of file