Kevin Meza Landeros

Delete ObtencionSecuencias.R

1 -# EQUIPO 5
2 -# ENFERMEDADES MONOGENICAS
3 -
4 -# Este script este creado para obtener las secuencias de los genes seleccionados previamente.
5 -# Usamos el Gene Ensembl ID para obtener las secuencias de Ensembl
6 -
7 -# Llamado de librerias
8 -library(httr)
9 -library(jsonlite)
10 -library(xml2)
11 -
12 -# Lectura dearchivos
13 -##En esta parte colocar path de archivo all_data.txt
14 -all_data<-read.csv(file = "C:/Users/Fer/Desktop/all_data.txt", header = FALSE, sep = "\t")
15 -##Seleccion de la columna seis, que contiene los Gene Ensembl IDs de cada uno de nuestrso genes
16 -IDs<-all_data$V6
17 -IDs[15160]
18 -
19 -
20 -## Por cada gen conecta a ensembl y hace una solicitud de la secuencia dado el Gene Enesembl ID
21 -for (i in 1:length(IDs)){
22 - server <- "https://rest.ensembl.org"
23 - ext <- paste("/sequence/id/", IDs[i], sep = "")%>%paste("?species=homo_sapiens", sep = "")
24 - r <- GET(paste(server, ext, sep = ""), content_type("text/x-fasta"))
25 - stop_for_status(r)
26 - ## vamos generando un archivo con las secuencias em formato fasta. Colocar path donde desee el archivo fasta.
27 - write.table(x = content(r), file = "C:/Users/Fer/Desktop/seqs_tot.fasta", quote = FALSE, row.names = FALSE, col.names = FALSE, append = TRUE, eol = "")
28 -}
...\ No newline at end of file ...\ No newline at end of file