Showing
1 changed file
with
22 additions
and
1 deletions
1 | # Ejercicio: Clasificación de oraciones sobre dominios estructurales de proteínas | 1 | # Ejercicio: Clasificación de oraciones sobre dominios estructurales de proteínas |
2 | + | ||
2 | ## Descripción | 3 | ## Descripción |
3 | - Clasificación | 4 | - Clasificación |
4 | - binaria | 5 | - binaria |
... | @@ -6,10 +7,30 @@ | ... | @@ -6,10 +7,30 @@ |
6 | - Categorías | 7 | - Categorías |
7 | - Oraciones sobre dominio estructural (DOM) | 8 | - Oraciones sobre dominio estructural (DOM) |
8 | - Oraciones sobre otro tema (OTHER) | 9 | - Oraciones sobre otro tema (OTHER) |
10 | + | ||
9 | ### Tarea | 11 | ### Tarea |
10 | -Desarrolle varios clasificador utilizando los siguientes métodos de aprendizaje de máquina (tradicionales): SVM, Naïve Bayes, Decision Tree, Random Forest para clasificar un conjunto de oraciones en las categorías mencionadas. | 12 | +Desarrolle varios clasificador utilizando los siguientes métodos de aprendizaje de máquina |
13 | +(tradicionales): SVM, Naïve Bayes, Decision Tree, Random Forest | ||
14 | +para clasificar un conjunto de oraciones en las categorías mencionadas. | ||
15 | + | ||
11 | ### Datos de entrada | 16 | ### Datos de entrada |
12 | - trainData.txt Oraciones de entrenamiento | 17 | - trainData.txt Oraciones de entrenamiento |
13 | - trainClasses.txt Categorías de oraciones de entrenamiento | 18 | - trainClasses.txt Categorías de oraciones de entrenamiento |
14 | - testData.txt Oraciones de evaluación | 19 | - testData.txt Oraciones de evaluación |
15 | - testClasses.txt Categorías de oraciones de evaluación | 20 | - testClasses.txt Categorías de oraciones de evaluación |
21 | + | ||
22 | +## Requerimientos | ||
23 | +- Python y scikit-learn | ||
24 | +- Probar diferentes características (grid de entrenamiento): | ||
25 | + - Palabras | ||
26 | + - Lemmas | ||
27 | + - Lemmas y etiquetas POS | ||
28 | + - Unigramas y bigramas | ||
29 | + - Con y sin stops words | ||
30 | +- Almacenar reporte de resultados de entrenamiento y evaluación | ||
31 | +- Almacenar gráfico de matriz de confusión | ||
32 | +- Evaluar con F-score, Precision, Recall, AUC, gráfica de Precision-Recall, gráfica ROC | ||
33 | +- Almacenar modelo entrenado en archivo (joblib) | ||
34 | +- Afinación de hiperparámetros con método RandomizedGridCV | ||
35 | + | ||
36 | + | ... | ... |
-
Please register or login to post a comment