Estefani Gaytan Nunez

update

...@@ -137,28 +137,26 @@ def word2features(sent, i, S1, S2): ...@@ -137,28 +137,26 @@ def word2features(sent, i, S1, S2):
137 137
138 #====================== S1 ======================# 138 #====================== S1 ======================#
139 if S1: 139 if S1:
140 - listElem = sent[i - 1].split('|') 140 + print("S1")
141 - lemma1 = listElem[1]
142 - postag1 = listElem[2]
143 141
144 - features['hUpper']: hUpper(word) 142 + features['hUpper']= hUpper(word)
145 - features['hLower']: hUpper(word) 143 + features['hLower']= hUpper(word)
146 - features['hGreek']: hGreek(word) 144 + features['hGreek']= hGreek(word)
147 - features['symb']: symb(word) 145 + features['symb']= symb(word)
148 #firstChar 146 #firstChar
149 - features['lemma1[:1]']: lemma1[:1] 147 + features['lemma[:1]']= lemma[:1]
148 + features['postag[:1]']= postag[:1]
150 #secondChar 149 #secondChar
151 - features['postag[:1]']: lemma1[:1] 150 + features['postag[:2]']= postag[:2]
152 - features['postag[:2]']: lemma1[:2] 151 + features['lemma[:2]']= lemma[:2]
153 - features['lemma[:2]']: lemma1[:2]
154 152
155 #====================== S2 ======================# 153 #====================== S2 ======================#
156 if S2: 154 if S2:
157 - #S2 155 + print("S2")
158 - features['isUpper']: word.isupper() 156 + features['isUpper']= word.isupper()
159 - features['isLower']: word.isLower() 157 + features['isLower']= word.islower()
160 - features['isGreek']: isGreek(word) 158 + features['isGreek']= isGreek(word)
161 - features['isNumber']: word.isdigit() 159 + features['isNumber'] = word.isdigit()
162 160
163 161
164 ''' 162 '''
...@@ -348,7 +346,7 @@ if __name__ == "__main__": ...@@ -348,7 +346,7 @@ if __name__ == "__main__":
348 # crf = rs.best_estimator_ 346 # crf = rs.best_estimator_
349 347
350 348
351 - nameReport = str(options.S1) + '_S2_' + str(options.S2) + str(options.version) + '.txt' 349 + nameReport = 'S1_' + str(options.S1) + '_S2_' + str(options.S2) + str(options.version) + '.txt'
352 with open(os.path.join(options.outputPath, "reports", "report_" + nameReport), mode="w") as oFile: 350 with open(os.path.join(options.outputPath, "reports", "report_" + nameReport), mode="w") as oFile:
353 oFile.write("********** TRAINING AND TESTING REPORT **********\n") 351 oFile.write("********** TRAINING AND TESTING REPORT **********\n")
354 oFile.write("Training file: " + options.trainingFile + '\n') 352 oFile.write("Training file: " + options.trainingFile + '\n')
......
No preview for this file type
No preview for this file type
1 ********** TRAINING AND TESTING REPORT ********** 1 ********** TRAINING AND TESTING REPORT **********
2 Training file: training-data-set-70_v4.txt 2 Training file: training-data-set-70_v4.txt
3 3
4 -best params:{'c1': 0.0845144703859872, 'c2': 0.0014492583407590665} 4 +best params:{'c1': 0.16058815571126603, 'c2': 0.009129664457456948}
5 -best CV score:0.803457407167867 5 +best CV score:0.7991895289243558
6 model size: 0.07M 6 model size: 0.07M
7 7
8 -Flat F1: 0.7886994187596283 8 +Flat F1: 0.7842038431135264
9 precision recall f1-score support 9 precision recall f1-score support
10 10
11 OD 1.000 0.405 0.577 37 11 OD 1.000 0.405 0.577 37
12 pH 1.000 1.000 1.000 12 12 pH 1.000 1.000 1.000 12
13 Technique 0.952 0.909 0.930 22 13 Technique 0.952 0.909 0.930 22
14 - Med 0.812 0.912 0.860 57 14 + Med 0.800 0.842 0.821 57
15 Temp 0.818 1.000 0.900 18 15 Temp 0.818 1.000 0.900 18
16 Vess 0.000 0.000 0.000 0 16 Vess 0.000 0.000 0.000 0
17 Agit 0.000 0.000 0.000 0 17 Agit 0.000 0.000 0.000 0
18 Phase 1.000 0.947 0.973 19 18 Phase 1.000 0.947 0.973 19
19 - Air 0.730 0.742 0.736 62 19 + Air 0.780 0.742 0.760 62
20 Anti 0.571 0.444 0.500 9 20 Anti 0.571 0.444 0.500 9
21 Strain 1.000 1.000 1.000 1 21 Strain 1.000 1.000 1.000 1
22 - Gtype 0.863 0.774 0.816 106 22 + Gtype 0.872 0.774 0.820 106
23 Substrain 0.000 0.000 0.000 1 23 Substrain 0.000 0.000 0.000 1
24 - Supp 0.815 0.713 0.761 136 24 + Supp 0.823 0.684 0.747 136
25 Gversion 0.000 0.000 0.000 0 25 Gversion 0.000 0.000 0.000 0
26 26
27 -avg / total 0.841 0.760 0.789 480 27 +avg / total 0.850 0.744 0.784 480
28 28
29 29
30 Top likely transitions: 30 Top likely transitions:
31 -Agit -> Agit 7.567868 31 +Agit -> Agit 6.719064
32 -OD -> OD 7.283561 32 +OD -> OD 6.323533
33 -Temp -> Temp 6.525111 33 +Temp -> Temp 5.626965
34 -Anti -> Anti 6.338173 34 +Med -> Med 5.518631
35 -Med -> Med 6.068203 35 +Anti -> Anti 5.387568
36 -Air -> Air 5.490227 36 +Air -> Air 5.306006
37 -Gtype -> Gtype 5.364943 37 +Gtype -> Gtype 4.649741
38 -O -> O 5.360015 38 +O -> O 4.602569
39 -Phase -> Phase 5.088291 39 +Phase -> Phase 4.554949
40 -Gversion -> Gversion 5.052937 40 +Gversion -> Gversion 4.497882
41 -Technique -> Technique 4.734097 41 +Supp -> Supp 4.147792
42 -Supp -> Supp 4.592596 42 +Technique -> Technique 4.061262
43 -Gtype -> Supp 1.928700 43 +pH -> pH 2.238372
44 -pH -> pH 1.873562 44 +O -> Supp 1.895496
45 -O -> Supp 1.656908 45 +Air -> O 1.750002
46 -O -> Technique 1.579934 46 +Gtype -> Supp 1.554366
47 -Substrain -> Gtype 1.367059 47 +Substrain -> Gtype 1.504459
48 -O -> Gtype 1.299889 48 +O -> Gtype 1.372037
49 -Air -> O 1.168469 49 +O -> Technique 1.353039
50 -O -> Temp 0.796125 50 +Technique -> Air 0.944695
51 -O -> Anti 0.464004 51 +O -> Anti 0.631594
52 -OD -> Phase 0.334945 52 +O -> Temp 0.503749
53 -Med -> O 0.323185 53 +Med -> O 0.429416
54 -O -> Gversion 0.294223 54 +O -> Gversion 0.344788
55 -Technique -> Air 0.120065 55 +OD -> Phase 0.332615
56 -Temp -> O 0.058292 56 +Temp -> O 0.259256
57 -Gversion -> O 0.017060 57 +O -> Med 0.223793
58 -Gtype -> pH 0.014023 58 +Gtype -> Air 0.098960
59 -Anti -> O 0.004741 59 +Supp -> O 0.061572
60 -O -> Med 0.003586 60 +O -> Phase 0.048636
61 -O -> Strain 0.000914 61 +Gtype -> pH 0.031023
62 -Phase -> O 0.000079 62 +Phase -> O 0.028306
63 -Technique -> O -0.064766 63 +O -> Strain 0.026662
64 -Supp -> Air -0.085487 64 +OD -> Air -0.000013
65 -Air -> OD -0.140828 65 +Technique -> O -0.002223
66 -Supp -> OD -0.140855 66 +Technique -> Gtype -0.072225
67 -OD -> Gtype -0.154848 67 +Supp -> Air -0.245156
68 -Gtype -> O -0.178619 68 +Technique -> OD -0.270904
69 -Air -> Supp -0.190285 69 +OD -> Med -0.284259
70 -Phase -> Air -0.254683 70 +Gtype -> Med -0.389196
71 -Supp -> O -0.331239 71 +Gtype -> O -0.401680
72 -OD -> Air -0.339236 72 +OD -> O -0.570578
73 -Supp -> Technique -0.352046 73 +Agit -> O -0.633985
74 -Technique -> OD -0.381551 74 +Gtype -> Anti -0.634022
75 -Gtype -> Anti -0.576175 75 +O -> Air -0.700283
76 -Agit -> O -0.582420 76 +Gtype -> OD -0.910835
77 -O -> Air -0.710972 77 +Supp -> Med -0.967944
78 -OD -> Med -0.720546 78 +Substrain -> O -1.090330
79 -OD -> O -0.754296 79 +Med -> Supp -1.725214
80 -Gtype -> OD -0.821534 80 +Phase -> OD -1.762859
81 81
82 82
83 Top unlikely transitions: 83 Top unlikely transitions:
84 -Med -> Med 6.068203 84 +Agit -> Agit 6.719064
85 -Air -> Air 5.490227 85 +OD -> OD 6.323533
86 -Gtype -> Gtype 5.364943 86 +Temp -> Temp 5.626965
87 -O -> O 5.360015 87 +Med -> Med 5.518631
88 -Phase -> Phase 5.088291 88 +Anti -> Anti 5.387568
89 -Gversion -> Gversion 5.052937 89 +Air -> Air 5.306006
90 -Technique -> Technique 4.734097 90 +Gtype -> Gtype 4.649741
91 -Supp -> Supp 4.592596 91 +O -> O 4.602569
92 -Gtype -> Supp 1.928700 92 +Phase -> Phase 4.554949
93 -pH -> pH 1.873562 93 +Gversion -> Gversion 4.497882
94 -O -> Supp 1.656908 94 +Supp -> Supp 4.147792
95 -O -> Technique 1.579934 95 +Technique -> Technique 4.061262
96 -Substrain -> Gtype 1.367059 96 +pH -> pH 2.238372
97 -O -> Gtype 1.299889 97 +O -> Supp 1.895496
98 -Air -> O 1.168469 98 +Air -> O 1.750002
99 -O -> Temp 0.796125 99 +Gtype -> Supp 1.554366
100 -O -> Anti 0.464004 100 +Substrain -> Gtype 1.504459
101 -OD -> Phase 0.334945 101 +O -> Gtype 1.372037
102 -Med -> O 0.323185 102 +O -> Technique 1.353039
103 -O -> Gversion 0.294223 103 +Technique -> Air 0.944695
104 -Technique -> Air 0.120065 104 +O -> Anti 0.631594
105 -Temp -> O 0.058292 105 +O -> Temp 0.503749
106 -Gversion -> O 0.017060 106 +Med -> O 0.429416
107 -Gtype -> pH 0.014023 107 +O -> Gversion 0.344788
108 -Anti -> O 0.004741 108 +OD -> Phase 0.332615
109 -O -> Med 0.003586 109 +Temp -> O 0.259256
110 -O -> Strain 0.000914 110 +O -> Med 0.223793
111 -Phase -> O 0.000079 111 +Gtype -> Air 0.098960
112 -Technique -> O -0.064766 112 +Supp -> O 0.061572
113 -Supp -> Air -0.085487 113 +O -> Phase 0.048636
114 -Air -> OD -0.140828 114 +Gtype -> pH 0.031023
115 -Supp -> OD -0.140855 115 +Phase -> O 0.028306
116 -OD -> Gtype -0.154848 116 +O -> Strain 0.026662
117 -Gtype -> O -0.178619 117 +OD -> Air -0.000013
118 -Air -> Supp -0.190285 118 +Technique -> O -0.002223
119 -Phase -> Air -0.254683 119 +Technique -> Gtype -0.072225
120 -Supp -> O -0.331239 120 +Supp -> Air -0.245156
121 -OD -> Air -0.339236 121 +Technique -> OD -0.270904
122 -Supp -> Technique -0.352046 122 +OD -> Med -0.284259
123 -Technique -> OD -0.381551 123 +Gtype -> Med -0.389196
124 -Gtype -> Anti -0.576175 124 +Gtype -> O -0.401680
125 -Agit -> O -0.582420 125 +OD -> O -0.570578
126 -O -> Air -0.710972 126 +Agit -> O -0.633985
127 -OD -> Med -0.720546 127 +Gtype -> Anti -0.634022
128 -OD -> O -0.754296 128 +O -> Air -0.700283
129 -Gtype -> OD -0.821534 129 +Gtype -> OD -0.910835
130 -Supp -> Med -1.118820 130 +Supp -> Med -0.967944
131 -Substrain -> O -1.830467 131 +Substrain -> O -1.090330
132 -Phase -> OD -2.403512 132 +Med -> Supp -1.725214
133 -Med -> Supp -2.548799 133 +Phase -> OD -1.762859
134 134
135 135
136 Top positive: 136 Top positive:
137 -12.504936 Supp b'lemma:Iron' 137 +8.837637 Phase b'lemma:stationary'
138 -10.792779 O b'lemma:_' 138 +8.799335 Supp b'lemma:Iron'
139 -10.427539 Air b'lemma:aerobic' 139 +8.611049 O b'lemma:_'
140 -10.207513 Air b'lemma:anaerobic' 140 +7.279883 O b'lemma:1'
141 -9.451231 Supp b'lemma:nitrate' 141 +6.932654 Supp b'lemma:nitrate'
142 -9.115772 Phase b'lemma:stationary' 142 +6.880712 Air b'lemma:anaerobic'
143 -8.575457 O b'lemma:1' 143 +6.848692 Strain b'lemma:k-12'
144 -8.408994 Technique b'lemma:ChIP-exo' 144 +6.839307 Air b'lemma:aerobic'
145 -8.354108 Air b'-1:lemma:ChIP-Seq' 145 +6.789788 Technique b'lemma:ChIP-exo'
146 -8.314194 O b'lemma:rpob' 146 +6.727217 Phase b'lemma:mid-log'
147 -8.264287 Med b'lemma:MOPS' 147 +6.413420 O b'lemma:rpob'
148 -8.077335 Technique b'lemma:chipseq' 148 +5.946980 O b'lemma:2'
149 -7.675786 O b'-1:lemma:ChIP-exo' 149 +5.848343 Technique b'lemma:chipseq'
150 -7.432466 Strain b'lemma:k-12' 150 +5.826514 Substrain b'lemma:mg1655'
151 -7.338742 O b'lemma:Custom' 151 +5.584982 Supp b'lemma:pq'
152 -7.132224 O b'-1:lemma:tag' 152 +5.578193 O b'-1:lemma:tag'
153 -6.872851 Substrain b'lemma:mg1655' 153 +5.564380 Gtype b'lemma:\xce\xb4cra'
154 -6.656592 Supp b'lemma:pq' 154 +5.533718 Air b'-1:lemma:ChIP-Seq'
155 -6.656346 Gtype b'lemma:\xce\xb4cra' 155 +5.522763 Gversion b'lemma:asm584v2'
156 -6.631548 O b'lemma:3' 156 +5.497653 O b'lemma:3'
157 -6.608233 O b'lemma:2' 157 +5.471837 Med b'lemma:MOPS'
158 -6.514523 Air b'lemma:Aerobic' 158 +5.411070 O b'lemma:\xcf\x8332'
159 -6.354650 Technique b'lemma:ChIP-Seq' 159 +5.308684 Gtype b'lemma:type'
160 -6.321273 Gtype b'lemma:flag-tag' 160 +5.245931 O b'-1:lemma:ChIP-exo'
161 -6.321273 Gtype b'-1:lemma:c-terminal' 161 +5.210520 O b'lemma:rep1'
162 -6.285172 O b'lemma:rep1' 162 +5.173302 Air b'lemma:Aerobic'
163 -6.282612 O b'lemma:b' 163 +4.949891 O b'lemma:rep2'
164 -6.260165 Gversion b'lemma:asm584v2' 164 +4.893059 Med b'lemma:LB'
165 -6.243462 Gversion b'-1:lemma:nc' 165 +4.891835 O b'lemma:b'
166 -6.129172 Gversion b'lemma:nc' 166 +4.883141 O b'postag:IN'
167 -6.117441 O b'lemma:rep2' 167 +4.880173 Gtype b'lemma:flag-tag'
168 -6.056865 O b'lemma:rep3' 168 +4.880173 Gtype b'-1:lemma:c-terminal'
169 -6.042591 OD b'+1:lemma:stationary' 169 +4.852218 O b'lemma:rep3'
170 -5.905730 O b'lemma:Cra' 170 +4.830297 OD b'lemma:od600'
171 -5.761961 Gtype b'lemma:arca8myc' 171 +4.826485 Supp b'lemma:nh4cl'
172 -5.631643 Gtype b'-1:lemma:\xe2\x88\x86' 172 +4.743281 Technique b'lemma:ChIP-Seq'
173 -5.616482 Phase b'lemma:mid-log' 173 +4.722036 O b'lemma:Custom'
174 -5.599676 Med b'lemma:LB' 174 +4.717849 Gversion b'lemma:nc'
175 -5.591086 O b'lemma:a' 175 +4.701135 Gtype b'+1:lemma:type'
176 -5.417363 O b'lemma:chip' 176 +4.682123 O b'postag::'
177 -5.415483 O b'lemma:\xcf\x8332' 177 +4.648660 Gtype b'-1:lemma:\xe2\x88\x86'
178 -5.410036 O b'-1:lemma:0.3' 178 +4.639269 Supp b'+1:lemma:\xc2\xb5m'
179 -5.383641 Supp b'+1:lemma:\xc2\xb5m' 179 +4.607690 O b'lemma:a'
180 -5.378485 OD b'lemma:od600' 180 +4.570893 Med b'lemma:lb'
181 -5.357822 O b'postag::' 181 +4.466395 O b'lemma:Cra'
182 -5.343662 Gtype b'lemma:delta-arca' 182 +4.390246 Supp b'lemma:glucose'
183 -5.329601 Supp b'lemma:nh4cl' 183 +4.349340 Gtype b'lemma:arca8myc'
184 -5.310595 Gtype b'lemma:fnr8myc' 184 +4.320335 Gtype b'lemma:wt'
185 -5.291721 OD b'lemma:od450' 185 +4.311807 Gtype b'lemma:delta-arca'
186 -5.278396 Supp b'lemma:Fe' 186 +4.197474 Technique b'lemma:rna-seq'
187 -5.198206 O b'postag:IN' 187 +4.168693 O b'-1:lemma:Aerobic'
188 -5.152255 O b'lemma:or' 188 +4.160315 Supp b'lemma:Fe'
189 -5.142263 O b'-1:lemma:Aerobic' 189 +4.109646 Gtype b'lemma:fnr8myc'
190 -5.072815 Med b'lemma:lb' 190 +4.033076 OD b'lemma:od450'
191 -4.967279 Technique b'lemma:rna-seq' 191 +3.947930 Gversion b'-1:lemma:nc'
192 -4.960999 Gtype b'lemma:type' 192 +3.908993 Anti b'lemma:none'
193 -4.958285 Strain b'+1:lemma:substr' 193 +3.885757 O b'-1:lemma:0.3-0.35'
194 -4.905998 Gtype b'lemma:wt' 194 +3.879994 Technique b'lemma:rnaseq'
195 -4.808130 Supp b'lemma:glucose' 195 +3.842850 Supp b'lemma:dpd'
196 -4.806347 Vess b'lemma:flask' 196 +3.840223 Supp b'lemma:rifampicin'
197 -4.806347 Vess b'-1:lemma:warm' 197 +3.804681 Vess b'lemma:flask'
198 -4.772284 O b'lemma:for' 198 +3.804681 Vess b'-1:lemma:warm'
199 -4.744261 Supp b'lemma:arginine' 199 +3.791974 Supp b'lemma:no3'
200 -4.737788 Gtype b'lemma:delta-fnr' 200 +3.760306 O b'lemma:.'
201 -4.691753 O b'-1:lemma:0.3-0.35' 201 +3.760306 O b'postag:.'
202 -4.668554 Gtype b'+1:lemma:type' 202 +3.728479 Technique b'lemma:chip-seq'
203 -4.631710 Technique b'lemma:rnaseq' 203 +3.712550 Gtype b'lemma:\xe2\x88\x86'
204 -4.584824 Gtype b'lemma:nsrr' 204 +3.655598 Gtype b'lemma:delta-fnr'
205 -4.584359 O b'-1:lemma:glucose' 205 +3.646988 Supp b'lemma:acetate'
206 -4.556168 O b'-1:lemma:anaerobic' 206 +3.634096 Gtype b'lemma:\xce\xb4fur'
207 -4.539600 Supp b'-1:lemma:Cra' 207 +3.586071 Gtype b'lemma:nsrr'
208 -4.538972 O b'lemma:-' 208 +3.578964 OD b'+1:lemma:stationary'
209 -4.508141 Gtype b'-1:lemma:rpob' 209 +3.567614 Med b'+1:lemma:0.4'
210 -4.499586 Technique b'lemma:chip-seq' 210 +3.480912 Supp b'+1:lemma:1'
211 -4.488070 Anti b'lemma:none' 211 +3.460781 Anti b'lemma:seqa'
212 -4.462302 O b'lemma:ompr' 212 +3.449791 Supp b'lemma:arginine'
213 -4.460124 Anti b'lemma:anti-rpos' 213 +3.441583 Supp b'+1:lemma:hour'
214 -4.460049 Supp b'lemma:no3' 214 +3.432425 O b'lemma:-'
215 -4.451202 O b'+1:lemma:od600' 215 +3.371367 O b'+1:lemma:od600'
216 -4.424279 Gtype b'lemma:\xce\xb4fur' 216 +3.362556 O b'-1:lemma:type'
217 -4.389978 Supp b'lemma:acetate' 217 +3.291275 O b'lemma:or'
218 -4.387749 Med b'+1:lemma:0.4' 218 +3.273720 O b'postag:VBN'
219 -4.335328 O b'lemma:.' 219 +3.265269 Temp b'-1:lemma:\xcf\x8332'
220 -4.335328 O b'postag:.' 220 +3.250448 Supp b'lemma:fructose'
221 -4.197130 Temp b'-1:lemma:\xcf\x8332' 221 +3.225849 Gtype b'+1:lemma:ph5'
222 -4.152430 Anti b'lemma:seqa' 222 +3.222217 Temp b'-1:lemma:sample'
223 -4.141879 O b'lemma:with' 223 +3.219063 Med b'lemma:m63'
224 -4.081039 Supp b'-1:lemma:+' 224 +3.216977 O b'lemma:CEL'
225 -4.005391 O b'+1:lemma:o.d.' 225 +3.176530 Anti b'lemma:anti-myc'
226 -3.986966 O b'-1:lemma:type' 226 +3.146575 O b'+1:postag:RB'
227 -3.971115 O b'+1:lemma:sparging' 227 +3.134788 O b'-1:lemma:glucose'
228 -3.914608 Gversion b'lemma:chip-seq' 228 +3.125043 Gtype b'lemma:\xce\xb4ompr'
229 -3.905122 Supp b'+1:lemma:1' 229 +3.100972 Strain b'+1:lemma:substr'
230 -3.886730 Technique b'-1:lemma:IP' 230 +3.072971 pH b'lemma:ph5'
231 -3.875182 Supp b'+1:lemma:hour' 231 +3.072971 pH b'+1:lemma:.5'
232 -3.871343 Temp b'-1:lemma:43' 232 +3.067075 O b'-1:lemma:0.3'
233 -3.798383 pH b'lemma:ph5' 233 +3.036857 O b'lemma:chip'
234 -3.798383 pH b'+1:lemma:.5' 234 +3.030617 Supp b'-1:lemma:Cra'
235 -3.766343 Supp b'lemma:Leu' 235 +3.025659 Gtype b'+1:lemma:with'
236 -3.758437 Med b'lemma:m63' 236 +3.008031 Gversion b'lemma:chip-seq'
237 -3.755680 Supp b'lemma:rifampicin' 237 +2.994019 Gversion b'lemma:u00096'
238 -3.717291 Gtype b'+1:lemma:ph5' 238 +2.994019 Gversion b'+1:lemma:.2'
239 -3.691820 Gtype b'-1:lemma:ptac' 239 +2.993336 Supp b'+1:lemma:2'
240 -3.686748 Gtype b'lemma:\xe2\x88\x86' 240 +2.990986 Gtype b'lemma:wild-type'
241 -3.655665 Anti b'+1:lemma:antibody' 241 +2.989694 O b'-1:lemma:anaerobic'
242 -3.645147 Temp b'-1:lemma:37' 242 +2.983685 Anti b'+1:lemma:antibody'
243 -3.584169 O b'lemma:s' 243 +2.981744 Technique b'+1:lemma:chip-exo'
244 -3.582382 Gversion b'lemma:000913' 244 +2.956476 Gtype b'+1:lemma:pq'
245 -3.513265 O b'postag:VBN' 245 +2.936131 Technique b'-1:lemma:IP'
246 -3.504182 Temp b'-1:lemma:sample' 246 +2.919804 Gtype b'-1:lemma:ptac'
247 -3.476410 O b'lemma:CEL' 247 +2.910451 Med b'+1:lemma:minimal'
248 -3.471641 Gtype b'+1:lemma:flagtag' 248 +2.869576 Gversion b'lemma:000913'
249 -3.469424 O b'+1:lemma:pq' 249 +2.862556 O b'lemma:s'
250 -3.442038 Med b'+1:lemma:minimal' 250 +2.839985 O b'lemma:with'
251 -3.441203 Gtype b'lemma:\xce\xb4ompr' 251 +2.828830 Gtype b'-1:lemma:rpob'
252 -3.440050 Supp b'+1:lemma:2' 252 +2.818885 Anti b'lemma:anti-rpos'
253 -3.439274 O b'lemma:oxyr' 253 +2.813806 Gtype b'+1:lemma:flagtag'
254 -3.430689 Gtype b'lemma:\xce\xb4soxs' 254 +2.813297 O b'-1:lemma:lb'
255 -3.424081 Supp b'lemma:Adenine' 255 +2.741808 Temp b'-1:lemma:43'
256 -3.394933 O b'-1:lemma:lb' 256 +2.719888 Supp b'-1:lemma:+'
257 -3.382358 Supp b'lemma:dpd' 257 +2.682019 Technique b'-1:lemma:chip-exo'
258 -3.374432 Anti b'lemma:anti-myc' 258 +2.665763 O b'+1:postag:NNP'
259 -3.354369 O b'+1:lemma:chip-seq' 259 +2.664036 O b'postag:CC'
260 -3.325764 O b'-1:lemma:\xc2\xb0c' 260 +2.648305 Supp b'lemma:nacl'
261 -3.324069 Air b'lemma:anerobically' 261 +2.635798 Gversion b'lemma:.2'
262 -3.306589 Gversion b'lemma:u00096' 262 +2.635798 Gversion b'-1:lemma:u00096'
263 -3.306589 Gversion b'+1:lemma:.2' 263 +2.631519 OD b'-1:lemma:~'
264 -3.290810 Supp b'lemma:fructose' 264 +2.630404 pH b'lemma:.5'
265 -3.286471 Med b'+1:lemma:2.0' 265 +2.630404 pH b'-1:lemma:ph5'
266 -3.281346 Gversion b'lemma:.2' 266 +2.610537 Temp b'-1:lemma:37'
267 -3.281346 Gversion b'-1:lemma:u00096' 267 +2.585402 O b'postag:VBG'
268 -3.224316 Gtype b'lemma:wild-type' 268 +2.582024 O b'lemma:oxyr'
269 -3.206842 Gtype b'+1:lemma:with' 269 +2.534944 Gtype b'lemma:\xce\xb4soxs'
270 -3.204237 O b'+1:lemma:rifampicin' 270 +2.529286 Med b'lemma:media'
271 -3.192028 Gtype b'+1:lemma:aerobic' 271 +2.526833 O b'lemma:for'
272 -3.176568 Supp b'lemma:iptg' 272 +2.522683 Temp b'lemma:\xc2\xb0c'
273 -3.174757 Supp b'lemma:nacl' 273 +2.517678 O b'+1:lemma:pq'
274 -3.142082 Phase b'-1:lemma:until' 274 +2.481621 O b'postag:DT'
275 -3.138505 Gtype b'lemma:pk4854' 275 +2.467547 Air b'postag:RB'
276 -3.102435 Supp b'+1:lemma:_' 276 +2.465592 Supp b'+1:lemma:_'
277 -3.077765 Technique b'-1:lemma:input' 277 +2.465328 Supp b'-1:lemma:\xc2\xb5m'
278 -3.043564 Med b'+1:lemma:contain' 278 +2.462075 Supp b'lemma:Leu'
279 -3.043460 O b'lemma:affyexp' 279 +2.457045 Air b'-1:lemma:-'
280 -3.030477 O b'+1:postag:NNP' 280 +2.398092 Supp b'lemma:20'
281 -3.011575 Gtype b'+1:lemma:pq' 281 +2.393465 O b'-1:lemma:l1'
282 -3.009802 Technique b'-1:lemma:rna-seq' 282 +2.392516 OD b'lemma:0.3'
283 -3.009086 Phase b'+1:lemma:for' 283 +2.388541 O b'+1:lemma:chip-seq'
284 -3.006591 O b'lemma:chip-arca' 284 +2.372930 O b'lemma:culture'
285 -2.961198 Technique b'+1:lemma:chip-exo' 285 +2.354906 Med b'+1:lemma:2.0'
286 -2.918766 Gtype b'lemma:deltaseqa' 286 +2.354774 O b'lemma:2-3'
287 -2.918766 Gtype b'-1:lemma:old' 287 +2.346860 O b'lemma:affyexp'
288 -2.895206 O b'lemma:soxs' 288 +2.323757 Technique b'-1:lemma:input'
289 -2.895206 O b'lemma:soxr' 289 +2.321220 Gtype b'lemma:pk4854'
290 -2.893483 O b'lemma:argr' 290 +2.318926 O b'+1:lemma:o.d.'
291 -2.883608 Supp b'-1:lemma:\xc2\xb5m' 291 +2.307787 Temp b'lemma:43'
292 -2.871795 Technique b'-1:lemma:chip-exo' 292 +2.301344 Med b'+1:lemma:g/l'
293 -2.840922 Air b'postag:RB' 293 +2.300110 Med b'-1:lemma:ml'
294 -2.837804 O b'-1:lemma:l1' 294 +2.281743 Air b'lemma:anaerobically'
295 -2.834031 O b'lemma:purr' 295 +2.255382 Gtype b'lemma:deltaseqa'
296 -2.816068 pH b'lemma:.5' 296 +2.255382 Gtype b'-1:lemma:old'
297 -2.816068 pH b'-1:lemma:ph5' 297 +2.248647 Temp b'lemma:37'
298 -2.793907 O b'+1:postag:RB' 298 +2.228191 O b'lemma:ompr'
299 -2.787764 Temp b'lemma:43' 299 +2.227705 O b'-1:lemma:\xc2\xb0c'
300 -2.783505 Gtype b'+1:lemma:knock-out' 300 +2.223375 Supp b'lemma:Adenine'
301 -2.777516 Med b'-1:lemma:ml' 301 +2.216690 Supp b'lemma:iptg'
302 -2.776744 Gtype b'lemma:ptac' 302 +2.192106 Gtype b'lemma:ptac'
303 -2.754900 Air b'lemma:anaerobically' 303 +2.185607 Phase b'-1:lemma:until'
304 -2.728375 O b'+1:lemma:acetate' 304 +2.150538 O b'-1:lemma:stpa'
305 -2.677194 Gtype b'lemma:\xce\xb4oxyr' 305 +2.139915 Gtype b'-1:lemma:nsrr'
306 -2.676114 Gtype b'lemma:WT' 306 +2.138681 O b'+1:lemma:sparging'
307 -2.664380 O b'-1:lemma:dpd' 307 +2.124332 Med b'lemma:L'
308 -2.623289 O b'lemma:at' 308 +2.124332 Med b'+1:lemma:broth'
309 -2.622409 Air b'+1:lemma:at' 309 +2.090590 Air b'lemma:Anaerobic'
310 -2.621682 O b'lemma:Fur' 310 +2.084963 O b'lemma:condition'
311 -2.613642 OD b'lemma:0.3' 311 +2.083373 Supp b'lemma:0.2'
312 -2.611845 O b'postag:DT' 312 +2.071469 O b'lemma:at'
313 -2.601745 O b'-1:lemma:stpa' 313 +2.070008 O b'+1:lemma:anti-fur'
314 -2.558195 OD b'-1:lemma:about' 314 +2.046312 O b'lemma:Lrp'
315 -2.551265 Gtype b'lemma:\xce\xb4soxr' 315 +2.038220 Phase b'-1:lemma:mid-log'
316 -2.545283 Gtype b'-1:lemma:from' 316 +2.029113 O b'lemma:chip-arca'
317 -2.537660 Med b'lemma:L' 317 +2.027744 Supp b'lemma:methanol'
318 -2.537660 Med b'+1:lemma:broth' 318 +2.017925 Technique b'+1:lemma:rna-seq'
319 -2.520762 Temp b'-1:lemma:30' 319 +2.017005 Substrain b'+1:lemma:phtpg'
320 -2.512014 Supp b'+1:lemma:and' 320 +2.011726 Med b'lemma:broth'
321 -2.485033 Gtype b'lemma:dfnr' 321 +2.011726 Med b'-1:lemma:L'
322 -2.478336 Temp b'lemma:\xc2\xb0c' 322 +1.998337 pH b'+1:postag:CD'
323 -2.477157 pH b'+1:postag:CD' 323 +1.982325 O b'lemma:Fur'
324 -2.474581 O b'lemma:2-3' 324 +1.968163 Med b'lemma:glucose'
325 -2.467989 O b'lemma:Lrp' 325 +1.939193 Gversion b'postag:CD'
326 -2.464584 Med b'-1:lemma:LB' 326 +1.930022 Phase b'+1:postag:NNS'
327 -2.446412 O b'+1:postag:VBP' 327 +1.926820 O b'lemma:soxs'
328 -2.443891 Supp b'lemma:leucine' 328 +1.926820 O b'lemma:soxr'
329 -2.443008 Air b'-1:lemma:-' 329 +1.910127 Supp b'-1:lemma:with'
330 -2.331881 Med b'lemma:broth' 330 +1.904564 Air b'lemma:anerobically'
331 -2.331881 Med b'-1:lemma:L' 331 +1.901117 O b'lemma:genotype/variation'
332 -2.324108 Gtype b'+1:lemma:_' 332 +1.899206 Gtype b'+1:lemma:_'
333 -2.320318 O b'-1:lemma:min' 333 +1.889629 Gtype b'lemma:WT'
334 -2.319595 O b'+1:lemma:mid-log' 334 +1.854673 Phase b'+1:lemma:for'
335 -2.316477 Supp b'+1:lemma:iptg' 335 +1.839203 Temp b'-1:lemma:30'
336 -2.316285 O b'+1:lemma:43' 336 +1.838657 Temp b'+1:lemma:\xc2\xb0c'
337 337
338 338
339 Top negative: 339 Top negative:
340 -0.000009 Anti b'+1:lemma:\xce\xb2' 340 +0.009154 Gtype b'-1:lemma:small'
341 -0.000008 Anti b'+1:lemma:subunit' 341 +0.008958 O b'-1:lemma:concentration'
342 -0.000005 O b'-1:lemma:Deficient' 342 +0.008958 O b'+1:lemma:150'
343 -0.000001 OD b'+1:lemma:0.15' 343 +0.008749 Supp b'+1:lemma:%'
344 --0.000001 Temp b'-1:postag:IN' 344 +0.008295 Gtype b'-1:postag:IN'
345 --0.000007 O b'lemma:medium' 345 +0.007225 Temp b'-1:postag:NN'
346 --0.000045 O b'+1:lemma:rep1' 346 +0.007001 O b'+1:lemma:dpd'
347 --0.000145 Gtype b'+1:lemma:2' 347 +0.006253 O b'-1:lemma:to'
348 --0.000168 O b'+1:lemma:culture' 348 +0.006253 O b'-1:postag:TO'
349 --0.000168 O b'+1:lemma:dissolve' 349 +0.005971 O b'lemma:25'
350 --0.000355 O b'-1:lemma:1' 350 +0.005588 Supp b'-1:postag:VBN'
351 --0.000451 OD b'+1:lemma:-lrb-' 351 +0.005564 Supp b'postag:NNP'
352 --0.000593 O b'+1:lemma:c' 352 +0.005481 Vess b'+1:postag:IN'
353 --0.000597 OD b'+1:postag:VBN' 353 +0.005374 Med b'-1:lemma:w2'
354 --0.000854 Gtype b'+1:postag:NNS' 354 +0.005034 Med b'-1:lemma:2'
355 --0.001125 O b'lemma:10' 355 +0.004923 Phase b'+1:lemma:aerobically'
356 --0.001603 O b'-1:lemma:fresh' 356 +0.004818 Air b'-1:lemma:-lrb-'
357 --0.002085 Supp b'-1:lemma:-' 357 +0.004778 Phase b'+1:postag:RB'
358 --0.002163 O b'+1:lemma:300' 358 +0.002918 Supp b'+1:lemma:dpd'
359 --0.002264 Air b'-1:postag:NNP' 359 +0.001853 Supp b'-1:postag:NN'
360 --0.002713 O b'+1:lemma:min' 360 +0.001254 O b'-1:lemma:25'
361 --0.003522 Air b'+1:postag:-LRB-' 361 +0.001130 O b'+1:lemma:minute'
362 --0.003594 O b'-1:lemma:iptg' 362 +0.000839 Supp b'lemma:2'
363 --0.004379 O b'lemma:cell' 363 +0.000645 O b'lemma:250'
364 --0.004450 O b'+1:lemma:antibody' 364 +0.000633 O b'+1:lemma:use'
365 --0.007530 Gtype b'-1:postag:NNP' 365 +0.000599 OD b'+1:lemma:-rrb-'
366 --0.011566 Air b'postag:CC' 366 +0.000522 Gtype b'postag::'
367 --0.011603 O b'+1:lemma:a' 367 +0.000521 O b'lemma:contain'
368 --0.011880 O b'+1:lemma:dpd' 368 +0.000301 Air b'postag:CC'
369 --0.013535 OD b'postag:NNS' 369 +0.000277 O b'-1:postag:DT'
370 --0.013622 Supp b'+1:lemma:glucose' 370 +0.000223 Air b'-1:lemma:and'
371 --0.013806 O b'-1:lemma:the' 371 +0.000188 O b'-1:lemma:Iron'
372 --0.014085 O b'+1:lemma:25' 372 +0.000172 Technique b'+1:lemma:-rrb-'
373 --0.014120 OD b'-1:postag:DT' 373 +0.000156 O b'+1:lemma:um'
374 --0.016761 OD b'-1:lemma:a' 374 +0.000120 Technique b'+1:postag:-RRB-'
375 --0.021729 OD b'+1:postag:-LRB-' 375 +0.000082 O b'lemma:fresh'
376 --0.024283 O b'-1:lemma:25' 376 +0.000007 O b'-1:lemma:chip'
377 --0.024519 O b'postag:VBP' 377 +0.000004 Technique b'-1:postag:NN'
378 --0.027011 OD b'+1:lemma:0.4' 378 +0.000004 Gtype b'lemma:input'
379 --0.027020 O b'+1:lemma:co2' 379 +0.000002 Supp b'+1:lemma:feso4'
380 --0.030020 O b'+1:lemma:mm' 380 +-0.000001 Supp b'+1:lemma:-rrb-'
381 --0.030904 Gtype b'postag:NNS' 381 +-0.000002 Supp b'+1:postag:-RRB-'
382 --0.031338 O b'+1:lemma:grow' 382 +-0.000013 O b'+1:lemma:95'
383 --0.032633 Gtype b'-1:postag:NN' 383 +-0.000014 Gtype b'+1:postag:NNS'
384 --0.034461 Med b'-1:lemma:m63' 384 +-0.000015 OD b'+1:postag:-LRB-'
385 --0.038347 O b'lemma:coli' 385 +-0.000019 Gtype b'postag:CD'
386 --0.039331 Gtype b'+1:postag:IN' 386 +-0.000030 O b'lemma:purify'
387 --0.040098 Air b'+1:postag:NN' 387 +-0.000053 O b'lemma:10'
388 --0.043802 O b'lemma:o2' 388 +-0.000099 O b'lemma:\xe2\x88\x86'
389 --0.044786 Anti b'-1:postag:NN' 389 +-0.000279 Temp b'postag:JJ'
390 --0.050998 Phase b'+1:postag:NN' 390 +-0.000305 O b'+1:lemma:0.4'
391 --0.053029 Supp b'-1:postag:VBG' 391 +-0.000901 O b'-1:lemma:iptg'
392 --0.059606 O b'+1:lemma:shake' 392 +-0.002039 OD b'+1:postag:NNS'
393 --0.060227 O b'lemma:\xc2\xb0c' 393 +-0.002046 O b'+1:lemma:mm'
394 --0.061576 O b'+1:lemma:k-12' 394 +-0.002243 O b'-1:lemma:the'
395 --0.068548 O b'lemma:mg/ml' 395 +-0.003015 O b'-1:lemma:with'
396 --0.068548 O b'-1:lemma:150' 396 +-0.004660 Technique b'-1:lemma::'
397 --0.071993 O b'-1:lemma:minimal' 397 +-0.005024 OD b'+1:lemma:of'
398 --0.075882 OD b'+1:postag:CD' 398 +-0.006171 O b'+1:postag:CD'
399 --0.076224 O b'lemma:glucose' 399 +-0.006255 Air b'+1:postag:-LRB-'
400 --0.078957 O b'-1:lemma:at' 400 +-0.006748 O b'+1:lemma:rep1'
401 --0.082806 O b'lemma:grow' 401 +-0.009757 O b'-1:lemma:g/l'
402 --0.087424 OD b'-1:postag:NNS' 402 +-0.010305 OD b'lemma:~'
403 --0.090506 Supp b'-1:postag:NN' 403 +-0.012303 Air b'+1:lemma:-lrb-'
404 --0.093124 Temp b'-1:lemma:\xc2\xb0c' 404 +-0.014317 O b'+1:lemma:25'
405 --0.093134 O b'-1:lemma:-lrb-' 405 +-0.017635 O b'lemma:lb'
406 --0.093606 O b'lemma:minimal' 406 +-0.020425 O b'-1:postag:VBN'
407 --0.094232 O b'+1:lemma:o2' 407 +-0.020857 Air b'-1:lemma:70'
408 --0.097879 O b'-1:lemma:mm' 408 +-0.021641 OD b'+1:postag:CD'
409 --0.098068 Med b'-1:postag:NN' 409 +-0.026926 Anti b'+1:postag:JJ'
410 --0.107118 O b'-1:lemma:o2' 410 +-0.030050 O b'-1:lemma:rifampicin'
411 --0.118175 O b'+1:lemma:phase' 411 +-0.030184 O b'+1:lemma:o2'
412 --0.119815 Technique b'-1:lemma::' 412 +-0.033398 O b'+1:lemma:grow'
413 --0.130823 Temp b'postag:JJ' 413 +-0.034272 O b'lemma:o2'
414 --0.132875 O b'+1:lemma:arginine' 414 +-0.038973 O b'lemma:medium'
415 --0.134855 O b'-1:lemma:30' 415 +-0.041512 O b'+1:lemma:phase'
416 --0.146776 O b'lemma:aerobically' 416 +-0.047966 O b'+1:lemma:300'
417 --0.147575 O b'-1:lemma:n2' 417 +-0.051332 O b'-1:lemma:mm'
418 --0.149484 OD b'postag:IN' 418 +-0.052636 O b'lemma:e.'
419 --0.156867 Air b'postag:CD' 419 +-0.055634 Med b'postag:CD'
420 --0.156918 O b'-1:lemma:from' 420 +-0.055801 Phase b'+1:postag:NN'
421 --0.166087 Supp b'+1:postag:IN' 421 +-0.062955 Air b'-1:postag:CC'
422 --0.177934 O b'lemma:mg1655' 422 +-0.065091 O b'-1:lemma:o2'
423 --0.179064 Anti b'+1:postag:JJ' 423 +-0.065456 OD b'+1:lemma:and'
424 --0.179551 Supp b'lemma:and' 424 +-0.079195 OD b'+1:lemma:0.4'
425 --0.188276 O b'-1:lemma:um' 425 +-0.085840 Med b'+1:postag:NN'
426 --0.188276 O b'+1:lemma:paraquat' 426 +-0.089782 Gversion b'+1:postag:NN'
427 --0.189403 O b'lemma:n2' 427 +-0.090118 O b'-1:lemma:e.'
428 --0.195278 O b'lemma:\xce\xb4fur' 428 +-0.091747 O b'+1:lemma:shake'
429 --0.198127 Med b'+1:postag:IN' 429 +-0.096366 O b'+1:lemma:5'
430 --0.214634 O b'+1:lemma:\xc2\xb0c' 430 +-0.104686 OD b'postag:JJ'
431 --0.215441 O b'lemma:30' 431 +-0.110082 O b'+1:lemma:-rrb-'
432 --0.215519 O b'-1:lemma:e.' 432 +-0.117489 Phase b'-1:postag:NN'
433 --0.226406 O b'-1:postag:IN' 433 +-0.118330 Gtype b'-1:postag:CD'
434 --0.226968 Gtype b'postag:CD' 434 +-0.123321 Air b'-1:lemma:or'
435 --0.227233 Phase b'-1:lemma:at' 435 +-0.125308 O b'lemma:co2'
436 --0.230930 O b'-1:postag:VBN' 436 +-0.126112 Air b'postag:CD'
437 --0.231525 O b'-1:lemma:of' 437 +-0.127371 O b'-1:lemma:from'
438 --0.235093 O b'+1:postag:NNS' 438 +-0.128004 Supp b'lemma:and'
439 --0.235942 O b'+1:lemma:5' 439 +-0.138630 Med b'+1:postag:IN'
440 --0.237587 O b'+1:lemma:_' 440 +-0.140700 OD b'+1:postag:CC'
441 --0.253207 Supp b'+1:lemma:rifampicin' 441 +-0.141775 Med b'-1:postag:NN'
442 --0.254236 Gversion b'+1:postag:NN' 442 +-0.143861 O b'lemma:grow'
443 --0.261414 Med b'postag:CD' 443 +-0.147202 O b'-1:lemma:um'
444 --0.269201 O b'-1:postag:-LRB-' 444 +-0.147202 O b'+1:lemma:paraquat'
445 --0.283772 O b'-1:lemma:od600' 445 +-0.151027 O b'-1:postag:IN'
446 --0.286133 O b'lemma:co2' 446 +-0.151499 Gtype b'-1:postag:NN'
447 --0.286584 O b'+1:lemma:or' 447 +-0.158428 Supp b'+1:lemma:rifampicin'
448 --0.289081 O b'+1:lemma:-rrb-' 448 +-0.162488 O b'-1:lemma:30'
449 --0.293131 O b'+1:lemma:cell' 449 +-0.173747 O b'-1:lemma:1'
450 --0.293510 O b'-1:lemma:0.1' 450 +-0.185340 O b'-1:lemma:0.1'
451 --0.315643 O b'lemma:phase' 451 +-0.197510 O b'lemma:anaerobic'
452 --0.317100 Air b'-1:postag:CC' 452 +-0.202853 Supp b'postag:CC'
453 --0.328206 Supp b'postag:CC' 453 +-0.212861 O b'-1:lemma:-lrb-'
454 --0.328374 O b'-1:lemma:0.2' 454 +-0.215175 O b'-1:lemma:cra'
455 --0.342964 Supp b'+1:postag:VBN' 455 +-0.224143 Supp b'+1:postag:VBN'
456 --0.347291 O b'lemma:150' 456 +-0.230836 O b'-1:lemma:of'
457 --0.347291 O b'+1:lemma:mg/ml' 457 +-0.240457 O b'lemma:aerobically'
458 --0.349307 O b'lemma:od600' 458 +-0.244805 O b'+1:postag:IN'
459 --0.351495 OD b'postag:JJ' 459 +-0.254690 Phase b'-1:lemma:at'
460 --0.353086 Temp b'+1:lemma:to' 460 +-0.255175 Temp b'postag:NN'
461 --0.353086 Temp b'+1:postag:TO' 461 +-0.261806 O b'+1:postag:NNS'
462 --0.374885 O b'-1:lemma:mid-log' 462 +-0.267878 pH b'postag:NN'
463 --0.378947 Air b'-1:postag:JJ' 463 +-0.269047 O b'postag:VBP'
464 --0.382276 O b'postag:RB' 464 +-0.270124 O b'lemma:150'
465 --0.384726 pH b'postag:NN' 465 +-0.270124 O b'+1:lemma:mg/ml'
466 --0.388651 O b'+1:lemma:until' 466 +-0.276353 O b'+1:lemma:until'
467 --0.395876 O b'lemma:e.' 467 +-0.286173 O b'+1:lemma:.'
468 --0.396410 O b'+1:lemma:.' 468 +-0.286173 O b'+1:postag:.'
469 --0.396410 O b'+1:postag:.' 469 +-0.305770 O b'+1:lemma:%'
470 --0.419403 O b'-1:lemma:ml' 470 +-0.305965 O b'-1:lemma:ml'
471 --0.438819 O b'lemma:anaerobic' 471 +-0.324166 O b'lemma:media'
472 --0.441115 Agit b'postag:NN' 472 +-0.339524 O b'lemma:phase'
473 --0.458507 Med b'+1:postag:NN' 473 +-0.352773 O b'+1:lemma:arginine'
474 --0.467746 O b'-1:lemma:grow' 474 +-0.363361 O b'lemma:\xce\xb4fur'
475 --0.468347 OD b'+1:lemma:and' 475 +-0.388894 O b'lemma:dissolve'
476 --0.477039 Anti b'+1:lemma:anti-fur' 476 +-0.389770 O b'-1:postag:-LRB-'
477 --0.477272 O b'+1:postag:-RRB-' 477 +-0.397946 O b'-1:lemma:mid-log'
478 --0.539475 Phase b'-1:postag:JJ' 478 +-0.420065 O b'-1:lemma:~'
479 --0.544246 O b'-1:lemma:rifampicin' 479 +-0.440463 O b'+1:lemma:0.3'
480 --0.554986 Technique b'-1:postag::' 480 +-0.449972 O b'-1:lemma:od600'
481 --0.557503 O b'-1:lemma:~' 481 +-0.451810 O b'+1:postag:-RRB-'
482 --0.566406 O b'-1:lemma:cra' 482 +-0.452722 Temp b'+1:lemma:to'
483 --0.585219 O b'-1:lemma:sample' 483 +-0.452722 Temp b'+1:postag:TO'
484 --0.592872 OD b'lemma:-lrb-' 484 +-0.483420 OD b'+1:postag:NN'
485 --0.597579 O b'+1:lemma:0.3' 485 +-0.485997 Phase b'-1:postag:JJ'
486 --0.637939 OD b'+1:postag:CC' 486 +-0.497094 O b'-1:lemma:0.2'
487 --0.640528 Air b'+1:postag:JJ' 487 +-0.501676 O b'lemma:od600'
488 --0.641855 O b'lemma:0.3' 488 +-0.531049 O b'lemma:20'
489 --0.663280 O b'lemma:20' 489 +-0.559644 O b'-1:lemma:grow'
490 --0.678531 O b'lemma:media' 490 +-0.580617 O b'+1:lemma:\xc2\xb0c'
491 --0.679754 O b'+1:postag:IN' 491 +-0.620523 Technique b'-1:postag::'
492 --0.692879 O b'+1:lemma:%' 492 +-0.630289 O b'lemma:0.3'
493 --0.704594 O b'lemma:of' 493 +-0.679102 Supp b'-1:lemma:%'
494 --0.746312 O b'-1:lemma:co2' 494 +-0.685275 O b'lemma:anaerobically'
495 --0.752462 O b'lemma:dissolve' 495 +-0.715057 OD b'lemma:-lrb-'
496 --0.774185 O b'+1:lemma:fecl2' 496 +-0.717401 O b'+1:lemma:fecl2'
497 --0.784660 Med b'-1:postag:IN' 497 +-0.759134 O b'-1:lemma:37'
498 --0.813078 O b'-1:lemma:IP' 498 +-0.770187 Air b'-1:postag:JJ'
499 --0.845987 O b'lemma:dpd' 499 +-0.786415 O b'lemma:0.2'
500 --0.856881 O b'+1:lemma:+' 500 +-0.821217 O b'+1:postag:VBG'
501 --0.917781 O b'-1:postag:VBG' 501 +-0.822213 O b'lemma:37'
502 --0.924251 O b'+1:lemma:g/l' 502 +-0.824982 O b'+1:lemma:supplement'
503 --0.950062 Temp b'postag:NN' 503 +-0.842762 O b'-1:lemma:sample'
504 --0.956490 O b'-1:lemma:dissolve' 504 +-0.857711 Supp b'+1:lemma:acetate'
505 --0.956490 O b'+1:lemma:methanol' 505 +-0.859301 O b'+1:lemma:cell'
506 --0.973571 OD b'+1:postag:NN' 506 +-0.865248 O b'lemma:fecl2'
507 --0.985083 O b'-1:lemma:rpob' 507 +-0.895821 OD b'postag:-LRB-'
508 --1.088717 Supp b'+1:lemma:acetate' 508 +-0.909763 O b'-1:postag:VBG'
509 --1.116443 O b'lemma:0.1' 509 +-0.924925 O b'lemma:of'
510 --1.121770 O b'+1:lemma:at' 510 +-0.938966 O b'+1:lemma:hour'
511 --1.139282 O b'lemma:fecl2' 511 +-0.948215 O b'lemma:2h'
512 --1.139658 O b'lemma:0.2' 512 +-0.948215 O b'-1:lemma:additional'
513 --1.143368 O b'lemma:2h' 513 +-1.035032 O b'-1:lemma:co2'
514 --1.143368 O b'-1:lemma:additional' 514 +-1.038239 O b'-1:lemma:rpob'
515 --1.162871 O b'lemma:mid-log' 515 +-1.049551 O b'-1:lemma:dissolve'
516 --1.218300 O b'+1:lemma:in' 516 +-1.049551 O b'+1:lemma:methanol'
517 --1.230428 OD b'postag:-LRB-' 517 +-1.057377 O b'-1:postag::'
518 --1.237811 O b'+1:lemma:supplement' 518 +-1.072361 O b'lemma:mid-log'
519 --1.238950 O b'-1:lemma:37' 519 +-1.076264 O b'lemma:0.1'
520 --1.269797 O b'+1:postag:VBG' 520 +-1.182064 O b'+1:lemma:+'
521 --1.280950 O b'lemma:anaerobically' 521 +-1.269769 O b'+1:lemma:g/l'
522 --1.360526 O b'lemma:37' 522 +-1.341512 O b'+1:lemma:at'
523 --1.412947 O b'-1:postag::' 523 +-1.349849 O b'-1:lemma:IP'
524 --1.467612 O b'lemma:wt' 524 +-1.412012 Air b'+1:postag:JJ'
525 --1.469772 O b'+1:lemma:hour' 525 +-1.427656 O b'-1:lemma:ompr'
526 --1.551225 Supp b'-1:lemma:%' 526 +-1.459404 O b'lemma:wt'
527 --1.646983 O b'lemma:methanol' 527 +-1.465487 Anti b'postag:NNP'
528 --1.652478 O b'-1:lemma:nsrr' 528 +-1.539253 O b'lemma:rifampicin'
529 --1.705441 Phase b'postag:JJ' 529 +-1.604435 O b'lemma:methanol'
530 --1.865099 Anti b'postag:NNP' 530 +-1.624731 Supp b'postag:JJ'
531 --2.110303 Supp b'postag:JJ' 531 +-1.646056 O b'-1:lemma:nsrr'
532 --2.251438 Air b'postag:NN' 532 +-1.650493 Air b'postag:NN'
533 --2.402454 O b'lemma:rifampicin' 533 +-1.947720 O b'+1:lemma:in'
534 --2.570647 O b'-1:lemma:ompr' 534 +-1.988778 O b'+1:lemma:2'
535 --2.620057 O b'-1:lemma:2' 535 +-2.105490 O b'+1:lemma:1'
536 --2.709520 O b'+1:lemma:2' 536 +-2.188210 O b'-1:lemma:2'
537 --3.092706 O b'+1:lemma:1' 537 +-2.454354 Phase b'postag:JJ'
538 --4.538028 O b'-1:lemma:_' 538 +-4.082146 O b'-1:lemma::'
539 --4.976237 O b'-1:lemma::' 539 +-4.315245 O b'-1:lemma:_'
540 540
......
1 +********** TRAINING AND TESTING REPORT **********
2 +Training file: training-data-set-70_v4.txt
3 +
4 +best params:{'c1': 0.004866974423027767, 'c2': 0.056472219713063834}
5 +best CV score:0.7979749356861161
6 +model size: 0.13M
7 +
8 +Flat F1: 0.788756583016598
9 + precision recall f1-score support
10 +
11 + OD 1.000 0.405 0.577 37
12 + pH 1.000 1.000 1.000 12
13 + Technique 0.952 0.909 0.930 22
14 + Med 0.891 0.860 0.875 57
15 + Temp 0.818 1.000 0.900 18
16 + Vess 0.000 0.000 0.000 0
17 + Agit 0.000 0.000 0.000 0
18 + Phase 1.000 0.895 0.944 19
19 + Air 0.754 0.742 0.748 62
20 + Anti 1.000 0.444 0.615 9
21 + Strain 1.000 1.000 1.000 1
22 + Gtype 0.862 0.764 0.810 106
23 + Substrain 0.000 0.000 0.000 1
24 + Supp 0.865 0.662 0.750 136
25 + Gversion 0.000 0.000 0.000 0
26 +
27 +avg / total 0.876 0.735 0.789 480
28 +
29 +
30 +Top likely transitions:
31 +OD -> OD 5.351049
32 +Med -> Med 4.871670
33 +Temp -> Temp 4.705964
34 +Air -> Air 4.663634
35 +Anti -> Anti 4.552648
36 +Agit -> Agit 4.406608
37 +O -> O 4.159955
38 +Gversion -> Gversion 4.029197
39 +Phase -> Phase 3.961410
40 +Gtype -> Gtype 3.736759
41 +Supp -> Supp 3.715319
42 +Technique -> Technique 2.638663
43 +pH -> pH 2.247503
44 +O -> Supp 1.602461
45 +Substrain -> Gtype 1.572374
46 +Gtype -> Supp 1.509554
47 +Air -> O 1.254615
48 +Technique -> Air 1.032953
49 +O -> Gtype 1.031819
50 +O -> Technique 0.950111
51 +Gtype -> pH 0.787931
52 +O -> Temp 0.697463
53 +O -> Anti 0.689482
54 +Gtype -> Air 0.553152
55 +Med -> O 0.452122
56 +O -> Strain 0.249152
57 +O -> pH 0.230580
58 +OD -> Phase 0.217826
59 +Phase -> O 0.176822
60 +O -> Vess 0.163152
61 +O -> Gversion 0.124767
62 +Supp -> O 0.087651
63 +Temp -> O 0.034867
64 +Strain -> Substrain -0.000001
65 +Substrain -> Phase -0.000221
66 +Strain -> Gversion -0.003698
67 +Vess -> Technique -0.004821
68 +Temp -> Substrain -0.012876
69 +Agit -> Gversion -0.014323
70 +Temp -> Strain -0.014360
71 +Temp -> Vess -0.017410
72 +Substrain -> Med -0.018817
73 +pH -> Agit -0.019211
74 +Med -> Agit -0.020010
75 +Gversion -> Agit -0.021113
76 +Phase -> Vess -0.022758
77 +O -> Phase -0.024164
78 +Med -> Strain -0.025997
79 +pH -> Phase -0.028833
80 +pH -> Anti -0.029581
81 +
82 +
83 +Top unlikely transitions:
84 +Technique -> Med -0.461151
85 +O -> Agit -0.476494
86 +Gtype -> Temp -0.480794
87 +Technique -> O -0.518387
88 +Gtype -> Phase -0.520282
89 +Air -> Temp -0.525360
90 +Gversion -> Technique -0.535188
91 +Air -> Gtype -0.543291
92 +Anti -> Gtype -0.553848
93 +Technique -> Gversion -0.562140
94 +OD -> Anti -0.571138
95 +Gversion -> Air -0.589331
96 +OD -> Temp -0.589841
97 +Anti -> OD -0.591125
98 +Supp -> pH -0.600581
99 +Supp -> Phase -0.607554
100 +Med -> Air -0.627218
101 +OD -> Supp -0.663510
102 +Air -> Supp -0.665817
103 +OD -> Technique -0.667134
104 +Air -> Med -0.686105
105 +Gtype -> Technique -0.710838
106 +Air -> OD -0.743300
107 +Technique -> Supp -0.744356
108 +Phase -> Technique -0.789682
109 +Temp -> Med -0.799451
110 +Supp -> Anti -0.809910
111 +Supp -> Temp -0.821276
112 +OD -> Med -0.825536
113 +Gtype -> Gversion -0.857454
114 +Supp -> OD -0.882092
115 +Supp -> Technique -0.895485
116 +Supp -> Air -0.917425
117 +O -> Air -0.919505
118 +Supp -> Gversion -0.925617
119 +Gtype -> Med -0.929322
120 +Supp -> Gtype -0.987028
121 +OD -> Gtype -0.992669
122 +Gtype -> Anti -1.017609
123 +Agit -> O -1.031217
124 +Gtype -> OD -1.100242
125 +OD -> O -1.178810
126 +Substrain -> O -1.224261
127 +OD -> Air -1.229479
128 +Supp -> Med -1.270572
129 +Technique -> OD -1.299192
130 +Technique -> Gtype -1.368938
131 +Technique -> pH -1.381051
132 +Med -> Supp -1.415487
133 +Phase -> OD -1.647415
134 +
135 +
136 +Top positive:
137 +6.440045 O b'lemma:_'
138 +5.284742 O b'lemma:1'
139 +4.692157 Air b'lemma:anaerobic'
140 +4.658957 O b'lemma:2'
141 +4.619385 Technique b'lemma:ChIP-exo'
142 +4.561015 Strain b'lemma:k-12'
143 +4.494705 Supp b'lemma:Iron'
144 +4.430737 Technique b'lemma:chipseq'
145 +4.213284 O b'lemma:rpob'
146 +4.193080 Air b'lemma:aerobic'
147 +4.127725 Phase b'lemma:stationary'
148 +4.112519 Supp b'lemma:pq'
149 +4.107025 Supp b'lemma:nh4cl'
150 +4.068762 O b'postag:IN'
151 +3.990976 Supp b'lemma:glucose'
152 +3.981614 O b'lemma:3'
153 +3.895423 O b'lemma:rep1'
154 +3.893328 Gtype b'lemma:arca8myc'
155 +3.831178 Gtype b'lemma:wt'
156 +3.766316 Gtype b'lemma:flag-tag'
157 +3.766316 Gtype b'-1:lemma:c-terminal'
158 +3.741501 Gtype b'lemma:\xce\xb4cra'
159 +3.650417 Phase b'lemma:mid-log'
160 +3.632631 O b'lemma:rep2'
161 +3.630470 Substrain b'lemma:mg1655'
162 +3.547965 Gversion b'lemma:asm584v2'
163 +3.532543 Supp b'lemma:acetate'
164 +3.517907 O b'lemma:Cra'
165 +3.498084 Air b'-1:lemma:ChIP-Seq'
166 +3.480891 Gtype b'-1:lemma:\xe2\x88\x86'
167 +3.424575 Supp b'lemma:no3'
168 +3.422537 Supp b'+1:lemma:\xc2\xb5m'
169 +3.363386 Supp b'lemma:nitrate'
170 +3.346533 O b'lemma:b'
171 +3.329553 O b'-1:lemma:tag'
172 +3.312533 O b'lemma:rep3'
173 +3.288138 O b'postag::'
174 +3.274111 O b'lemma:a'
175 +3.231297 Technique b'lemma:rna-seq'
176 +3.218715 O b'lemma:.'
177 +3.218715 O b'postag:.'
178 +3.215008 Gtype b'lemma:delta-arca'
179 +3.202775 Supp b'lemma:Fe'
180 +3.165237 Gtype b'lemma:fnr8myc'
181 +3.155991 Air b'lemma:Aerobic'
182 +3.133804 Supp b'lemma:dpd'
183 +3.090343 Med b'lemma:LB'
184 +3.073422 Technique b'lemma:chip-seq'
185 +3.060962 Med b'lemma:lb'
186 +3.050123 O b'postag:VBN'
187 +3.028391 Med b'lemma:MOPS'
188 +3.017487 O b'+1:postag:RB'
189 +2.979906 Anti b'lemma:none'
190 +2.978981 O b'-1:lemma:Aerobic'
191 +2.962117 Supp b'lemma:fructose'
192 +2.953345 O b'lemma:\xcf\x8332'
193 +2.890455 Anti b'lemma:seqa'
194 +2.860514 O b'-1:lemma:ChIP-exo'
195 +2.856286 Gtype b'lemma:\xe2\x88\x86'
196 +2.827313 O b'lemma:CEL'
197 +2.783360 Technique b'lemma:rnaseq'
198 +2.775420 Med b'+1:lemma:0.4'
199 +2.774305 OD b'lemma:od600'
200 +2.753373 O b'lemma:-'
201 +2.742915 Supp b'lemma:rifampicin'
202 +2.675772 Gtype b'lemma:delta-fnr'
203 +2.630113 Supp b'+1:lemma:1'
204 +2.629618 Supp b'+1:lemma:Deficient'
205 +2.620392 Vess b'lemma:flask'
206 +2.620392 Vess b'-1:lemma:warm'
207 +2.618241 O b'lemma:affyexp'
208 +2.609048 pH b'lemma:ph5'
209 +2.609048 pH b'+1:lemma:.5'
210 +2.605367 Temp b'lemma:\xc2\xb0c'
211 +2.605338 Gtype b'+1:lemma:type'
212 +2.604381 Gtype b'lemma:\xce\xb4fur'
213 +2.603271 Air b'postag:RB'
214 +2.594594 Gtype b'+1:lemma:with'
215 +2.582369 O b'lemma:Custom'
216 +2.567820 Gtype b'lemma:type'
217 +2.567689 Gversion b'lemma:nc'
218 +2.557861 Supp b'-1:lemma:Cra'
219 +2.552038 OD b'lemma:od450'
220 +2.550932 Gtype b'lemma:nsrr'
221 +2.550177 Gversion b'lemma:chip-seq'
222 +2.524549 O b'+1:lemma:od600'
223 +2.502467 O b'-1:lemma:glucose'
224 +2.498403 Gtype b'lemma:wild-type'
225 +2.496663 Supp b'lemma:arginine'
226 +2.495738 Supp b'+1:lemma:_'
227 +2.483625 O b'lemma:chip-arca'
228 +2.479625 O b'lemma:with'
229 +2.455411 Supp b'+1:lemma:2'
230 +2.454463 Gtype b'lemma:WT'
231 +2.388316 O b'-1:lemma:stpa'
232 +2.376289 O b'lemma:s'
233 +2.368051 Phase b'-1:lemma:mid-log'
234 +2.360684 Technique b'lemma:ChIP-Seq'
235 +2.349033 O b'lemma:argr'
236 +2.347947 Strain b'+1:lemma:substr'
237 +2.329446 O b'lemma:oxyr'
238 +2.326483 Gversion b'lemma:u00096'
239 +2.326483 Gversion b'+1:lemma:.2'
240 +2.322186 O b'-1:lemma:anaerobic'
241 +2.319676 Anti b'lemma:anti-myc'
242 +2.310676 Gversion b'lemma:.2'
243 +2.310676 Gversion b'-1:lemma:u00096'
244 +2.309895 Gtype b'lemma:\xce\xb4soxs'
245 +2.304666 O b'-1:lemma:lb'
246 +2.286012 Gversion b'-1:lemma:nc'
247 +2.283995 Med b'+1:lemma:2.0'
248 +2.263722 Gtype b'-1:lemma:ptac'
249 +2.251060 Technique b'-1:lemma:IP'
250 +2.241105 O b'postag:CC'
251 +2.233213 O b'postag:SYM'
252 +2.228846 Air b'lemma:Anaerobic'
253 +2.221020 O b'+1:lemma:pq'
254 +2.217171 O b'lemma:purr'
255 +2.215541 Med b'lemma:m63'
256 +2.210660 Gversion b'lemma:000913'
257 +2.208620 Phase b'lemma:phase'
258 +2.200256 Air b'lemma:anaerobically'
259 +2.160285 Supp b'lemma:nacl'
260 +2.159816 O b'lemma:Lrp'
261 +2.146260 O b'+1:lemma:anti-fur'
262 +2.142375 Gtype b'+1:lemma:pq'
263 +2.137685 O b'lemma:ompr'
264 +2.137493 O b'-1:lemma:0.3-0.35'
265 +2.135033 pH b'+1:postag:CD'
266 +2.132965 Gtype b'+1:lemma:flagtag'
267 +2.132516 Air b'-1:lemma:-'
268 +2.129831 O b'lemma:or'
269 +2.127593 Air b'-1:postag::'
270 +2.100892 Technique b'postag:NNP'
271 +2.095024 Air b'-1:lemma:_'
272 +2.079808 Gtype b'lemma:ptac'
273 +2.078817 Med b'postag:NNP'
274 +2.065995 Supp b'lemma:Leu'
275 +2.045237 O b'lemma:chip'
276 +2.027925 Temp b'lemma:43'
277 +2.022011 Gtype b'lemma:\xce\xb4ompr'
278 +2.015716 Supp b'-1:lemma:+'
279 +2.010073 Substrain b'+1:lemma:phtpg'
280 +2.008340 Temp b'-1:lemma:37'
281 +2.004601 Temp b'-1:lemma:43'
282 +1.996465 Gtype b'lemma:deltaseqa'
283 +1.996465 Gtype b'-1:lemma:old'
284 +1.991818 Anti b'+1:lemma:antibody'
285 +1.986009 Gtype b'lemma:pk4854'
286 +1.981713 Technique b'-1:lemma:input'
287 +1.981625 Med b'+1:lemma:+'
288 +1.979648 Gtype b'-1:lemma:rpob'
289 +1.974870 Gtype b'-1:lemma:_'
290 +1.973288 O b'lemma:chip-fnr'
291 +1.969889 Temp b'+1:lemma:\xc2\xb0c'
292 +1.968489 O b'-1:lemma:type'
293 +1.959681 Supp b'lemma:iptg'
294 +1.950150 Gtype b'+1:lemma:_'
295 +1.947863 Supp b'lemma:Adenine'
296 +1.947687 Technique b'-1:lemma:chip-exo'
297 +1.941978 Anti b'lemma:anti-rpos'
298 +1.937288 Med b'-1:lemma:ml'
299 +1.924562 Gtype b'+1:lemma:aerobic'
300 +1.924487 Phase b'+1:lemma:for'
301 +1.922675 O b'postag:DT'
302 +1.914419 Supp b'+1:lemma:hour'
303 +1.913395 O b'+1:lemma:43'
304 +1.912727 O b'lemma:Fur'
305 +1.876476 O b'lemma:genotype/variation'
306 +1.869806 Supp b'-1:lemma:\xc2\xb5m'
307 +1.868961 O b'+1:lemma:mid-log'
308 +1.867289 O b'+1:lemma:chip-seq'
309 +1.863790 Supp b'lemma:methanol'
310 +1.861757 Supp b'lemma:20'
311 +1.857902 Supp b'-1:lemma:with'
312 +1.856991 OD b'+1:lemma:stationary'
313 +1.852369 Temp b'-1:lemma:sample'
314 +1.848158 Gversion b'+1:lemma:000913'
315 +1.846987 Gtype b'-1:lemma:nsrr'
316 +1.845305 O b'lemma:for'
317 +1.843025 Technique b'+1:lemma:chip-exo'
318 +1.842623 O b'postag:VBG'
319 +1.827664 Gversion b'postag:CD'
320 +1.820283 O b'lemma:soxs'
321 +1.820283 O b'lemma:soxr'
322 +1.820233 Gtype b'+1:lemma:ph5'
323 +1.815561 Supp b'+1:lemma:respiratory'
324 +1.810671 O b'lemma:culture'
325 +1.809579 pH b'lemma:.5'
326 +1.809579 pH b'-1:lemma:ph5'
327 +1.802708 Gtype b'lemma:\xce\xb4oxyr'
328 +1.802434 Temp b'lemma:37'
329 +1.802103 Med b'+1:lemma:minimal'
330 +1.788823 Gtype b'lemma:\xce\xb4soxr'
331 +1.787884 Supp b'+1:lemma:deficient'
332 +1.781577 O b'lemma:at'
333 +1.774963 O b'lemma:pt7'
334 +1.766232 Vess b'-1:postag:VBN'
335 +1.758278 Gversion b'lemma:_'
336 +1.754083 Supp b'+1:lemma:and'
337 +
338 +
339 +Top negative:
340 +-0.165340 O b'-1:lemma:with'
341 +-0.170223 Phase b'+1:postag:NN'
342 +-0.171143 Med b'-1:lemma:MOPS'
343 +-0.171691 O b'lemma:co2'
344 +-0.172496 O b'+1:lemma:antibody'
345 +-0.173573 O b'-1:lemma:control'
346 +-0.175923 O b'-1:postag:-LRB-'
347 +-0.178273 O b'+1:lemma:purify'
348 +-0.178964 Gtype b'+1:lemma:1'
349 +-0.179388 O b'lemma:medium'
350 +-0.190175 Gtype b'+1:lemma:-lrb-'
351 +-0.193476 Anti b'+1:postag:JJ'
352 +-0.194108 O b'+1:lemma:2.0'
353 +-0.195669 O b'lemma:n2'
354 +-0.198645 O b'-1:lemma:300'
355 +-0.201659 O b'-1:lemma:of'
356 +-0.210827 O b'lemma:aerobically'
357 +-0.216287 O b'+1:lemma:pahse'
358 +-0.216954 Gtype b'+1:lemma:2'
359 +-0.222719 Technique b'-1:lemma::'
360 +-0.225921 Gtype b'lemma:rna'
361 +-0.227807 O b'+1:lemma:sample'
362 +-0.229277 Gtype b'+1:postag:NNS'
363 +-0.232261 O b'-1:lemma:n2'
364 +-0.233570 Gtype b'-1:lemma:-'
365 +-0.237526 OD b'+1:lemma:in'
366 +-0.240536 Gtype b'lemma:control'
367 +-0.242225 Phase b'-1:postag:NN'
368 +-0.252367 O b'-1:lemma:delta'
369 +-0.255317 O b'-1:postag:VBP'
370 +-0.255936 O b'-1:lemma:rna'
371 +-0.260735 Gtype b'postag:NNS'
372 +-0.263059 O b'-1:lemma:e.'
373 +-0.265319 O b'+1:lemma:from'
374 +-0.273429 O b'-1:lemma:minimal'
375 +-0.276572 O b'lemma:e.'
376 +-0.276704 Gtype b'-1:lemma:,'
377 +-0.276704 Gtype b'-1:postag:,'
378 +-0.279370 O b'postag:RB'
379 +-0.280295 O b'-1:lemma:grow'
380 +-0.282926 O b'+1:lemma:mg1655'
381 +-0.288333 O b'lemma:10'
382 +-0.289288 O b'lemma:pahse'
383 +-0.291441 Gtype b'+1:lemma:cra'
384 +-0.295834 Air b'postag:CD'
385 +-0.300317 O b'lemma:nacl'
386 +-0.302273 Supp b'+1:postag:IN'
387 +-0.304479 O b'lemma:30'
388 +-0.305051 O b'-1:lemma:purify'
389 +-0.306221 OD b'+1:lemma:0.4'
390 +-0.306561 OD b'+1:lemma:and'
391 +-0.315073 Supp b'lemma:and'
392 +-0.317269 O b'-1:lemma:0.1'
393 +-0.320606 O b'+1:lemma:delta'
394 +-0.324445 O b'+1:lemma:%'
395 +-0.328680 O b'+1:lemma:or'
396 +-0.335995 Gtype b'lemma:ompr'
397 +-0.337994 Med b'postag:CD'
398 +-0.339794 O b'+1:lemma:-lcb-'
399 +-0.341876 O b'+1:postag:-RRB-'
400 +-0.348075 OD b'+1:postag:CC'
401 +-0.350623 O b'+1:lemma:strain'
402 +-0.351953 O b'-1:lemma:mm'
403 +-0.354366 Med b'+1:postag:NN'
404 +-0.359119 Gtype b'+1:lemma:a'
405 +-0.368580 Med b'-1:postag:CD'
406 +-0.369042 O b'-1:lemma:mid-log'
407 +-0.369832 O b'+1:lemma:phase'
408 +-0.374612 O b'-1:lemma:um'
409 +-0.374612 O b'+1:lemma:paraquat'
410 +-0.378047 Gtype b'-1:postag:CD'
411 +-0.378990 O b'lemma:\xc2\xb0c'
412 +-0.382063 O b'+1:lemma:cell'
413 +-0.383941 O b'lemma:minimal'
414 +-0.383980 Temp b'postag:JJ'
415 +-0.384553 O b'+1:lemma:dissolve'
416 +-0.390868 O b'+1:lemma:until'
417 +-0.397770 Technique b'-1:postag::'
418 +-0.403782 O b'+1:postag:IN'
419 +-0.420663 Supp b'+1:lemma:glucose'
420 +-0.421882 O b'-1:lemma:fresh'
421 +-0.423208 O b'-1:lemma:iptg'
422 +-0.425203 O b'lemma:8'
423 +-0.425322 O b'lemma:phase'
424 +-0.426379 Gtype b'+1:lemma:b'
425 +-0.436102 O b'+1:lemma:shake'
426 +-0.441221 O b'-1:lemma:rifampicin'
427 +-0.444583 Air b'-1:lemma:or'
428 +-0.447161 Supp b'-1:postag:VBG'
429 +-0.448411 Med b'+1:postag:NNS'
430 +-0.460422 O b'-1:lemma:affinity'
431 +-0.461216 Supp b'+1:postag:VBN'
432 +-0.467958 O b'-1:lemma:cra'
433 +-0.469465 O b'+1:lemma:minimal'
434 +-0.469624 Supp b'-1:lemma:%'
435 +-0.477155 O b'-1:lemma:20'
436 +-0.479874 O b'lemma:of'
437 +-0.505244 O b'lemma:glucose'
438 +-0.508080 O b'-1:lemma:from'
439 +-0.508329 Phase b'postag:JJ'
440 +-0.519825 O b'lemma:mg1655'
441 +-0.520316 O b'+1:lemma:0.4'
442 +-0.531961 Gtype b'lemma:_'
443 +-0.540846 O b'lemma:dissolve'
444 +-0.541927 Temp b'+1:lemma:to'
445 +-0.541927 Temp b'+1:postag:TO'
446 +-0.543538 OD b'+1:lemma:mid-log'
447 +-0.554268 Phase b'-1:lemma:at'
448 +-0.567076 O b'lemma:150'
449 +-0.567076 O b'+1:lemma:mg/ml'
450 +-0.586115 O b'+1:lemma:Aerobic'
451 +-0.590065 OD b'+1:postag:NN'
452 +-0.591060 O b'+1:lemma:b'
453 +-0.601984 OD b'lemma:-lrb-'
454 +-0.602651 O b'-1:lemma:30'
455 +-0.610779 Gtype b'-1:postag:SYM'
456 +-0.611922 O b'-1:lemma:chip-exo'
457 +-0.624890 pH b'postag:NN'
458 +-0.628877 Supp b'postag:CC'
459 +-0.642872 O b'lemma:lb'
460 +-0.645246 O b'+1:lemma:rep1'
461 +-0.646910 O b'+1:postag:NNS'
462 +-0.648451 Gtype b'-1:postag:DT'
463 +-0.656497 O b'+1:lemma:c'
464 +-0.671297 Temp b'-1:lemma:\xc2\xb0c'
465 +-0.672555 Supp b'+1:lemma:rifampicin'
466 +-0.675146 Med b'+1:postag:IN'
467 +-0.684210 OD b'postag:-LRB-'
468 +-0.690268 O b'lemma:m63'
469 +-0.692418 O b'lemma:purify'
470 +-0.711910 O b'-1:lemma:g/l'
471 +-0.714120 O b'+1:lemma:300'
472 +-0.719637 O b'+1:lemma:arginine'
473 +-0.720246 Temp b'postag:NN'
474 +-0.723885 Gtype b'+1:lemma:\xe2\x88\x86'
475 +-0.729214 O b'-1:lemma:until'
476 +-0.731048 O b'+1:lemma:fecl2'
477 +-0.733838 O b'-1:lemma:1'
478 +-0.754956 O b'+1:lemma:\xc2\xb0c'
479 +-0.760036 O b'-1:lemma:od600'
480 +-0.785671 Anti b'+1:lemma:anti-fur'
481 +-0.789666 OD b'postag:JJ'
482 +-0.822362 O b'lemma:dpd'
483 +-0.825176 O b'-1:lemma:o2'
484 +-0.856382 O b'-1:lemma:~'
485 +-0.858874 O b'lemma:od600'
486 +-0.861229 O b'+1:lemma:0.3'
487 +-0.867648 O b'lemma:media'
488 +-0.877526 O b'+1:lemma:in'
489 +-0.899345 O b'+1:lemma:at'
490 +-0.903562 Gtype b'lemma:delta'
491 +-0.909951 O b'-1:lemma:0.2'
492 +-0.924018 O b'-1:lemma:\xe2\x88\x86'
493 +-0.936952 Phase b'-1:postag:JJ'
494 +-0.937687 O b'lemma:anaerobically'
495 +-0.958929 O b'lemma:0.3'
496 +-0.977286 Air b'-1:postag:JJ'
497 +-0.979403 O b'lemma:20'
498 +-0.989887 O b'lemma:0.1'
499 +-1.003141 O b'lemma:mid-log'
500 +-1.016700 Supp b'+1:lemma:acetate'
501 +-1.042214 O b'lemma:2h'
502 +-1.042214 O b'-1:lemma:additional'
503 +-1.072377 O b'+1:postag:VBG'
504 +-1.075398 O b'-1:lemma:dissolve'
505 +-1.075398 O b'+1:lemma:methanol'
506 +-1.082645 O b'+1:lemma:g/l'
507 +-1.096557 O b'lemma:anaerobic'
508 +-1.126451 O b'lemma:0.2'
509 +-1.166660 O b'lemma:\xe2\x88\x86'
510 +-1.172209 O b'lemma:fecl2'
511 +-1.173636 O b'+1:lemma:supplement'
512 +-1.193870 O b'-1:postag:VBG'
513 +-1.194541 O b'-1:lemma:ompr'
514 +-1.232022 O b'lemma:k-12'
515 +-1.253980 O b'lemma:\xce\xb4fur'
516 +-1.288532 O b'-1:lemma:ml'
517 +-1.301101 O b'postag:VBP'
518 +-1.312157 O b'-1:lemma:co2'
519 +-1.347620 O b'-1:lemma:rpob'
520 +-1.379029 O b'-1:postag::'
521 +-1.416689 Supp b'postag:JJ'
522 +-1.422574 O b'-1:lemma:37'
523 +-1.454115 O b'-1:lemma:sample'
524 +-1.461328 O b'lemma:37'
525 +-1.464702 Anti b'postag:NNP'
526 +-1.488429 Air b'+1:postag:JJ'
527 +-1.542774 O b'lemma:rifampicin'
528 +-1.620387 O b'-1:lemma:2'
529 +-1.621084 O b'lemma:wt'
530 +-1.634867 Air b'postag:NN'
531 +-1.635440 O b'-1:lemma:IP'
532 +-1.705295 O b'lemma:methanol'
533 +-1.742392 O b'+1:lemma:+'
534 +-1.747036 O b'-1:lemma:nsrr'
535 +-1.856713 O b'+1:lemma:hour'
536 +-1.966783 O b'+1:lemma:2'
537 +-2.387888 O b'+1:lemma:1'
538 +-2.893303 O b'-1:lemma::'
539 +-2.945684 O b'-1:lemma:_'
540 +
1 ********** TRAINING AND TESTING REPORT ********** 1 ********** TRAINING AND TESTING REPORT **********
2 Training file: training-data-set-70_v4.txt 2 Training file: training-data-set-70_v4.txt
3 3
4 -best params:{'c1': 0.04733824675634195, 'c2': 0.013567747033585223} 4 +best params:{'c1': 0.29457600411613616, 'c2': 0.0017589762043383245}
5 -best CV score:0.7954499755233463 5 +best CV score:0.8078796055237475
6 -model size: 0.08M 6 +model size: 0.05M
7 7
8 -Flat F1: 0.8073047538765561 8 +Flat F1: 0.7794612343667667
9 precision recall f1-score support 9 precision recall f1-score support
10 10
11 OD 1.000 0.405 0.577 37 11 OD 1.000 0.405 0.577 37
12 pH 1.000 1.000 1.000 12 12 pH 1.000 1.000 1.000 12
13 Technique 0.952 0.909 0.930 22 13 Technique 0.952 0.909 0.930 22
14 - Med 0.891 0.860 0.875 57 14 + Med 1.000 0.737 0.848 57
15 Temp 0.818 1.000 0.900 18 15 Temp 0.818 1.000 0.900 18
16 Vess 0.000 0.000 0.000 0 16 Vess 0.000 0.000 0.000 0
17 Agit 0.000 0.000 0.000 0 17 Agit 0.000 0.000 0.000 0
18 - Phase 1.000 0.947 0.973 19 18 + Phase 1.000 0.895 0.944 19
19 - Air 0.939 0.742 0.829 62 19 + Air 0.780 0.742 0.760 62
20 - Anti 1.000 0.444 0.615 9 20 + Anti 0.571 0.444 0.500 9
21 Strain 1.000 1.000 1.000 1 21 Strain 1.000 1.000 1.000 1
22 - Gtype 0.865 0.783 0.822 106 22 + Gtype 0.848 0.792 0.820 106
23 Substrain 0.000 0.000 0.000 1 23 Substrain 0.000 0.000 0.000 1
24 - Supp 0.869 0.684 0.765 136 24 + Supp 0.796 0.662 0.723 136
25 Gversion 0.000 0.000 0.000 0 25 Gversion 0.000 0.000 0.000 0
26 26
27 -avg / total 0.901 0.748 0.807 480 27 +avg / total 0.861 0.727 0.779 480
28 28
29 29
30 Top likely transitions: 30 Top likely transitions:
31 -Agit -> Agit 6.351306 31 +OD -> OD 6.390430
32 -OD -> OD 6.016578 32 +Agit -> Agit 6.117830
33 -Temp -> Temp 5.927690 33 +Temp -> Temp 5.690422
34 -Anti -> Anti 5.530188 34 +Anti -> Anti 5.526528
35 -Med -> Med 5.290933 35 +Med -> Med 5.389776
36 -Air -> Air 4.824974 36 +Gtype -> Gtype 5.136395
37 -Gversion -> Gversion 4.795717 37 +Air -> Air 4.861639
38 -Phase -> Phase 4.587222 38 +Gversion -> Gversion 4.681583
39 -O -> O 4.562384 39 +Technique -> Technique 4.547400
40 -Gtype -> Gtype 4.485788 40 +O -> O 4.328164
41 -Supp -> Supp 4.175027 41 +Supp -> Supp 4.275170
42 -Technique -> Technique 3.738966 42 +Phase -> Phase 3.947478
43 -pH -> pH 2.445982 43 +O -> Supp 2.168179
44 -Substrain -> Gtype 1.983414 44 +Gtype -> Supp 2.126815
45 -O -> Supp 1.704431 45 +pH -> pH 1.951624
46 -Gtype -> Supp 1.702624 46 +O -> Technique 1.752428
47 -Technique -> Air 1.053845 47 +O -> Gtype 1.686100
48 -O -> Technique 1.011581 48 +Air -> O 1.391236
49 -O -> Gtype 0.959004 49 +Substrain -> Gtype 0.941140
50 -O -> Temp 0.852096 50 +O -> Anti 0.799854
51 -Air -> O 0.791615 51 +Med -> O 0.671251
52 -Gtype -> pH 0.696397 52 +O -> Temp 0.557904
53 -O -> Anti 0.684439 53 +O -> Gversion 0.509095
54 -O -> Gversion 0.269497 54 +Technique -> Air 0.285589
55 -Gtype -> Air 0.261457 55 +Gtype -> pH 0.187722
56 -O -> Strain 0.143898 56 +Temp -> O 0.127072
57 -Med -> O 0.029331 57 +Supp -> O 0.081093
58 -O -> pH 0.007540 58 +O -> OD 0.056972
59 -O -> Vess 0.000124 59 +Gtype -> Air 0.021236
60 -O -> Med 0.000090 60 +O -> Med 0.002225
61 -Temp -> O 0.000022 61 +OD -> Phase 0.001636
62 -Phase -> O -0.002114 62 +OD -> Med -0.056726
63 -Vess -> O -0.020913 63 +Technique -> O -0.084720
64 -O -> Phase -0.027016 64 +Gtype -> Anti -0.290184
65 -Anti -> Gtype -0.034769 65 +Gtype -> O -0.349078
66 -Gversion -> Air -0.042314 66 +Gtype -> OD -0.351477
67 -Phase -> Air -0.063658 67 +OD -> O -0.547705
68 -O -> Agit -0.107236 68 +O -> Air -0.672320
69 -OD -> Technique -0.108455 69 +Supp -> Med -0.757781
70 -Supp -> pH -0.117168 70 +Substrain -> O -0.945716
71 -Gversion -> O -0.140630 71 +Phase -> OD -0.974380
72 -Anti -> O -0.151755 72 +Agit -> O -1.057441
73 -Gtype -> Technique -0.152014 73 +Med -> Supp -1.117202
74 -Supp -> Phase -0.214979
75 -OD -> Supp -0.232643
76 -O -> OD -0.260286
77 -Supp -> Anti -0.275132
78 -Gtype -> Phase -0.278437
79 -Technique -> O -0.314521
80 -Phase -> Technique -0.315599
81 74
82 75
83 Top unlikely transitions: 76 Top unlikely transitions:
84 -Phase -> O -0.002114 77 +OD -> OD 6.390430
85 -Vess -> O -0.020913 78 +Agit -> Agit 6.117830
86 -O -> Phase -0.027016 79 +Temp -> Temp 5.690422
87 -Anti -> Gtype -0.034769 80 +Anti -> Anti 5.526528
88 -Gversion -> Air -0.042314 81 +Med -> Med 5.389776
89 -Phase -> Air -0.063658 82 +Gtype -> Gtype 5.136395
90 -O -> Agit -0.107236 83 +Air -> Air 4.861639
91 -OD -> Technique -0.108455 84 +Gversion -> Gversion 4.681583
92 -Supp -> pH -0.117168 85 +Technique -> Technique 4.547400
93 -Gversion -> O -0.140630 86 +O -> O 4.328164
94 -Anti -> O -0.151755 87 +Supp -> Supp 4.275170
95 -Gtype -> Technique -0.152014 88 +Phase -> Phase 3.947478
96 -Supp -> Phase -0.214979 89 +O -> Supp 2.168179
97 -OD -> Supp -0.232643 90 +Gtype -> Supp 2.126815
98 -O -> OD -0.260286 91 +pH -> pH 1.951624
99 -Supp -> Anti -0.275132 92 +O -> Technique 1.752428
100 -Gtype -> Phase -0.278437 93 +O -> Gtype 1.686100
101 -Technique -> O -0.314521 94 +Air -> O 1.391236
102 -Phase -> Technique -0.315599 95 +Substrain -> Gtype 0.941140
103 -Supp -> O -0.331781 96 +O -> Anti 0.799854
104 -Med -> Air -0.373175 97 +Med -> O 0.671251
105 -Supp -> Temp -0.406898 98 +O -> Temp 0.557904
106 -Gtype -> O -0.442607 99 +O -> Gversion 0.509095
107 -Temp -> Med -0.464337 100 +Technique -> Air 0.285589
108 -Gtype -> Gversion -0.493751 101 +Gtype -> pH 0.187722
109 -Supp -> Gversion -0.560400 102 +Temp -> O 0.127072
110 -Anti -> OD -0.563611 103 +Supp -> O 0.081093
111 -Supp -> Technique -0.605347 104 +O -> OD 0.056972
112 -Gtype -> Med -0.614663 105 +Gtype -> Air 0.021236
113 -Supp -> OD -0.660842 106 +O -> Med 0.002225
114 -Air -> Supp -0.707856 107 +OD -> Phase 0.001636
115 -OD -> Air -0.738038 108 +OD -> Med -0.056726
116 -OD -> Gtype -0.750328 109 +Technique -> O -0.084720
117 -Supp -> Gtype -0.775491 110 +Gtype -> Anti -0.290184
118 -Supp -> Air -0.783032 111 +Gtype -> O -0.349078
119 -Gtype -> Anti -0.848608 112 +Gtype -> OD -0.351477
120 -Air -> Med -0.863324 113 +OD -> O -0.547705
121 -OD -> Med -0.930579 114 +O -> Air -0.672320
122 -Agit -> O -0.969044 115 +Supp -> Med -0.757781
123 -Air -> OD -0.995424 116 +Substrain -> O -0.945716
124 -Technique -> pH -1.068524 117 +Phase -> OD -0.974380
125 -OD -> O -1.148371 118 +Agit -> O -1.057441
126 -O -> Air -1.151845 119 +Med -> Supp -1.117202
127 -Technique -> OD -1.233856
128 -Gtype -> OD -1.268038
129 -Technique -> Gtype -1.279158
130 -Substrain -> O -1.352003
131 -Supp -> Med -1.440706
132 -Med -> Supp -1.997092
133 -Phase -> OD -2.488972
134 120
135 121
136 Top positive: 122 Top positive:
137 -8.290919 O b'lemma:_' 123 +9.784769 O b'lemma:_'
138 -7.385787 Phase b'lemma:stationary' 124 +8.777655 Air b'lemma:anaerobic'
139 -7.051234 O b'lemma:1' 125 +7.930641 Air b'lemma:aerobic'
140 -6.894708 Supp b'lemma:Iron' 126 +7.220796 Technique b'lemma:ChIP-exo'
141 -6.675567 Air b'lemma:anaerobic' 127 +7.196554 O b'lemma:1'
142 -6.403841 Air b'lemma:aerobic' 128 +7.103993 Phase b'lemma:stationary'
143 -6.381259 Technique b'lemma:ChIP-exo' 129 +6.998968 O b'lemma:rpob'
144 -6.295199 Strain b'lemma:k-12' 130 +6.988146 Supp b'lemma:Iron'
145 -6.076363 O b'lemma:rpob' 131 +6.971195 Supp b'lemma:nitrate'
146 -6.004917 O b'lemma:2' 132 +6.730326 Med b'lemma:MOPS'
147 -5.997376 Technique b'lemma:chipseq' 133 +6.729792 Air b'-1:lemma:ChIP-Seq'
148 -5.756531 Supp b'lemma:pq' 134 +6.615444 Gtype b'lemma:type'
149 -5.480849 O b'lemma:3' 135 +6.497802 O b'-1:lemma:ChIP-exo'
150 -5.419549 Air b'-1:lemma:ChIP-Seq' 136 +6.115603 Strain b'lemma:k-12'
151 -5.377608 O b'-1:lemma:tag' 137 +6.006143 Phase b'lemma:mid-log'
152 -5.236921 Gversion b'lemma:asm584v2' 138 +5.813042 Substrain b'lemma:mg1655'
153 -5.220500 Supp b'lemma:nitrate' 139 +5.750692 Supp b'lemma:pq'
154 -5.194599 Gtype b'lemma:\xce\xb4cra' 140 +5.692854 O b'postag::'
155 -5.105810 O b'lemma:rep1' 141 +5.640080 Gversion b'lemma:asm584v2'
156 -5.072402 Phase b'lemma:mid-log' 142 +5.442313 Gtype b'-1:lemma:\xe2\x88\x86'
157 -5.067722 O b'postag:IN' 143 +5.421944 Gversion b'lemma:nc'
158 -5.062697 Med b'lemma:MOPS' 144 +5.369011 O b'lemma:2'
159 -5.031333 Supp b'lemma:nh4cl' 145 +5.323172 O b'lemma:3'
160 -5.013490 Gtype b'lemma:arca8myc' 146 +5.227211 O b'lemma:Custom'
161 -5.000342 Gtype b'lemma:flag-tag' 147 +5.221194 Supp b'lemma:nh4cl'
162 -5.000342 Gtype b'-1:lemma:c-terminal' 148 +5.036519 Technique b'lemma:chipseq'
163 -4.890613 O b'lemma:rep2' 149 +5.002570 O b'lemma:b'
164 -4.886114 Substrain b'lemma:mg1655' 150 +4.911066 Temp b'-1:lemma:sample'
165 -4.864909 Supp b'lemma:glucose' 151 +4.803502 Gversion b'-1:lemma:nc'
166 -4.809146 Supp b'+1:lemma:\xc2\xb5m' 152 +4.759594 Gtype b'lemma:wt'
167 -4.725613 Air b'lemma:Aerobic' 153 +4.756971 Air b'lemma:Aerobic'
168 -4.660445 O b'lemma:rep3' 154 +4.733958 Supp b'+1:lemma:\xc2\xb5m'
169 -4.614931 Med b'lemma:LB' 155 +4.696241 OD b'lemma:od600'
170 -4.549528 O b'lemma:Cra' 156 +4.618934 O b'lemma:\xcf\x8332'
171 -4.411392 Gtype b'lemma:wt' 157 +4.610324 Gtype b'+1:lemma:type'
172 -4.409856 Technique b'lemma:rna-seq' 158 +4.544628 Gtype b'lemma:\xce\xb4cra'
173 -4.384311 Gtype b'-1:lemma:\xe2\x88\x86' 159 +4.517060 O b'lemma:a'
174 -4.354696 O b'lemma:b' 160 +4.407754 OD b'lemma:od450'
175 -4.328794 Supp b'lemma:acetate' 161 +4.400043 O b'postag:IN'
176 -4.303499 Gtype b'lemma:delta-arca' 162 +4.361805 Supp b'lemma:no3'
177 -4.292242 O b'lemma:Custom' 163 +4.357088 O b'-1:lemma:tag'
178 -4.271514 O b'-1:lemma:ChIP-exo' 164 +4.352412 Gtype b'lemma:delta-fnr'
179 -4.249183 Gtype b'lemma:fnr8myc' 165 +4.311823 O b'lemma:Cra'
180 -4.166692 O b'postag::' 166 +4.167960 Gtype b'lemma:flag-tag'
181 -4.162283 Supp b'lemma:no3' 167 +4.167960 Gtype b'-1:lemma:c-terminal'
182 -4.142997 Technique b'lemma:chip-seq' 168 +4.162564 Med b'lemma:LB'
183 -4.139547 O b'lemma:\xcf\x8332' 169 +4.113496 Strain b'+1:lemma:substr'
184 -4.132690 Supp b'-1:lemma:Cra' 170 +4.107297 Anti b'+1:lemma:antibody'
185 -4.123280 Supp b'lemma:Fe' 171 +4.060899 Technique b'lemma:ChIP-Seq'
186 -4.117229 Anti b'lemma:none' 172 +4.009046 O b'lemma:rep1'
187 -4.089970 O b'-1:lemma:Aerobic' 173 +3.995454 Supp b'lemma:rifampicin'
188 -4.070800 O b'lemma:a' 174 +3.963685 Technique b'lemma:rna-seq'
189 -4.053427 Technique b'lemma:rnaseq' 175 +3.933835 Supp b'lemma:glucose'
190 -3.997780 O b'lemma:.' 176 +3.917748 O b'lemma:.'
191 -3.997780 O b'postag:.' 177 +3.917748 O b'postag:.'
192 -3.955278 OD b'lemma:od450' 178 +3.845505 Supp b'lemma:dpd'
193 -3.952430 Med b'lemma:lb' 179 +3.808636 O b'lemma:rep2'
194 -3.926643 Anti b'lemma:seqa' 180 +3.774698 Gtype b'lemma:wild-type'
195 -3.901600 O b'+1:postag:RB' 181 +3.760833 Med b'lemma:lb'
196 -3.860379 Supp b'lemma:fructose' 182 +3.747355 Technique b'-1:lemma:IP'
197 -3.843887 O b'+1:lemma:od600' 183 +3.703487 Air b'postag:RB'
198 -3.818270 Gversion b'lemma:nc' 184 +3.662819 O b'lemma:rep3'
199 -3.774402 Gtype b'lemma:type' 185 +3.662186 Supp b'lemma:Fe'
200 -3.769802 Gtype b'lemma:delta-fnr' 186 +3.579211 Temp b'-1:lemma:\xcf\x8332'
201 -3.749008 Med b'+1:lemma:0.4' 187 +3.504088 Technique b'lemma:chip-seq'
202 -3.723936 Gtype b'+1:lemma:type' 188 +3.459881 Vess b'lemma:flask'
203 -3.716300 Gtype b'lemma:\xe2\x88\x86' 189 +3.459881 Vess b'-1:lemma:warm'
204 -3.702464 Air b'postag:RB' 190 +3.395894 Supp b'lemma:acetate'
205 -3.701643 Supp b'lemma:rifampicin' 191 +3.371382 O b'+1:lemma:od600'
206 -3.698023 Gversion b'lemma:chip-seq' 192 +3.355281 Supp b'lemma:arginine'
207 -3.685933 O b'lemma:-' 193 +3.288615 Anti b'lemma:seqa'
208 -3.684595 O b'-1:lemma:0.3-0.35' 194 +3.267673 Gtype b'lemma:arca8myc'
209 -3.676777 Supp b'lemma:dpd' 195 +3.257108 Gtype b'-1:lemma:rpob'
210 -3.644945 OD b'lemma:od600' 196 +3.214124 Med b'+1:lemma:0.4'
211 -3.635765 Technique b'lemma:ChIP-Seq' 197 +3.198215 O b'lemma:chip'
212 -3.623886 O b'lemma:CEL' 198 +3.191605 OD b'+1:lemma:stationary'
213 -3.599273 Supp b'+1:lemma:1' 199 +3.129303 pH b'lemma:ph5'
214 -3.576564 OD b'+1:lemma:stationary' 200 +3.129303 pH b'+1:lemma:.5'
215 -3.566248 Gtype b'lemma:\xce\xb4fur' 201 +3.116874 Supp b'-1:lemma:Cra'
216 -3.461638 O b'-1:lemma:anaerobic' 202 +3.111015 O b'+1:lemma:chip-seq'
217 -3.459278 Gtype b'lemma:nsrr' 203 +3.100779 Gtype b'+1:lemma:with'
218 -3.356330 pH b'lemma:ph5' 204 +3.096274 Technique b'+1:lemma:chip-exo'
219 -3.356330 pH b'+1:lemma:.5' 205 +3.080007 O b'-1:lemma:0.3-0.35'
220 -3.352106 O b'-1:lemma:glucose' 206 +3.076638 Technique b'lemma:rnaseq'
221 -3.340294 Supp b'+1:lemma:Deficient' 207 +2.996028 Gtype b'+1:lemma:ph5'
222 -3.338469 Supp b'lemma:arginine' 208 +2.989922 Anti b'lemma:none'
223 -3.337805 Gtype b'+1:lemma:with' 209 +2.975187 O b'-1:lemma:Aerobic'
224 -3.333928 Strain b'+1:lemma:substr' 210 +2.962110 Anti b'lemma:anti-rpos'
225 -3.322235 Anti b'lemma:anti-myc' 211 +2.927775 Supp b'+1:lemma:1'
226 -3.308233 Gtype b'lemma:wild-type' 212 +2.897627 Gtype b'lemma:delta-arca'
227 -3.291619 O b'lemma:with' 213 +2.894293 Supp b'+1:lemma:2'
228 -3.274998 Vess b'lemma:flask' 214 +2.870010 Gtype b'lemma:nsrr'
229 -3.274998 Vess b'-1:lemma:warm' 215 +2.836891 O b'lemma:escherichia'
230 -3.203208 Supp b'+1:lemma:2' 216 +2.823759 O b'+1:lemma:pq'
231 -3.169852 Med b'lemma:m63' 217 +2.729622 Gtype b'+1:lemma:pq'
232 -3.132500 Gtype b'lemma:\xce\xb4soxs' 218 +2.721450 Supp b'lemma:fructose'
233 -3.105860 Med b'+1:lemma:2.0' 219 +2.715488 Supp b'lemma:iptg'
234 -3.077793 Gtype b'lemma:WT' 220 +2.707351 Gtype b'lemma:\xce\xb4ompr'
235 -3.074708 O b'lemma:oxyr' 221 +2.706414 Gtype b'lemma:fnr8myc'
236 -3.065934 Anti b'+1:lemma:antibody' 222 +2.705613 O b'-1:lemma:0.3'
237 -3.065570 O b'lemma:s' 223 +2.696678 O b'-1:lemma:type'
238 -3.051751 O b'-1:lemma:type' 224 +2.677637 O b'-1:lemma:anaerobic'
239 -3.050447 O b'+1:lemma:o.d.' 225 +2.617637 Technique b'-1:lemma:chip-exo'
240 -3.033846 Technique b'-1:lemma:IP' 226 +2.601501 O b'lemma:with'
241 -3.021636 O b'lemma:chip-arca' 227 +2.598938 O b'postag:CC'
242 -3.007962 Gtype b'lemma:\xce\xb4ompr' 228 +2.589617 Gversion b'lemma:chip-seq'
243 -2.993470 O b'-1:lemma:stpa' 229 +2.564844 Gtype b'lemma:\xce\xb4fur'
244 -2.985907 O b'-1:lemma:lb' 230 +2.529911 Temp b'-1:lemma:37'
245 -2.982505 O b'lemma:chip' 231 +2.512630 Temp b'-1:lemma:43'
246 -2.979425 O b'lemma:for' 232 +2.501323 O b'-1:lemma:glucose'
247 -2.977744 O b'lemma:affyexp' 233 +2.465702 Supp b'-1:lemma:+'
248 -2.974504 Gversion b'lemma:u00096' 234 +2.437465 Gversion b'lemma:u00096'
249 -2.974504 Gversion b'+1:lemma:.2' 235 +2.437465 Gversion b'+1:lemma:.2'
250 -2.951628 Supp b'lemma:nacl' 236 +2.390733 O b'lemma:-'
251 -2.929411 Supp b'+1:lemma:hour' 237 +2.390656 O b'lemma:oxyr'
252 -2.918651 Med b'-1:lemma:ml' 238 +2.389452 Gtype b'lemma:WT'
253 -2.914880 Gversion b'lemma:.2' 239 +2.388101 O b'+1:postag:RB'
254 -2.914880 Gversion b'-1:lemma:u00096' 240 +2.371844 Gtype b'lemma:\xe2\x88\x86'
255 -2.913751 O b'lemma:or' 241 +2.368954 Gversion b'lemma:000913'
256 -2.911773 O b'postag:VBN' 242 +2.357589 pH b'lemma:.5'
257 -2.882260 O b'+1:lemma:anti-fur' 243 +2.357589 pH b'-1:lemma:ph5'
258 -2.876894 O b'+1:lemma:chip-seq' 244 +2.347080 Med b'lemma:m63'
259 -2.868995 Gtype b'-1:lemma:ptac' 245 +2.341653 Med b'+1:lemma:minimal'
260 -2.866722 Temp b'lemma:\xc2\xb0c' 246 +2.312104 Temp b'lemma:43'
261 -2.863424 Supp b'+1:lemma:_' 247 +2.303920 Supp b'lemma:Leu'
262 -2.862778 O b'lemma:ompr' 248 +2.303021 Anti b'lemma:anti-myc'
263 -2.834787 Air b'lemma:Anaerobic' 249 +2.298956 Gtype b'lemma:pk4854'
264 -2.827994 Gversion b'-1:lemma:nc' 250 +2.289285 Med b'lemma:glucose'
265 -2.824064 Temp b'-1:lemma:43' 251 +2.270819 O b'+1:postag:NNP'
266 -2.820717 O b'lemma:argr' 252 +2.250795 Air b'lemma:anaerobically'
267 -2.820412 Gversion b'lemma:000913' 253 +2.249574 Gtype b'postag:-RRB-'
268 -2.749427 Anti b'lemma:anti-rpos' 254 +2.245776 Gversion b'lemma:.2'
269 -2.734729 Gtype b'+1:lemma:flagtag' 255 +2.245776 Gversion b'-1:lemma:u00096'
270 -2.732480 Supp b'-1:lemma:+' 256 +2.239995 Air b'-1:lemma:co2'
271 -2.727515 O b'lemma:Lrp' 257 +2.227457 Supp b'lemma:20'
272 -2.719436 Phase b'+1:lemma:for' 258 +2.212330 Supp b'+1:lemma:hour'
273 -2.711551 Temp b'lemma:43' 259 +2.212247 Temp b'-1:lemma:30'
274 -2.711404 Gtype b'lemma:deltaseqa' 260 +2.173944 Supp b'lemma:nacl'
275 -2.711404 Gtype b'-1:lemma:old' 261 +2.172282 O b'+1:lemma:sparging'
276 -2.703630 Gtype b'lemma:pk4854' 262 +2.129033 O b'lemma:s'
277 -2.700766 O b'+1:lemma:pq' 263 +2.126416 Phase b'-1:lemma:mid-log'
278 -2.675879 Air b'lemma:anaerobically' 264 +2.125863 Supp b'+1:lemma:_'
279 -2.664358 Gtype b'+1:lemma:pq' 265 +2.114093 Med b'+1:lemma:2.0'
280 -2.656000 Technique b'-1:lemma:input' 266 +2.111768 Med b'-1:lemma:glucose'
281 -2.651505 Temp b'-1:lemma:37' 267 +2.073983 Gtype b'+1:lemma:flagtag'
282 -2.648470 O b'lemma:2-3' 268 +2.071701 O b'-1:lemma:lb'
283 -2.620313 Temp b'lemma:37' 269 +2.052281 Med b'-1:lemma:ml'
284 -2.617008 Substrain b'+1:lemma:phtpg' 270 +2.050869 Gtype b'-1:lemma:nsrr'
285 -2.612535 Technique b'-1:lemma:chip-exo' 271 +1.973985 O b'postag:VBN'
286 -2.596752 Med b'+1:lemma:minimal' 272 +1.966483 Med b'lemma:L'
287 -2.596648 O b'-1:lemma:dpd' 273 +1.966483 Med b'+1:lemma:broth'
288 -2.596120 O b'lemma:at' 274 +1.943849 Med b'lemma:broth'
289 -2.593521 O b'postag:SYM' 275 +1.943849 Med b'-1:lemma:L'
290 -2.572579 Gtype b'-1:lemma:rpob' 276 +1.943198 Supp b'-1:lemma:with'
291 -2.572348 O b'postag:CC' 277 +1.933549 Supp b'lemma:Adenine'
292 -2.562481 O b'lemma:purr' 278 +1.928306 O b'lemma:CEL'
293 -2.559444 Gtype b'lemma:ptac' 279 +1.904039 Supp b'-1:lemma:\xc2\xb5m'
294 -2.547961 O b'postag:DT' 280 +1.854835 Med b'lemma:media'
295 -2.528953 Temp b'-1:lemma:sample' 281 +1.849121 O b'lemma:at'
296 -2.519081 Gtype b'+1:lemma:ph5' 282 +1.846853 Phase b'-1:lemma:until'
297 -2.510093 O b'lemma:soxs' 283 +1.845040 OD b'lemma:phase'
298 -2.510093 O b'lemma:soxr' 284 +1.843752 Supp b'+1:lemma:Deficient'
299 -2.489436 pH b'lemma:.5' 285 +1.834795 Gtype b'+1:lemma:_'
300 -2.489436 pH b'-1:lemma:ph5' 286 +1.832489 O b'-1:lemma:\xc2\xb0c'
301 -2.486692 O b'+1:lemma:sparging' 287 +1.818739 O b'lemma:chip-arca'
302 -2.468346 Air b'lemma:anerobically' 288 +1.813945 OD b'lemma:0.3'
303 -2.466200 Gtype b'lemma:\xce\xb4oxyr' 289 +1.805051 O b'+1:lemma:o.d.'
304 -2.460573 O b'-1:lemma:l1' 290 +1.797440 Temp b'lemma:37'
305 -2.435676 Supp b'lemma:iptg' 291 +1.792631 Vess b'-1:postag:VBN'
306 -2.396322 Air b'-1:lemma:-' 292 +1.776920 Technique b'-1:lemma:_'
307 -2.381121 Technique b'+1:lemma:chip-exo' 293 +1.773247 OD b'+1:lemma:phase'
308 -2.375332 Med b'postag:NNP' 294 +1.762789 Temp b'lemma:\xc2\xb0c'
309 -2.369739 Supp b'lemma:Leu' 295 +1.761249 Technique b'+1:lemma:rna-seq'
310 -2.367468 Temp b'-1:lemma:\xcf\x8332' 296 +1.758774 Gtype b'-1:postag::'
311 -2.358408 O b'lemma:Fur' 297 +1.752571 O b'lemma:or'
312 -2.318420 Supp b'lemma:Adenine' 298 +1.747526 O b'-1:lemma:l1'
313 -2.308664 Gtype b'+1:lemma:aerobic' 299 +1.747292 Supp b'lemma:of'
314 -2.284972 pH b'+1:postag:CD' 300 +1.740326 Temp b'+1:lemma:\xc2\xb0c'
315 -2.278223 O b'-1:lemma:0.3' 301 +1.701975 O b'lemma:ompr'
316 -2.275175 O b'+1:lemma:mid-log' 302 +1.696253 O b'lemma:c-terminal'
317 -2.272071 Med b'lemma:L' 303 +1.696253 O b'+1:lemma:flag-tag'
318 -2.272071 Med b'+1:lemma:broth' 304 +1.690400 Med b'+1:lemma:supplement'
319 -2.271694 Gversion b'+1:lemma:000913' 305 +1.689524 pH b'+1:postag:CD'
320 -2.263241 Temp b'+1:lemma:\xc2\xb0c' 306 +1.687584 O b'+1:lemma:nacl'
321 -2.251200 Gtype b'lemma:\xce\xb4soxr' 307 +1.685346 O b'+1:lemma:acetate'
322 -2.250951 Med b'-1:lemma:LB' 308 +1.674079 O b'-1:lemma:dpd'
323 -2.232437 Phase b'lemma:phase' 309 +1.668207 Gtype b'-1:lemma:_'
324 -2.225558 O b'-1:lemma:\xc2\xb0c' 310 +1.667206 Temp b'+1:lemma:in'
325 -2.210922 O b'lemma:pt7' 311 +1.666468 Supp b'lemma:methanol'
326 -2.195220 Med b'lemma:glucose' 312 +1.660722 Air b'-1:lemma:-'
327 -2.189252 Technique b'postag:NNP' 313 +1.655979 Gtype b'-1:lemma:vector'
328 -2.171773 O b'lemma:chip-fnr' 314 +1.642097 O b'lemma:culture'
329 -2.161995 Gtype b'lemma:dfnr' 315 +1.641394 Med b'-1:lemma:LB'
330 -2.158766 O b'lemma:genotype/variation' 316 +1.639030 Phase b'+1:lemma:for'
331 -2.150201 O b'+1:lemma:43' 317 +1.635194 OD b'-1:lemma:about'
332 -2.145901 Supp b'-1:lemma:\xc2\xb5m' 318 +1.632144 Gtype b'lemma:\xce\xb4soxs'
333 -2.141092 Supp b'lemma:leucine' 319 +1.622571 O b'-1:lemma:media'
334 -2.114711 Gtype b'-1:lemma:nsrr' 320 +1.574984 Gversion b'postag:CD'
335 -2.112477 O b'lemma:culture' 321 +1.574818 O b'lemma:soxs'
336 -2.110383 Supp b'+1:lemma:and' 322 +1.574818 O b'lemma:soxr'
337 323
338 324
339 Top negative: 325 Top negative:
340 --0.004206 Gtype b'-1:lemma:,' 326 +0.012428 O b'lemma:build'
341 --0.004206 Gtype b'-1:postag:,' 327 +0.011706 OD b'-1:postag:JJ'
342 --0.004363 O b'+1:lemma:dissolve' 328 +0.010758 O b'-1:lemma:m63'
343 --0.005226 Air b'-1:lemma:anaerobically' 329 +0.010555 Temp b'+1:lemma:rep1'
344 --0.006081 Med b'postag:-LRB-' 330 +0.009338 O b'-1:lemma:\xce\xbcm'
345 --0.007482 O b'+1:lemma:25' 331 +0.009111 OD b'lemma:of'
346 --0.007505 Air b'+1:postag:-LRB-' 332 +0.008729 O b'lemma:~'
347 --0.010695 O b'+1:lemma:delta' 333 +0.008132 Gtype b'lemma:cra-8myc-tagged'
348 --0.010729 Gtype b'lemma:control' 334 +0.008132 Gtype b'lemma:fur-8myc'
349 --0.015920 OD b'-1:postag:DT' 335 +0.007873 Air b'-1:lemma:95'
350 --0.016476 Supp b'+1:lemma:glucose' 336 +0.005830 OD b'+1:postag:-RRB-'
351 --0.020393 O b'+1:lemma:o2' 337 +0.005750 Air b'lemma:-lrb-'
352 --0.020701 Air b'-1:lemma:-rrb-' 338 +0.005529 Phase b'-1:postag::'
353 --0.027434 O b'-1:postag:DT' 339 +0.005242 Gtype b'+1:postag:CD'
354 --0.030363 Air b'postag:CD' 340 +0.004042 Substrain b'isUpper'
355 --0.031961 O b'postag:RB' 341 +0.003852 O b'-1:lemma:5'
356 --0.035995 O b'lemma:aerobically' 342 +0.003021 O b'+1:lemma:use'
357 --0.040364 O b'lemma:n2' 343 +0.003019 Air b'postag:CC'
358 --0.040535 Med b'-1:postag:CD' 344 +0.002663 Air b'postag:-LRB-'
359 --0.041176 Air b'-1:postag:-RRB-' 345 +0.002334 O b'+1:lemma:ml'
360 --0.042452 OD b'+1:lemma:0.4' 346 +0.001862 O b'-1:lemma:pq'
361 --0.044876 O b'-1:lemma:the' 347 +0.000956 O b'lemma:short'
362 --0.046558 O b'-1:lemma:25' 348 +0.000945 O b'+1:postag:SYM'
363 --0.047871 O b'+1:lemma:95' 349 +0.000941 Med b'-1:postag::'
364 --0.048967 O b'-1:postag:IN' 350 +0.000813 O b'+1:lemma:mm'
365 --0.050524 O b'+1:lemma:strain' 351 +0.000791 Supp b'lemma:\xc2\xb5l'
366 --0.053326 Phase b'+1:postag:NN' 352 +0.000791 Supp b'+1:lemma:cm20'
367 --0.060668 O b'-1:lemma:e.' 353 +0.000762 O b'-1:lemma:k-12'
368 --0.070033 O b'lemma:e.' 354 +0.000330 Supp b'+1:postag:RB'
369 --0.070538 O b'+1:lemma:0.4' 355 +0.000321 O b'+1:lemma:rnase'
370 --0.071511 O b'+1:lemma:grow' 356 +0.000279 OD b'postag:CC'
371 --0.072393 Gtype b'+1:lemma:cra' 357 +0.000211 Gtype b'+1:lemma:-lcb-'
372 --0.076483 Med b'postag:CD' 358 +0.000154 Med b'postag:NN'
373 --0.079707 O b'+1:lemma:or' 359 +0.000123 Supp b'-1:lemma:1mm'
374 --0.080785 O b'+1:lemma:5' 360 +0.000066 O b'-1:lemma:respiratory'
375 --0.081991 OD b'+1:postag:CD' 361 +0.000047 O b'postag:VB'
376 --0.097802 O b'lemma:glucose' 362 +0.000031 O b'+1:postag:JJ'
377 --0.099284 O b'+1:lemma:b' 363 +0.000022 O b'+1:postag:FW'
378 --0.100727 Supp b'-1:lemma:and' 364 +0.000021 Phase b'postag:VBG'
379 --0.107163 Supp b'-1:postag:NN' 365 +0.000014 Temp b'-1:postag:NNS'
380 --0.121273 O b'lemma:o2' 366 +0.000012 O b'-1:lemma:genotype/variation'
381 --0.123375 Anti b'+1:postag:JJ' 367 +0.000011 Phase b'lemma:grow'
382 --0.128472 Supp b'-1:postag:VBG' 368 +0.000009 O b'+1:lemma:genbank'
383 --0.137982 O b'lemma:nacl' 369 +0.000009 O b'postag:FW'
384 --0.138385 O b'-1:lemma:g/l' 370 +0.000006 Gtype b'lemma:knock-out'
385 --0.140738 Med b'+1:lemma:media' 371 +0.000005 O b'lemma:ip'
386 --0.143230 O b'+1:lemma:.' 372 +0.000005 Gtype b'+1:lemma:strain'
387 --0.143230 O b'+1:postag:.' 373 +0.000001 O b'+1:lemma:ph5'
388 --0.147429 O b'-1:lemma:-lrb-' 374 +0.000000 Phase b'-1:lemma::'
389 --0.150859 O b'+1:lemma:mm' 375 +-0.000002 O b'-1:lemma:from'
390 --0.150867 Gtype b'postag:CD' 376 +-0.000009 O b'-1:lemma:rifampicin'
391 --0.155869 O b'-1:lemma:mm' 377 +-0.000018 O b'+1:lemma:95'
392 --0.157092 O b'-1:lemma:of' 378 +-0.000109 O b'-1:lemma:um'
393 --0.160183 O b'+1:postag:IN' 379 +-0.000109 O b'+1:lemma:paraquat'
394 --0.161439 Gtype b'-1:postag:CD' 380 +-0.000363 Agit b'-1:postag:NN'
395 --0.183365 Gtype b'-1:postag:DT' 381 +-0.000429 O b'+1:lemma:+'
396 --0.184394 Supp b'+1:postag:IN' 382 +-0.000494 O b'-1:lemma:iptg'
397 --0.185747 O b'+1:lemma:-rrb-' 383 +-0.000617 Supp b'postag:CD'
398 --0.188736 O b'-1:lemma:20' 384 +-0.000722 O b'lemma:150'
399 --0.189296 O b'-1:postag:-LRB-' 385 +-0.000722 O b'+1:lemma:mg/ml'
400 --0.194391 O b'-1:lemma:o2' 386 +-0.000846 O b'lemma:grow'
401 --0.196331 O b'lemma:grow' 387 +-0.001402 Air b'-1:lemma:or'
402 --0.197265 O b'lemma:m63' 388 +-0.001659 O b'-1:lemma:to'
403 --0.202228 Supp b'lemma:and' 389 +-0.001659 O b'-1:postag:TO'
404 --0.208828 Gtype b'lemma:_' 390 +-0.001932 Gtype b'+1:lemma:-lrb-'
405 --0.213147 O b'lemma:co2' 391 +-0.002534 O b'+1:lemma:until'
406 --0.216510 O b'+1:lemma:Aerobic' 392 +-0.004418 Phase b'-1:postag:NN'
407 --0.219766 O b'-1:lemma:um' 393 +-0.004820 O b'+1:lemma:rep1'
408 --0.219766 O b'+1:lemma:paraquat' 394 +-0.005823 Gtype b'-1:postag:NNP'
409 --0.222760 O b'-1:lemma:n2' 395 +-0.006241 O b'+1:lemma:300'
410 --0.223418 Med b'-1:postag:NN' 396 +-0.006734 Air b'lemma:,'
411 --0.226489 O b'-1:lemma:minimal' 397 +-0.006734 Air b'postag:,'
412 --0.229253 O b'-1:postag:VBN' 398 +-0.008040 Air b'-1:lemma:25'
413 --0.229413 OD b'+1:lemma:mid-log' 399 +-0.010122 O b'+1:lemma:-rrb-'
414 --0.235205 Technique b'-1:lemma::' 400 +-0.010159 O b'-1:lemma:-lrb-'
415 --0.245927 O b'+1:lemma:cell' 401 +-0.012456 Supp b'-1:postag:NN'
416 --0.259152 O b'+1:lemma:shake' 402 +-0.013973 OD b'postag:JJ'
417 --0.259231 O b'-1:lemma:with' 403 +-0.014420 OD b'isUpper'
418 --0.260969 O b'lemma:lb' 404 +-0.015511 OD b'+1:postag:CD'
419 --0.262122 O b'lemma:\xc2\xb0c' 405 +-0.022697 Air b'+1:postag:-RRB-'
420 --0.262570 Med b'+1:postag:NNS' 406 +-0.022913 O b'-1:lemma:30'
421 --0.267584 O b'+1:lemma:minimal' 407 +-0.023313 OD b'+1:postag:-LRB-'
422 --0.268702 O b'-1:lemma:fresh' 408 +-0.023317 Air b'-1:postag:RB'
423 --0.274046 Supp b'-1:postag:NNP' 409 +-0.024110 O b'-1:lemma:,'
424 --0.283215 Temp b'postag:JJ' 410 +-0.024110 O b'-1:postag:,'
425 --0.289216 O b'+1:postag:-RRB-' 411 +-0.024675 O b'+1:lemma:hour'
426 --0.298829 Med b'+1:postag:NN' 412 +-0.025573 O b'-1:lemma:of'
427 --0.300030 O b'lemma:k-12' 413 +-0.028769 Air b'-1:postag:-LRB-'
428 --0.303893 Supp b'+1:postag:VBN' 414 +-0.030732 Anti b'+1:postag:JJ'
429 --0.304837 O b'+1:lemma:until' 415 +-0.030900 Air b'-1:lemma:and'
430 --0.305487 O b'-1:lemma:mid-log' 416 +-0.032775 Med b'postag:CD'
431 --0.314457 O b'lemma:30' 417 +-0.033408 O b'-1:postag:JJ'
432 --0.318478 O b'-1:lemma:\xe2\x88\x86' 418 +-0.041591 Air b'lemma:95'
433 --0.318630 OD b'postag:JJ' 419 +-0.044656 Air b'-1:lemma:-lrb-'
434 --0.320224 Gtype b'+1:lemma:\xe2\x88\x86' 420 +-0.060308 O b'-1:lemma:o2'
435 --0.328379 O b'lemma:mg1655' 421 +-0.063061 O b'-1:lemma:rpob'
436 --0.332214 O b'-1:lemma:30' 422 +-0.066181 O b'-1:postag:VBN'
437 --0.336273 O b'+1:lemma:phase' 423 +-0.069187 Med b'-1:postag:CD'
438 --0.343858 O b'-1:lemma:0.1' 424 +-0.069620 O b'lemma:and'
439 --0.353210 O b'-1:lemma:1' 425 +-0.080450 Gtype b'-1:postag:CD'
440 --0.363425 O b'lemma:minimal' 426 +-0.085466 O b'+1:lemma:c'
441 --0.367846 O b'-1:lemma:from' 427 +-0.087314 O b'+1:lemma:5'
442 --0.393937 Gversion b'+1:postag:NN' 428 +-0.091477 O b'+1:lemma:shake'
443 --0.407622 Air b'-1:lemma:or' 429 +-0.095092 Med b'+1:postag:IN'
444 --0.419752 Phase b'-1:lemma:at' 430 +-0.102952 Air b'+1:lemma:-lrb-'
445 --0.419908 Med b'+1:postag:IN' 431 +-0.103900 Supp b'-1:postag:NNP'
446 --0.434159 OD b'+1:postag:NN' 432 +-0.104806 Air b'-1:postag:CC'
447 --0.434388 Temp b'-1:lemma:\xc2\xb0c' 433 +-0.130716 Phase b'-1:postag:JJ'
448 --0.437451 OD b'+1:lemma:and' 434 +-0.144760 O b'lemma:20'
449 --0.450338 O b'-1:lemma:rifampicin' 435 +-0.147668 O b'+1:lemma:phase'
450 --0.450644 O b'+1:lemma:%' 436 +-0.151840 Supp b'+1:lemma:rifampicin'
451 --0.460508 O b'+1:lemma:_' 437 +-0.155431 O b'lemma:medium'
452 --0.468703 O b'-1:lemma:od600' 438 +-0.157846 Agit b'isUpper'
453 --0.471110 O b'+1:lemma:c' 439 +-0.162132 O b'-1:lemma:ml'
454 --0.473012 OD b'+1:postag:CC' 440 +-0.163703 Air b'+1:postag:-LRB-'
455 --0.473111 O b'+1:lemma:rep1' 441 +-0.168213 Agit b'postag:NN'
456 --0.476279 O b'lemma:purify' 442 +-0.197124 Temp b'postag:JJ'
457 --0.486329 O b'-1:lemma:iptg' 443 +-0.199293 Med b'-1:postag:IN'
458 --0.490766 Gtype b'-1:postag:SYM' 444 +-0.201861 O b'lemma:fecl2'
459 --0.492855 O b'+1:lemma:\xc2\xb0c' 445 +-0.233445 Air b'isLower'
460 --0.520331 Supp b'+1:lemma:rifampicin' 446 +-0.243970 O b'-1:lemma:the'
461 --0.521486 Gtype b'lemma:delta' 447 +-0.256444 Air b'-1:postag:JJ'
462 --0.544638 O b'lemma:phase' 448 +-0.259109 O b'-1:lemma:~'
463 --0.549770 Supp b'postag:CC' 449 +-0.278225 O b'+1:lemma:%'
464 --0.574118 Technique b'-1:postag::' 450 +-0.280267 Temp b'+1:lemma:to'
465 --0.588060 O b'lemma:\xe2\x88\x86' 451 +-0.280267 Temp b'+1:postag:TO'
466 --0.589911 O b'lemma:dissolve' 452 +-0.288621 Supp b'+1:postag:VBN'
467 --0.600471 O b'-1:lemma:until' 453 +-0.292707 O b'+1:lemma:cell'
468 --0.605867 OD b'lemma:-lrb-' 454 +-0.315187 O b'lemma:od600'
469 --0.606846 O b'-1:lemma:grow' 455 +-0.355514 Phase b'-1:lemma:at'
470 --0.615232 O b'+1:postag:NNS' 456 +-0.357298 O b'lemma:0.1'
471 --0.621806 O b'-1:lemma:cra' 457 +-0.357570 O b'lemma:glucose'
472 --0.628236 O b'+1:lemma:300' 458 +-0.360899 Temp b'isLower'
473 --0.629162 pH b'postag:NN' 459 +-0.411019 O b'lemma:anaerobically'
474 --0.647995 O b'+1:lemma:arginine' 460 +-0.420592 O b'lemma:dissolve'
475 --0.663009 O b'lemma:150' 461 +-0.443294 O b'lemma:0.2'
476 --0.663009 O b'+1:lemma:mg/ml' 462 +-0.451505 Technique b'isNumber'
477 --0.668956 O b'lemma:media' 463 +-0.453164 pH b'postag:NN'
478 --0.687046 OD b'postag:-LRB-' 464 +-0.453934 O b'-1:lemma:37'
479 --0.688477 Anti b'+1:lemma:anti-fur' 465 +-0.477659 Med b'+1:postag:NN'
480 --0.696641 Phase b'-1:postag:JJ' 466 +-0.482028 Supp b'isUpper'
481 --0.720714 O b'lemma:od600' 467 +-0.486122 Supp b'+1:lemma:acetate'
482 --0.740400 O b'+1:lemma:0.3' 468 +-0.490659 O b'+1:postag:IN'
483 --0.753503 O b'-1:postag:VBG' 469 +-0.492086 O b'-1:lemma:cra'
484 --0.798903 O b'lemma:anaerobically' 470 +-0.499001 O b'+1:lemma:fecl2'
485 --0.798945 O b'-1:lemma:0.2' 471 +-0.542612 O b'-1:lemma:od600'
486 --0.800846 Med b'-1:postag:IN' 472 +-0.556265 Supp b'-1:lemma:%'
487 --0.802642 O b'lemma:dpd' 473 +-0.559133 O b'-1:postag:IN'
488 --0.829848 O b'+1:postag:VBG' 474 +-0.563772 O b'-1:postag:-LRB-'
489 --0.837375 O b'lemma:20' 475 +-0.590111 Technique b'-1:postag::'
490 --0.843836 Temp b'+1:lemma:to' 476 +-0.595480 O b'+1:postag:NNS'
491 --0.843836 Temp b'+1:postag:TO' 477 +-0.600550 O b'postag:RB'
492 --0.861567 O b'lemma:anaerobic' 478 +-0.603193 O b'+1:postag:-RRB-'
493 --0.895410 O b'-1:lemma:co2' 479 +-0.608705 OD b'+1:postag:NN'
494 --0.935654 Supp b'+1:lemma:acetate' 480 +-0.619170 O b'+1:lemma:.'
495 --0.962115 O b'+1:lemma:fecl2' 481 +-0.619170 O b'+1:postag:.'
496 --0.965287 O b'-1:lemma:ml' 482 +-0.631410 Temp b'postag:NN'
497 --0.992440 Temp b'postag:NN' 483 +-0.680972 OD b'lemma:-lrb-'
498 --1.012409 Air b'-1:postag:JJ' 484 +-0.692074 O b'lemma:phase'
499 --1.037489 O b'lemma:0.3' 485 +-0.696523 O b'+1:lemma:g/l'
500 --1.038206 O b'lemma:fecl2' 486 +-0.703554 Med b'-1:postag:NN'
501 --1.045928 O b'-1:lemma:~' 487 +-0.722638 O b'-1:lemma:co2'
502 --1.050208 O b'lemma:0.1' 488 +-0.737448 O b'lemma:37'
503 --1.059403 O b'postag:VBP' 489 +-0.793378 O b'-1:lemma:IP'
504 --1.082188 O b'-1:postag::' 490 +-0.881901 O b'-1:lemma:grow'
505 --1.107761 O b'lemma:mid-log' 491 +-0.936753 O b'lemma:2h'
506 --1.113185 O b'lemma:\xce\xb4fur' 492 +-0.936753 O b'-1:lemma:additional'
507 --1.123078 O b'lemma:0.2' 493 +-0.951203 O b'-1:lemma:ompr'
508 --1.128103 O b'-1:lemma:sample' 494 +-0.961075 OD b'isNumber'
509 --1.194487 Supp b'-1:lemma:%' 495 +-0.975747 O b'lemma:media'
510 --1.213453 Air b'postag:NN' 496 +-0.999574 O b'lemma:mid-log'
511 --1.229252 O b'lemma:of' 497 +-1.013924 O b'-1:lemma:dissolve'
512 --1.235299 O b'+1:lemma:supplement' 498 +-1.013924 O b'+1:lemma:methanol'
513 --1.238904 O b'lemma:37' 499 +-1.038456 O b'+1:postag:VBG'
514 --1.267382 O b'lemma:2h' 500 +-1.044424 Gtype b'isLower'
515 --1.267382 O b'-1:lemma:additional' 501 +-1.054187 Anti b'postag:NNP'
516 --1.275201 O b'-1:lemma:dissolve' 502 +-1.055980 Air b'+1:postag:JJ'
517 --1.275201 O b'+1:lemma:methanol' 503 +-1.097851 O b'-1:postag::'
518 --1.291651 O b'+1:lemma:in' 504 +-1.150472 Gtype b'isUpper'
519 --1.453841 O b'+1:lemma:at' 505 +-1.157093 O b'-1:postag:VBG'
520 --1.495880 Air b'+1:postag:JJ' 506 +-1.186007 O b'lemma:wt'
521 --1.522603 Anti b'postag:NNP' 507 +-1.252971 O b'+1:lemma:supplement'
522 --1.573726 O b'+1:lemma:g/l' 508 +-1.282305 Gversion b'isLower'
523 --1.603806 O b'-1:lemma:ompr' 509 +-1.308302 Technique b'isLower'
524 --1.605609 Phase b'postag:JJ' 510 +-1.325280 O b'+1:lemma:in'
525 --1.643331 O b'-1:lemma:rpob' 511 +-1.418383 O b'-1:lemma:nsrr'
526 --1.700527 O b'-1:lemma:37' 512 +-1.424917 O b'+1:lemma:at'
527 --1.724176 O b'-1:lemma:IP' 513 +-1.469077 O b'lemma:methanol'
528 --1.756223 O b'-1:lemma:nsrr' 514 +-1.485871 OD b'postag:-LRB-'
529 --1.790376 O b'+1:lemma:+' 515 +-1.502986 Air b'postag:NN'
530 --1.794994 O b'lemma:methanol' 516 +-1.512421 O b'lemma:of'
531 --1.802577 Supp b'postag:JJ' 517 +-1.560223 Phase b'postag:JJ'
532 --1.803599 O b'lemma:wt' 518 +-1.560628 O b'lemma:rifampicin'
533 --1.870737 O b'lemma:rifampicin' 519 +-1.895357 Supp b'postag:JJ'
534 --2.105365 O b'-1:lemma:2' 520 +-1.938119 O b'+1:lemma:2'
535 --2.201462 O b'+1:lemma:2' 521 +-2.020790 O b'-1:lemma:2'
536 --2.218990 O b'+1:lemma:hour' 522 +-2.056482 Gtype b'isNumber'
537 --2.783349 O b'+1:lemma:1' 523 +-2.518371 O b'+1:lemma:1'
538 --3.830507 O b'-1:lemma:_' 524 +-3.915561 O b'-1:lemma::'
539 --4.238490 O b'-1:lemma::' 525 +-4.466114 O b'-1:lemma:_'
540 526
......
1 ********** TRAINING AND TESTING REPORT ********** 1 ********** TRAINING AND TESTING REPORT **********
2 Training file: training-data-set-70_v4.txt 2 Training file: training-data-set-70_v4.txt
3 3
4 -best params:{'c1': 0.28812013544306553, 'c2': 0.007295583222860682} 4 +best params:{'c1': 0.3717925853055416, 'c2': 0.017924580629424793}
5 -best CV score:0.7989041592425109 5 +best CV score:0.8125475599052483
6 -model size: 0.06M 6 +model size: 0.07M
7 7
8 -Flat F1: 0.7893461428977414 8 +Flat F1: 0.8015576085711513
9 precision recall f1-score support 9 precision recall f1-score support
10 10
11 - OD 1.000 0.405 0.577 37 11 + OD 0.789 0.405 0.536 37
12 pH 1.000 1.000 1.000 12 12 pH 1.000 1.000 1.000 12
13 - Technique 0.952 0.909 0.930 22 13 + Technique 1.000 0.909 0.952 22
14 - Med 1.000 0.842 0.914 57 14 + Med 0.891 0.860 0.875 57
15 Temp 0.818 1.000 0.900 18 15 Temp 0.818 1.000 0.900 18
16 Vess 0.000 0.000 0.000 0 16 Vess 0.000 0.000 0.000 0
17 Agit 0.000 0.000 0.000 0 17 Agit 0.000 0.000 0.000 0
18 Phase 1.000 0.895 0.944 19 18 Phase 1.000 0.895 0.944 19
19 - Air 0.780 0.742 0.760 62 19 + Air 0.783 0.758 0.770 62
20 - Anti 0.500 0.444 0.471 9 20 + Anti 0.857 0.667 0.750 9
21 Strain 1.000 1.000 1.000 1 21 Strain 1.000 1.000 1.000 1
22 - Gtype 0.854 0.774 0.812 106 22 + Gtype 0.897 0.821 0.857 106
23 Substrain 0.000 0.000 0.000 1 23 Substrain 0.000 0.000 0.000 1
24 - Supp 0.802 0.684 0.738 136 24 + Supp 0.857 0.662 0.747 136
25 Gversion 0.000 0.000 0.000 0 25 Gversion 0.000 0.000 0.000 0
26 26
27 -avg / total 0.863 0.742 0.789 480 27 +avg / total 0.868 0.754 0.802 480
28 28
29 29
30 Top likely transitions: 30 Top likely transitions:
31 -Agit -> Agit 6.356818 31 +Agit -> Agit 6.913143
32 -OD -> OD 6.348289 32 +OD -> OD 6.546357
33 -Temp -> Temp 5.553063 33 +Temp -> Temp 5.712726
34 -Med -> Med 5.370053 34 +Med -> Med 5.305596
35 -Anti -> Anti 5.276075 35 +Anti -> Anti 5.023718
36 -Air -> Air 5.018155 36 +Supp -> Supp 4.631165
37 -Gtype -> Gtype 4.515516 37 +Phase -> Phase 4.500208
38 -Gversion -> Gversion 4.398480 38 +Gtype -> Gtype 4.293158
39 -Phase -> Phase 4.359659 39 +Air -> Air 4.246276
40 -O -> O 4.293965 40 +Gversion -> Gversion 4.168987
41 -Technique -> Technique 4.237543 41 +O -> O 3.925497
42 -Supp -> Supp 4.146423 42 +Technique -> Technique 3.566379
43 -O -> Supp 1.964836 43 +pH -> pH 2.052884
44 -Gtype -> Supp 1.866470 44 +O -> Supp 1.936178
45 -pH -> pH 1.685265 45 +Gtype -> Supp 1.326152
46 -Air -> O 1.614236 46 +Air -> O 1.051292
47 -Substrain -> Gtype 1.463550 47 +O -> Technique 0.918460
48 -O -> Technique 1.388918 48 +O -> Gtype 0.855955
49 -O -> Gtype 1.222957 49 +O -> Anti 0.549728
50 -O -> Temp 0.798237 50 +Med -> O 0.455808
51 -Med -> O 0.601567 51 +Phase -> O 0.391302
52 -O -> Anti 0.587178 52 +O -> Temp 0.389367
53 -Technique -> Air 0.378127 53 +OD -> Phase 0.349412
54 -O -> Gversion 0.328551 54 +Supp -> O 0.327410
55 -OD -> Phase 0.308573 55 +Substrain -> Gtype 0.326440
56 -Temp -> O 0.289779 56 +Temp -> O 0.267368
57 -Supp -> O 0.253243 57 +O -> Med 0.077179
58 -O -> Med 0.178828 58 +O -> Phase 0.028994
59 -Phase -> O 0.132350 59 +O -> Gversion 0.026775
60 -Gtype -> pH 0.097473 60 +Technique -> pH -0.006596
61 -O -> Phase 0.003637 61 +Air -> Temp -0.006647
62 -Gtype -> Air 0.001121 62 +Phase -> OD -0.020087
63 -Supp -> Air -0.008182 63 +Gtype -> Anti -0.153729
64 -Technique -> Gtype -0.085945 64 +Supp -> Gtype -0.163416
65 -Gtype -> Anti -0.165395 65 +Gtype -> OD -0.192090
66 -Gtype -> O -0.277440 66 +Supp -> Med -0.235685
67 -OD -> O -0.365628 67 +OD -> O -0.243341
68 -Agit -> O -0.521571 68 +Med -> Supp -0.274565
69 -Gtype -> OD -0.554390 69 +Agit -> O -0.322550
70 -O -> Air -0.784770 70 +Gtype -> O -0.369110
71 -Supp -> Med -0.806802 71 +OD -> Air -0.568717
72 -Substrain -> O -0.835873 72 +O -> Air -0.731642
73 -Med -> Supp -0.906570 73 +Technique -> O -0.757868
74 -Phase -> OD -0.993184 74 +Substrain -> O -0.822866
75 75
76 76
77 Top unlikely transitions: 77 Top unlikely transitions:
78 -Agit -> Agit 6.356818 78 +Agit -> Agit 6.913143
79 -OD -> OD 6.348289 79 +OD -> OD 6.546357
80 -Temp -> Temp 5.553063 80 +Temp -> Temp 5.712726
81 -Med -> Med 5.370053 81 +Med -> Med 5.305596
82 -Anti -> Anti 5.276075 82 +Anti -> Anti 5.023718
83 -Air -> Air 5.018155 83 +Supp -> Supp 4.631165
84 -Gtype -> Gtype 4.515516 84 +Phase -> Phase 4.500208
85 -Gversion -> Gversion 4.398480 85 +Gtype -> Gtype 4.293158
86 -Phase -> Phase 4.359659 86 +Air -> Air 4.246276
87 -O -> O 4.293965 87 +Gversion -> Gversion 4.168987
88 -Technique -> Technique 4.237543 88 +O -> O 3.925497
89 -Supp -> Supp 4.146423 89 +Technique -> Technique 3.566379
90 -O -> Supp 1.964836 90 +pH -> pH 2.052884
91 -Gtype -> Supp 1.866470 91 +O -> Supp 1.936178
92 -pH -> pH 1.685265 92 +Gtype -> Supp 1.326152
93 -Air -> O 1.614236 93 +Air -> O 1.051292
94 -Substrain -> Gtype 1.463550 94 +O -> Technique 0.918460
95 -O -> Technique 1.388918 95 +O -> Gtype 0.855955
96 -O -> Gtype 1.222957 96 +O -> Anti 0.549728
97 -O -> Temp 0.798237 97 +Med -> O 0.455808
98 -Med -> O 0.601567 98 +Phase -> O 0.391302
99 -O -> Anti 0.587178 99 +O -> Temp 0.389367
100 -Technique -> Air 0.378127 100 +OD -> Phase 0.349412
101 -O -> Gversion 0.328551 101 +Supp -> O 0.327410
102 -OD -> Phase 0.308573 102 +Substrain -> Gtype 0.326440
103 -Temp -> O 0.289779 103 +Temp -> O 0.267368
104 -Supp -> O 0.253243 104 +O -> Med 0.077179
105 -O -> Med 0.178828 105 +O -> Phase 0.028994
106 -Phase -> O 0.132350 106 +O -> Gversion 0.026775
107 -Gtype -> pH 0.097473 107 +Technique -> pH -0.006596
108 -O -> Phase 0.003637 108 +Air -> Temp -0.006647
109 -Gtype -> Air 0.001121 109 +Phase -> OD -0.020087
110 -Supp -> Air -0.008182 110 +Gtype -> Anti -0.153729
111 -Technique -> Gtype -0.085945 111 +Supp -> Gtype -0.163416
112 -Gtype -> Anti -0.165395 112 +Gtype -> OD -0.192090
113 -Gtype -> O -0.277440 113 +Supp -> Med -0.235685
114 -OD -> O -0.365628 114 +OD -> O -0.243341
115 -Agit -> O -0.521571 115 +Med -> Supp -0.274565
116 -Gtype -> OD -0.554390 116 +Agit -> O -0.322550
117 -O -> Air -0.784770 117 +Gtype -> O -0.369110
118 -Supp -> Med -0.806802 118 +OD -> Air -0.568717
119 -Substrain -> O -0.835873 119 +O -> Air -0.731642
120 -Med -> Supp -0.906570 120 +Technique -> O -0.757868
121 -Phase -> OD -0.993184 121 +Substrain -> O -0.822866
122 122
123 123
124 Top positive: 124 Top positive:
125 -8.456899 Supp b'lemma:Iron' 125 +7.111444 Technique b'lemma[:2]:Ch'
126 -7.968467 O b'lemma:_' 126 +4.825937 O b'lemma[:2]:re'
127 -7.452197 Air b'lemma:anaerobic' 127 +4.279457 Air b'lemma:anaerobic'
128 -7.437960 Air b'lemma:aerobic' 128 +3.725935 O b'lemma[:2]:ge'
129 -7.396388 Technique b'lemma:ChIP-exo' 129 +3.543228 O b'lemma:1'
130 -7.187671 O b'lemma:1' 130 +3.543228 O b'lemma[:2]:1'
131 -6.882632 Phase b'lemma:stationary' 131 +3.524472 OD b'lemma[:2]:od'
132 -6.605608 Supp b'lemma:nitrate' 132 +3.478950 Phase b'lemma:stationary'
133 -6.530209 Strain b'lemma:k-12' 133 +3.469718 Gtype b'-1:lemma:\xe2\x88\x86'
134 -6.203118 Air b'-1:lemma:ChIP-Seq' 134 +3.448630 Gtype b'lemma:arca8myc'
135 -6.007441 Phase b'lemma:mid-log' 135 +3.428352 Air b'-1:lemma:ChIP-Seq'
136 -5.856483 O b'lemma:rpob' 136 +3.363763 Air b'lemma:aerobic'
137 -5.727633 O b'lemma:2' 137 +3.207046 O b'lemma:rpob'
138 -5.691995 O b'lemma:3' 138 +3.019693 Supp b'lemma:Iron'
139 -5.621467 Technique b'lemma:chipseq' 139 +3.019693 Supp b'lemma[:2]:Ir'
140 -5.604648 Substrain b'lemma:mg1655' 140 +3.010875 O b'-1:lemma:ChIP-exo'
141 -5.596923 Technique b'lemma:ChIP-Seq' 141 +2.921711 Supp b'+1:lemma:\xc2\xb5m'
142 -5.568237 Gtype b'lemma:type' 142 +2.911305 Gtype b'lemma[:1]:\xce\xb4'
143 -5.509620 Med b'lemma:MOPS' 143 +2.889155 O b'-1:lemma:tag'
144 -5.475086 Gversion b'lemma:asm584v2' 144 +2.855933 O b'lemma:with'
145 -5.234945 O b'lemma:\xcf\x8332' 145 +2.855646 Med b'lemma[:1]:L'
146 -5.062729 O b'postag:IN' 146 +2.846749 Technique b'lemma:chipseq'
147 -5.021516 Supp b'lemma:pq' 147 +2.827870 O b'lemma:2'
148 -4.929591 Air b'lemma:Aerobic' 148 +2.827870 O b'lemma[:2]:2'
149 -4.874521 O b'lemma:Custom' 149 +2.817912 Air b'lemma[:2]:ae'
150 -4.858511 Gversion b'lemma:nc' 150 +2.797895 Substrain b'lemma:mg1655'
151 -4.830173 Med b'lemma:LB' 151 +2.792078 Phase b'lemma:mid-log'
152 -4.792027 Gtype b'lemma:\xce\xb4cra' 152 +2.745493 Supp b'+1:lemma:1'
153 -4.771925 OD b'lemma:od600' 153 +2.729132 Technique b'lemma[:2]:rn'
154 -4.722214 O b'lemma:rep1' 154 +2.682269 O b'lemma:3'
155 -4.615430 O b'postag::' 155 +2.682269 O b'lemma[:2]:3'
156 -4.604643 Supp b'+1:lemma:\xc2\xb5m' 156 +2.657675 Gtype b'lemma:type'
157 -4.516978 O b'lemma:b' 157 +2.657675 Gtype b'lemma[:2]:ty'
158 -4.505623 Gtype b'lemma:flag-tag' 158 +2.623761 Med b'+1:lemma:0.4'
159 -4.505623 Gtype b'-1:lemma:c-terminal' 159 +2.580684 Gtype b'lemma[:2]:cr'
160 -4.503645 Med b'lemma:lb' 160 +2.579976 O b'lemma:_'
161 -4.444381 Supp b'lemma:nh4cl' 161 +2.579976 O b'lemma[:1]:_'
162 -4.432940 O b'-1:lemma:tag' 162 +2.579976 O b'lemma[:2]:_'
163 -4.401594 O b'lemma:rep2' 163 +2.569904 O b'+1:lemma:od600'
164 -4.365296 Gtype b'+1:lemma:type' 164 +2.544048 Gtype b'lemma[:2]:de'
165 -4.331532 Gtype b'-1:lemma:\xe2\x88\x86' 165 +2.507607 Temp b'-1:lemma:sample'
166 -4.318893 O b'lemma:rep3' 166 +2.491621 Supp b'lemma:nitrate'
167 -4.280628 O b'-1:lemma:ChIP-exo' 167 +2.491621 Supp b'lemma[:2]:ni'
168 -4.273779 O b'lemma:a' 168 +2.487340 Gtype b'lemma:flag-tag'
169 -4.191200 OD b'lemma:od450' 169 +2.487340 Gtype b'-1:lemma:c-terminal'
170 -4.187860 Gtype b'lemma:wt' 170 +2.476917 Supp b'lemma:arginine'
171 -4.184958 Technique b'lemma:rna-seq' 171 +2.470339 Anti b'+1:lemma:antibody'
172 -4.089199 Supp b'lemma:glucose' 172 +2.468809 Gtype b'lemma[:2]:fl'
173 -4.068712 Temp b'-1:lemma:sample' 173 +2.457061 Air b'lemma[:2]:an'
174 -4.066149 Gtype b'lemma:arca8myc' 174 +2.401035 Gversion b'lemma:nc'
175 -3.877291 O b'lemma:Cra' 175 +2.401035 Gversion b'lemma[:2]:nc'
176 -3.835115 Gtype b'lemma:nsrr' 176 +2.380072 O b'-1:lemma:0.3-0.35'
177 -3.739614 Supp b'lemma:Fe' 177 +2.346761 O b'+1:lemma:pq'
178 -3.722246 Technique b'lemma:chip-seq' 178 +2.337210 Supp b'+1:lemma:2'
179 -3.715540 O b'+1:lemma:od600' 179 +2.311094 Gversion b'-1:lemma:nc'
180 -3.678000 Gtype b'lemma:delta-arca' 180 +2.292513 Gtype b'+1:lemma::'
181 -3.610668 Gtype b'lemma:\xe2\x88\x86' 181 +2.281017 Med b'lemma:MOPS'
182 -3.517468 Med b'+1:lemma:0.4' 182 +2.281017 Med b'lemma[:1]:M'
183 -3.508191 O b'lemma:.' 183 +2.281017 Med b'lemma[:2]:MO'
184 -3.508191 O b'postag:.' 184 +2.204715 Substrain b'lemma[:2]:mg'
185 -3.483906 Gtype b'lemma:fnr8myc' 185 +2.199859 O b'lemma:0.4'
186 -3.468892 Supp b'lemma:acetate' 186 +2.194544 Gversion b'lemma[:2]:00'
187 -3.438457 Vess b'lemma:flask' 187 +2.169851 Temp b'-1:lemma:\xcf\x8332'
188 -3.438457 Vess b'-1:lemma:warm' 188 +2.168672 Gtype b'lemma:fnr8myc'
189 -3.400184 Supp b'lemma:rifampicin' 189 +2.159299 Air b'-1:lemma:co2'
190 -3.396565 Technique b'lemma:rnaseq' 190 +2.156668 Strain b'lemma:k-12'
191 -3.379201 Anti b'lemma:none' 191 +2.156668 Strain b'lemma[:2]:k-'
192 -3.369352 O b'-1:lemma:Aerobic' 192 +2.155314 O b'-1:lemma:Aerobic'
193 -3.366768 O b'-1:lemma:type' 193 +2.138255 Supp b'-1:lemma:Cra'
194 -3.310195 Supp b'lemma:no3' 194 +2.135365 Anti b'lemma[:2]:an'
195 -3.306542 Gtype b'lemma:\xce\xb4fur' 195 +2.117472 pH b'lemma:ph5'
196 -3.289509 O b'-1:lemma:0.3-0.35' 196 +2.117472 pH b'+1:lemma:.5'
197 -3.240918 Gtype b'lemma:delta-fnr' 197 +2.108610 Temp b'lemma[:1]:3'
198 -3.228917 Supp b'lemma:fructose' 198 +2.107391 Air b'lemma[:1]:A'
199 -3.199686 Supp b'lemma:dpd' 199 +2.102650 Supp b'lemma:pq'
200 -3.182132 O b'lemma:-' 200 +2.102650 Supp b'lemma[:2]:pq'
201 -3.174434 Gversion b'-1:lemma:nc' 201 +2.096866 Air b'-1:lemma:-'
202 -3.160676 OD b'+1:lemma:stationary' 202 +2.086323 Supp b'lemma[:2]:gl'
203 -3.140034 Supp b'lemma:arginine' 203 +2.074272 O b'-1:lemma:anaerobic'
204 -3.107677 O b'postag:VBN' 204 +2.064241 Gtype b'lemma:nsrr'
205 -3.075194 Technique b'-1:lemma:IP' 205 +2.064241 Gtype b'lemma[:2]:ns'
206 -3.054797 Anti b'+1:lemma:antibody' 206 +2.029654 O b'lemma:b'
207 -2.967185 Supp b'+1:lemma:1' 207 +2.029654 O b'lemma[:2]:b'
208 -2.948061 pH b'lemma:ph5' 208 +2.016572 Gtype b'lemma[:1]:W'
209 -2.948061 pH b'+1:lemma:.5' 209 +1.998951 Technique b'lemma[:2]:ch'
210 -2.919290 Gtype b'-1:lemma:rpob' 210 +1.998131 O b'lemma:a'
211 -2.909319 Anti b'lemma:seqa' 211 +1.998131 O b'lemma[:2]:a'
212 -2.876363 O b'lemma:chip' 212 +1.968766 Gtype b'-1:lemma:rpob'
213 -2.856949 Med b'+1:lemma:minimal' 213 +1.962195 Gtype b'hGreek'
214 -2.846997 Gtype b'+1:lemma:ph5' 214 +1.961034 Med b'lemma:lb'
215 -2.846043 Gversion b'lemma:u00096' 215 +1.961034 Med b'lemma[:2]:lb'
216 -2.846043 Gversion b'+1:lemma:.2' 216 +1.938806 Gtype b'lemma[:2]:ar'
217 -2.842541 Supp b'lemma:20' 217 +1.930507 OD b'+1:lemma:stationary'
218 -2.813149 Gversion b'lemma:chip-seq' 218 +1.923810 Gversion b'lemma:chip-seq'
219 -2.799253 Temp b'-1:lemma:\xcf\x8332' 219 +1.891990 O b'-1:lemma:0.3'
220 -2.787282 O b'-1:lemma:glucose' 220 +1.889150 Strain b'+1:lemma:substr'
221 -2.767972 Anti b'lemma:anti-rpos' 221 +1.888844 Technique b'lemma[:1]:C'
222 -2.763663 Gtype b'lemma:\xce\xb4ompr' 222 +1.884878 Gtype b'+1:lemma:flagtag'
223 -2.762526 O b'postag:DT' 223 +1.882512 O b'postag::'
224 -2.753494 O b'postag:CC' 224 +1.882512 O b'postag[:1]::'
225 -2.734024 Supp b'+1:lemma:2' 225 +1.882512 O b'postag[:2]::'
226 -2.713273 O b'lemma:CEL' 226 +1.856991 O b'+1:postag:RB'
227 -2.711953 Supp b'-1:lemma:+' 227 +1.851608 O b'postag:IN'
228 -2.708255 Gtype b'+1:lemma:with' 228 +1.851608 O b'postag[:1]:I'
229 -2.662841 Air b'postag:RB' 229 +1.851608 O b'postag[:2]:IN'
230 -2.655147 O b'+1:postag:RB' 230 +1.840138 Supp b'-1:lemma:with'
231 -2.622484 Temp b'-1:lemma:43' 231 +1.839774 Supp b'lemma[:1]:\xc2\xb5'
232 -2.621064 Anti b'lemma:anti-myc' 232 +1.822500 Gtype b'+1:lemma:type'
233 -2.585376 O b'lemma:with' 233 +1.816568 O b'lemma[:1]:C'
234 -2.579506 Gtype b'+1:lemma:pq' 234 +1.815184 Gversion b'lemma:asm584v2'
235 -2.574119 Med b'lemma:m63' 235 +1.805652 Gversion b'lemma[:2]:as'
236 -2.560671 Gtype b'-1:lemma:ptac' 236 +1.792629 O b'+1:postag:NNP'
237 -2.530970 Supp b'lemma:iptg' 237 +1.791305 Supp b'lemma:fructose'
238 -2.522165 Gversion b'lemma:000913' 238 +1.786544 O b'-1:lemma:type'
239 -2.522038 O b'-1:lemma:0.3' 239 +1.762437 Supp b'+1:lemma:_'
240 -2.518142 O b'lemma:or' 240 +1.759820 O b'-1:lemma:lb'
241 -2.510254 pH b'lemma:.5' 241 +1.756744 O b'-1:lemma:glucose'
242 -2.510254 pH b'-1:lemma:ph5' 242 +1.754105 Vess b'lemma:flask'
243 -2.499838 Gtype b'lemma:wild-type' 243 +1.754105 Vess b'-1:lemma:warm'
244 -2.496012 O b'-1:lemma:anaerobic' 244 +1.750186 O b'lemma:Custom'
245 -2.493145 O b'+1:postag:NNP' 245 +1.750186 O b'lemma[:2]:Cu'
246 -2.432959 O b'+1:lemma:o.d.' 246 +1.745341 Strain b'lemma[:1]:k'
247 -2.423786 Supp b'lemma:nacl' 247 +1.739577 Vess b'lemma[:2]:fl'
248 -2.374439 Gversion b'lemma:.2' 248 +1.726669 Supp b'lemma:rifampicin'
249 -2.374439 Gversion b'-1:lemma:u00096' 249 +1.707436 Supp b'lemma[:2]:ri'
250 -2.371897 Supp b'-1:lemma:Cra' 250 +1.707207 Gtype b'+1:lemma:with'
251 -2.333418 Technique b'+1:lemma:chip-exo' 251 +1.696113 O b'lemma[:1]:-'
252 -2.330714 Technique b'-1:lemma:chip-exo' 252 +1.692259 Air b'lemma[:1]:a'
253 -2.318227 Gtype b'+1:lemma:flagtag' 253 +1.639949 Air b'lemma:Aerobic'
254 -2.299023 Supp b'+1:lemma:_' 254 +1.639949 Air b'lemma[:2]:Ae'
255 -2.291540 Supp b'-1:lemma:\xc2\xb5m' 255 +1.635409 O b'postag:CC'
256 -2.270555 Air b'-1:lemma:-' 256 +1.635409 O b'postag[:2]:CC'
257 -2.258400 O b'postag:VBG' 257 +1.628056 Med b'+1:lemma:g/l'
258 -2.241112 O b'-1:lemma:l1' 258 +1.615358 Technique b'symb'
259 -2.239653 Temp b'lemma:\xc2\xb0c' 259 +1.610565 Supp b'lemma[:1]:1'
260 -2.239203 O b'-1:lemma:lb' 260 +1.597091 pH b'+1:postag:CD'
261 -2.216105 Med b'lemma:media' 261 +1.589795 O b'lemma:\xcf\x8332'
262 -2.215247 Med b'-1:lemma:glucose' 262 +1.589795 O b'lemma[:1]:\xcf\x83'
263 -2.198544 O b'lemma:s' 263 +1.589795 O b'lemma[:2]:\xcf\x833'
264 -2.181192 Med b'+1:lemma:2.0' 264 +1.563036 O b'-1:lemma:l1'
265 -2.180737 Supp b'-1:lemma:with' 265 +1.532125 Supp b'lemma:acetate'
266 -2.151013 O b'-1:lemma:\xc2\xb0c' 266 +1.523450 Supp b'lemma[:1]:I'
267 -2.122011 O b'lemma:culture' 267 +1.498488 O b'+1:lemma:nacl'
268 -2.119623 Gtype b'lemma:\xce\xb4soxs' 268 +1.484546 Supp b'lemma:no3'
269 -2.118038 O b'+1:lemma:pq' 269 +1.474134 Gtype b'-1:lemma:_'
270 -2.107784 Strain b'+1:lemma:substr' 270 +1.462775 Technique b'-1:lemma:input'
271 -2.084102 Temp b'-1:lemma:37' 271 +1.457922 O b'+1:lemma:ph5'
272 -2.034197 Med b'lemma:L' 272 +1.445969 Gtype b'-1:postag:VBG'
273 -2.034197 Med b'+1:lemma:broth' 273 +1.435822 Gtype b'+1:lemma:_'
274 -2.033322 OD b'-1:lemma:~' 274 +1.434655 Supp b'lemma:Fe'
275 -2.031873 Temp b'lemma:37' 275 +1.434655 Supp b'lemma[:2]:Fe'
276 -2.021465 Air b'lemma:anaerobically' 276 +1.433511 Gtype b'-1:lemma:vector'
277 -2.013276 O b'lemma:oxyr' 277 +1.429069 Supp b'-1:postag:CD'
278 -1.993546 pH b'+1:postag:CD' 278 +1.428528 Gtype b'lemma[:1]:w'
279 -1.990912 Temp b'lemma:43' 279 +1.424222 pH b'lemma:.5'
280 -1.970179 Gtype b'lemma:pk4854' 280 +1.424222 pH b'-1:lemma:ph5'
281 -1.965724 O b'lemma:escherichia' 281 +1.424222 pH b'lemma[:2]:.5'
282 -1.928351 O b'lemma:affyexp' 282 +1.422747 Med b'+1:lemma:2.0'
283 -1.918099 Gtype b'-1:lemma:nsrr' 283 +1.408132 Supp b'+1:lemma:hour'
284 -1.912439 Gversion b'postag:CD' 284 +1.397778 O b'lemma:.'
285 -1.912210 Gtype b'+1:lemma:_' 285 +1.397778 O b'postag:.'
286 -1.903180 Temp b'+1:lemma:\xc2\xb0c' 286 +1.397778 O b'postag[:1]:.'
287 -1.901831 O b'-1:lemma:media' 287 +1.397778 O b'postag[:2]:.'
288 -1.893202 Supp b'lemma:Leu' 288 +1.397778 O b'lemma[:2]:.'
289 -1.888140 O b'+1:lemma:chip-seq' 289 +1.381316 Gtype b'lemma:wt'
290 -1.885088 Supp b'lemma:methanol' 290 +1.381316 Gtype b'lemma[:2]:wt'
291 -1.864512 Med b'+1:lemma:supplement' 291 +1.377815 Temp b'lemma:43'
292 -1.843743 Gtype b'-1:postag:VBG' 292 +1.377815 Temp b'lemma[:2]:43'
293 -1.840860 Med b'-1:lemma:ml' 293 +1.377716 Air b'+1:postag:IN'
294 -1.833228 O b'lemma:genotype/variation' 294 +1.372036 Med b'+1:postag:-LRB-'
295 -1.830405 Air b'-1:lemma:co2' 295 +1.371743 Med b'+1:lemma:-lrb-'
296 -1.824009 OD b'lemma:0.3' 296 +1.357313 Anti b'lemma:none'
297 -1.823612 O b'-1:lemma:stpa' 297 +1.356053 Temp b'-1:lemma:43'
298 -1.820300 O b'+1:lemma:sparging' 298 +1.355054 Supp b'lemma[:2]:fr'
299 -1.820114 Gtype b'lemma:deltaseqa' 299 +1.352442 Gversion b'+1:lemma:000913'
300 -1.820114 Gtype b'-1:lemma:old' 300 +1.348258 O b'-1:lemma:\xc2\xb0c'
301 -1.808084 O b'lemma:at' 301 +1.339531 Supp b'-1:postag:SYM'
302 -1.804795 Temp b'+1:lemma:and' 302 +1.337456 O b'lemma:delta'
303 -1.793786 Gtype b'lemma:ptac' 303 +1.335121 Supp b'lemma[:2]:ac'
304 -1.792476 Temp b'lemma:30' 304 +1.330202 O b'+1:lemma:mid-log'
305 -1.780844 Supp b'+1:lemma:hour' 305 +1.317551 Supp b'-1:postag:CC'
306 -1.749460 Supp b'lemma:of' 306 +1.312876 OD b'lemma:od600'
307 -1.723530 O b'lemma:condition' 307 +1.304321 O b'lemma[:1]:s'
308 -1.717109 Phase b'-1:lemma:mid-log' 308 +1.301244 Technique b'+1:lemma:chip-exo'
309 -1.711480 Med b'+1:lemma:g/l' 309 +1.288165 Supp b'lemma[:1]:2'
310 -1.709245 Gtype b'-1:lemma:_' 310 +1.287921 Phase b'+1:lemma:-lrb-'
311 -1.702188 Gtype b'-1:lemma:phtpg' 311 +1.287384 Temp b'-1:lemma:37'
312 -1.695199 O b'-1:lemma:dpd' 312 +1.287206 Supp b'lemma:nh4cl'
313 -1.690508 Supp b'lemma:0.2' 313 +1.287206 Supp b'lemma[:2]:nh'
314 -1.688329 Air b'-1:postag:CD' 314 +1.285698 Supp b'lemma[:2]:0.'
315 -1.682363 Technique b'-1:lemma:_' 315 +1.283844 Supp b'lemma[:2]:fe'
316 -1.681577 Phase b'+1:lemma:for' 316 +1.280443 Med b'+1:lemma:supplement'
317 -1.675654 Med b'postag:NNP' 317 +1.280143 Gtype b'lemma[:1]:t'
318 -1.654545 O b'lemma:Lrp' 318 +1.278668 Phase b'+1:postag:-LRB-'
319 -1.636356 Gtype b'+1:postag::' 319 +1.258754 Technique b'-1:lemma:1'
320 -1.629183 Technique b'-1:lemma:1' 320 +1.258397 Med b'+1:lemma:minimal'
321 -1.628579 Technique b'-1:lemma:input' 321 +1.256238 Med b'lemma[:1]:m'
322 -1.626463 Med b'lemma:glucose' 322 +1.247668 OD b'lemma[:1]:o'
323 -1.615682 Temp b'-1:lemma:30' 323 +1.247204 Gversion b'lemma:u00096'
324 -1.596658 Supp b'lemma:Adenine' 324 +1.247204 Gversion b'+1:lemma:.2'
325 325
326 326
327 Top negative: 327 Top negative:
328 -0.017267 O b'-1:lemma:phase' 328 +-0.000006 O b'lemma[:1]:f'
329 -0.015360 O b'-1:lemma:Fur' 329 +-0.000014 Temp b'postag:NN'
330 -0.015015 Gtype b'lemma:-rcb-' 330 +-0.000014 O b'lemma[:1]:4'
331 -0.014734 Air b'lemma:-lrb-' 331 +-0.000077 O b'-1:postag:JJ'
332 -0.013480 Phase b'+1:lemma:aerobically' 332 +-0.000104 O b'lemma:\xe2\x88\x86'
333 -0.013397 O b'-1:lemma:be' 333 +-0.000104 O b'lemma[:1]:\xe2\x88\x86'
334 -0.012964 O b'lemma:fresh' 334 +-0.000104 O b'lemma[:2]:\xe2\x88\x86'
335 -0.012612 Temp b'+1:postag:-RRB-' 335 +-0.000117 O b'-1:lemma:to'
336 -0.011601 O b'lemma:2-3' 336 +-0.000117 O b'-1:postag:TO'
337 -0.010954 OD b'postag:CC' 337 +-0.000139 Gtype b'lemma[:1]:-'
338 -0.009883 Med b'+1:postag:VBG' 338 +-0.000165 O b'-1:lemma:rifampicin'
339 -0.008416 Med b'-1:postag:NNP' 339 +-0.000244 Air b'postag:-RRB-'
340 -0.007746 Phase b'+1:postag:RB' 340 +-0.000244 Air b'postag[:2]:-R'
341 -0.007283 O b'lemma:acetate' 341 +-0.000244 Air b'lemma[:2]:-r'
342 -0.006890 Temp b'-1:postag:NNS' 342 +-0.000251 O b'+1:lemma:n2'
343 -0.005794 O b'-1:postag:VBD' 343 +-0.000490 O b'-1:lemma:\xe2\x88\x86'
344 -0.005770 O b'+1:lemma:n2' 344 +-0.000570 OD b'+1:postag:NNS'
345 -0.005411 Gversion b'-1:postag::' 345 +-0.001255 Supp b'postag[:1]:N'
346 -0.005130 Gtype b'lemma:-lcb-' 346 +-0.001255 Supp b'postag[:2]:NN'
347 -0.003653 Med b'-1:lemma:-rrb-' 347 +-0.001277 O b'lemma[:2]:an'
348 -0.003433 O b'-1:lemma:m63' 348 +-0.001620 Supp b'+1:postag:IN'
349 -0.003399 OD b'postag:CD' 349 +-0.001834 O b'-1:lemma:mid-log'
350 -0.003303 Anti b'+1:postag:-LRB-' 350 +-0.004139 Air b'lemma[:2]:25'
351 -0.003264 Gtype b'lemma:cra' 351 +-0.004380 O b'postag:VBP'
352 -0.003037 Phase b'-1:postag:IN' 352 +-0.004418 O b'+1:lemma:phase'
353 -0.002641 O b'+1:lemma:ChIP-Seq' 353 +-0.004475 Gtype b'+1:lemma:-rrb-'
354 -0.001833 O b'-1:lemma:with' 354 +-0.004892 O b'lemma:phase'
355 -0.001345 O b'-1:postag:VBZ' 355 +-0.005013 Anti b'postag[:1]:N'
356 -0.001191 OD b'-1:lemma:at' 356 +-0.005013 Anti b'postag[:2]:NN'
357 -0.001140 Supp b'+1:lemma:of' 357 +-0.005037 O b'lemma[:2]:ph'
358 -0.001083 Med b'-1:postag::' 358 +-0.005405 Air b'lemma:-lrb-'
359 -0.000969 O b'+1:lemma:anerobically' 359 +-0.005662 O b'-1:lemma:of'
360 -0.000925 O b'+1:lemma:genbank' 360 +-0.006882 O b'lemma:media'
361 -0.000915 O b'-1:lemma:total' 361 +-0.007168 Gtype b'lemma[:1]:g'
362 -0.000846 O b'postag:VBZ' 362 +-0.007303 Air b'postag:-LRB-'
363 -0.000778 Air b'+1:lemma:culture' 363 +-0.007303 Air b'postag[:2]:-L'
364 -0.000629 O b'lemma:express' 364 +-0.007303 Air b'lemma[:2]:-l'
365 -0.000629 O b'+1:lemma:nsrr' 365 +-0.007834 Air b'+1:lemma:and'
366 -0.000580 Air b'postag:-RRB-' 366 +-0.008160 Air b'lemma:25'
367 -0.000523 Supp b'+1:lemma:dissolve' 367 +-0.008761 OD b'postag[:1]:C'
368 -0.000475 O b'lemma:70' 368 +-0.010588 OD b'postag:CD'
369 -0.000346 Supp b'-1:postag:VBN' 369 +-0.010588 OD b'postag[:2]:CD'
370 -0.000255 O b'+1:lemma:anaerobically' 370 +-0.012329 Phase b'-1:lemma:at'
371 -0.000233 O b'+1:postag:-LRB-' 371 +-0.013171 Med b'postag[:1]:C'
372 -0.000229 Air b'lemma:95' 372 +-0.013817 Air b'+1:lemma:until'
373 -0.000124 Agit b'lemma:bath' 373 +-0.016734 OD b'postag[:1]:N'
374 -0.000124 Agit b'-1:lemma:water' 374 +-0.016734 OD b'postag[:2]:NN'
375 -0.000123 Agit b'+1:lemma:shake' 375 +-0.018208 Air b'lemma[:1]:n'
376 -0.000098 O b'+1:lemma:_' 376 +-0.022588 Supp b'hUpper'
377 -0.000070 Gtype b'+1:lemma:control' 377 +-0.022588 Supp b'hLower'
378 -0.000049 Anti b'lemma:tag' 378 +-0.023822 Air b'postag[:1]:C'
379 -0.000044 O b'lemma:glucose' 379 +-0.024287 O b'symb'
380 -0.000043 Agit b'+1:lemma:at' 380 +-0.025967 Med b'lemma[:1]:c'
381 -0.000042 Agit b'-1:postag:DT' 381 +-0.026538 Air b'-1:postag:-LRB-'
382 -0.000033 Air b'-1:lemma:95' 382 +-0.031765 Technique b'postag[:1]:N'
383 -0.000027 Temp b'+1:postag:VB' 383 +-0.031765 Technique b'postag[:2]:NN'
384 -0.000027 O b'+1:lemma:wt' 384 +-0.032068 Supp b'lemma[:2]:mi'
385 -0.000025 O b'lemma:~' 385 +-0.037401 Air b'lemma[:1]:o'
386 -0.000024 Agit b'postag:IN' 386 +-0.040028 Med b'postag:NN'
387 -0.000018 OD b'-1:lemma:mg1655' 387 +-0.043803 Air b'+1:lemma:-lrb-'
388 -0.000012 OD b'lemma:\xce\xb4soxr' 388 +-0.044062 OD b'+1:postag:CD'
389 -0.000009 Supp b'lemma:paraquat' 389 +-0.044602 Supp b'-1:lemma:%'
390 -0.000003 Vess b'+1:postag:IN' 390 +-0.044731 Air b'+1:postag:-LRB-'
391 -0.000001 Med b'+1:lemma:with' 391 +-0.046035 OD b'postag:JJ'
392 --0.000003 Supp b'+1:postag:VBN' 392 +-0.046795 Air b'-1:lemma:-lrb-'
393 --0.000004 O b'-1:lemma:sample' 393 +-0.048808 OD b'postag[:1]:J'
394 --0.000016 O b'lemma:150' 394 +-0.048808 OD b'postag[:2]:JJ'
395 --0.000016 O b'+1:lemma:mg/ml' 395 +-0.049349 O b'+1:lemma:rep1'
396 --0.000020 O b'+1:lemma:shake' 396 +-0.050801 Supp b'postag:CD'
397 --0.000023 OD b'+1:postag:-LRB-' 397 +-0.050801 Supp b'postag[:2]:CD'
398 --0.000033 O b'lemma:anaerobic' 398 +-0.056455 O b'+1:lemma:0.3'
399 --0.000042 O b'-1:lemma:at' 399 +-0.057472 O b'-1:lemma:from'
400 --0.000051 O b'lemma:e.' 400 +-0.066677 O b'lemma:dissolve'
401 --0.000122 O b'-1:lemma:0.1' 401 +-0.071601 Supp b'lemma[:1]:o'
402 --0.000150 O b'-1:lemma:e.' 402 +-0.072755 O b'lemma[:1]:k'
403 --0.000237 Gtype b'+1:postag:NNS' 403 +-0.073873 O b'lemma:150'
404 --0.000353 O b'-1:lemma:rifampicin' 404 +-0.073873 O b'+1:lemma:mg/ml'
405 --0.000482 Gtype b'+1:lemma:-lrb-' 405 +-0.073873 O b'lemma[:2]:15'
406 --0.000998 O b'-1:lemma:ml' 406 +-0.076685 O b'-1:lemma:ml'
407 --0.002220 Gtype b'postag:CD' 407 +-0.076846 O b'lemma[:2]:gl'
408 --0.002782 Gtype b'-1:postag:NN' 408 +-0.077209 O b'-1:lemma:od600'
409 --0.002824 Med b'postag:CD' 409 +-0.083778 O b'+1:lemma:300'
410 --0.003203 Air b'postag:-LRB-' 410 +-0.087471 Air b'symb'
411 --0.005019 O b'+1:lemma:phase' 411 +-0.091928 Supp b'+1:postag:VBN'
412 --0.008101 Supp b'-1:postag:NN' 412 +-0.092333 Air b'postag:CC'
413 --0.008157 Air b'+1:lemma:-lrb-' 413 +-0.092333 Air b'postag[:2]:CC'
414 --0.009984 Air b'lemma:,' 414 +-0.092993 O b'+1:lemma:%'
415 --0.009984 Air b'postag:,' 415 +-0.100219 Supp b'+1:lemma:rifampicin'
416 --0.009987 Gtype b'-1:postag:CD' 416 +-0.100582 O b'lemma:0.1'
417 --0.011620 O b'lemma:30' 417 +-0.102695 O b'-1:lemma:-lrb-'
418 --0.011986 Supp b'+1:lemma:-rrb-' 418 +-0.109000 Air b'-1:lemma:or'
419 --0.012348 Phase b'+1:postag:NN' 419 +-0.111199 Supp b'lemma[:2]:an'
420 --0.012465 Supp b'+1:postag:-RRB-' 420 +-0.112020 Air b'-1:postag:CC'
421 --0.016199 O b'+1:lemma:c' 421 +-0.113367 O b'+1:lemma:shake'
422 --0.017044 Air b'+1:postag:-RRB-' 422 +-0.119111 Anti b'+1:lemma:anti-fur'
423 --0.018057 Med b'-1:postag:IN' 423 +-0.124927 O b'+1:lemma:+'
424 --0.018532 OD b'+1:postag:CD' 424 +-0.125975 O b'-1:postag:VBN'
425 --0.018715 O b'-1:lemma:1' 425 +-0.128619 O b'-1:lemma:ompr'
426 --0.028572 O b'+1:lemma:arginine' 426 +-0.137106 Gtype b'-1:lemma:,'
427 --0.032917 Anti b'+1:postag:JJ' 427 +-0.137106 Gtype b'-1:postag:,'
428 --0.033839 Phase b'-1:postag:NN' 428 +-0.145475 Gtype b'lemma[:1]:n'
429 --0.035292 O b'-1:lemma:5' 429 +-0.150071 O b'lemma[:1]:d'
430 --0.035894 O b'lemma:co2' 430 +-0.151088 Anti b'symb'
431 --0.037511 O b'-1:lemma:30' 431 +-0.158504 Air b'+1:postag:JJ'
432 --0.050917 Air b'-1:postag:VBN' 432 +-0.162749 O b'-1:lemma:37'
433 --0.051574 Air b'postag:CD' 433 +-0.168152 O b'-1:lemma:grow'
434 --0.052755 Air b'+1:lemma:-rrb-' 434 +-0.177645 Technique b'-1:lemma::'
435 --0.053416 Air b'-1:postag:RB' 435 +-0.186245 O b'-1:lemma:IP'
436 --0.054843 Air b'-1:lemma:or' 436 +-0.188141 Temp b'+1:lemma:to'
437 --0.056713 OD b'postag:JJ' 437 +-0.188141 Temp b'+1:postag:TO'
438 --0.066384 O b'+1:lemma:5' 438 +-0.189069 O b'-1:lemma:rna'
439 --0.075993 Air b'-1:lemma:and' 439 +-0.190006 O b'+1:lemma:-rrb-'
440 --0.077374 O b'-1:lemma:~' 440 +-0.192143 O b'lemma[:2]:30'
441 --0.079056 Air b'-1:lemma:-lrb-' 441 +-0.219680 O b'lemma:co2'
442 --0.080674 Supp b'postag:CC' 442 +-0.231361 Agit b'symb'
443 --0.081179 O b'-1:lemma:,' 443 +-0.256617 O b'lemma:of'
444 --0.081179 O b'-1:postag:,' 444 +-0.256617 O b'lemma[:2]:of'
445 --0.091063 Air b'-1:postag:-LRB-' 445 +-0.259140 O b'lemma:37'
446 --0.104880 O b'-1:lemma:-lrb-' 446 +-0.259140 O b'lemma[:2]:37'
447 --0.116778 Gversion b'+1:postag:NN' 447 +-0.267489 O b'lemma[:2]:od'
448 --0.117338 Med b'+1:postag:IN' 448 +-0.270561 Med b'+1:postag:NN'
449 --0.156891 O b'-1:postag:VBN' 449 +-0.273391 O b'+1:lemma:fecl2'
450 --0.158460 O b'+1:lemma:300' 450 +-0.274839 O b'+1:postag:IN'
451 --0.159376 Phase b'-1:lemma:at' 451 +-0.277041 Technique b'postag:NN'
452 --0.163043 O b'+1:postag:NNS' 452 +-0.281854 O b'+1:lemma:\xc2\xb0c'
453 --0.185937 O b'-1:lemma:cra' 453 +-0.292441 O b'lemma:20'
454 --0.198845 pH b'postag:NN' 454 +-0.295792 Med b'-1:postag:CD'
455 --0.202021 Med b'-1:postag:NN' 455 +-0.308709 Supp b'postag[:1]:C'
456 --0.206164 O b'-1:postag:IN' 456 +-0.308783 O b'lemma[:1]:p'
457 --0.210478 O b'-1:lemma:from' 457 +-0.311181 O b'lemma:wt'
458 --0.224002 O b'+1:lemma:hour' 458 +-0.311181 O b'lemma[:2]:wt'
459 --0.228689 O b'+1:lemma:-rrb-' 459 +-0.318567 Med b'+1:postag:IN'
460 --0.230127 Temp b'postag:JJ' 460 +-0.318793 O b'lemma:2h'
461 --0.232439 O b'+1:lemma:.' 461 +-0.318793 O b'-1:lemma:additional'
462 --0.232439 O b'+1:postag:.' 462 +-0.318793 O b'lemma[:2]:2h'
463 --0.261795 O b'lemma:0.3' 463 +-0.330370 O b'+1:postag:-RRB-'
464 --0.276668 O b'+1:lemma:%' 464 +-0.332499 Air b'postag[:1]:N'
465 --0.283202 O b'+1:postag:IN' 465 +-0.332499 Air b'postag[:2]:NN'
466 --0.291477 O b'lemma:dissolve' 466 +-0.334391 Med b'-1:postag:NN'
467 --0.294314 O b'-1:lemma:of' 467 +-0.338586 Temp b'hGreek'
468 --0.332798 O b'-1:postag:-LRB-' 468 +-0.351814 O b'lemma[:2]:me'
469 --0.348211 Temp b'postag:NN' 469 +-0.363828 O b'lemma[:1]:L'
470 --0.361228 O b'lemma:od600' 470 +-0.365790 Gtype b'lemma:delta'
471 --0.373795 O b'lemma:phase' 471 +-0.396021 O b'+1:lemma:.'
472 --0.395276 Med b'+1:postag:NN' 472 +-0.396021 O b'+1:postag:.'
473 --0.405822 O b'+1:lemma:+' 473 +-0.405253 OD b'+1:postag:NN'
474 --0.406990 Supp b'-1:lemma:%' 474 +-0.409588 O b'lemma[:2]:ri'
475 --0.409533 Temp b'+1:lemma:to' 475 +-0.436123 O b'lemma[:2]:0.'
476 --0.409533 Temp b'+1:postag:TO' 476 +-0.437523 O b'-1:postag:IN'
477 --0.419386 O b'lemma:anaerobically' 477 +-0.461538 O b'-1:postag:-LRB-'
478 --0.421572 O b'+1:postag:-RRB-' 478 +-0.480537 O b'-1:lemma:cra'
479 --0.460490 Air b'-1:postag:JJ' 479 +-0.524678 Technique b'-1:postag::'
480 --0.467245 Technique b'-1:postag::' 480 +-0.534816 Supp b'postag:JJ'
481 --0.476757 Supp b'+1:lemma:rifampicin' 481 +-0.541445 O b'-1:lemma:sample'
482 --0.502746 O b'lemma:media' 482 +-0.544159 Med b'symb'
483 --0.503360 O b'-1:lemma:od600' 483 +-0.553976 Anti b'postag:NNP'
484 --0.524986 OD b'+1:postag:NN' 484 +-0.557482 O b'+1:lemma:hour'
485 --0.543280 O b'-1:lemma:rpob' 485 +-0.572719 Gtype b'lemma[:2]:rp'
486 --0.557386 O b'-1:lemma:grow' 486 +-0.577168 Air b'postag:NN'
487 --0.570906 O b'lemma:fecl2' 487 +-0.603309 Supp b'postag[:1]:J'
488 --0.574577 O b'+1:lemma:fecl2' 488 +-0.603309 Supp b'postag[:2]:JJ'
489 --0.632496 O b'+1:lemma:cell' 489 +-0.608253 Air b'-1:postag:JJ'
490 --0.640758 O b'+1:lemma:0.3' 490 +-0.609440 O b'lemma[:1]:A'
491 --0.696627 O b'-1:lemma:IP' 491 +-0.611762 Agit b'hUpper'
492 --0.710065 O b'-1:postag::' 492 +-0.611762 Agit b'hLower'
493 --0.734704 O b'+1:postag:VBG' 493 +-0.616867 Supp b'lemma[:1]:c'
494 --0.735189 OD b'lemma:-lrb-' 494 +-0.662379 O b'-1:lemma:the'
495 --0.753554 O b'lemma:0.1' 495 +-0.665646 O b'+1:postag:VBG'
496 --0.763727 O b'lemma:0.2' 496 +-0.667220 O b'+1:postag:NNS'
497 --0.785113 O b'-1:lemma:37' 497 +-0.672166 O b'lemma:methanol'
498 --0.803671 O b'-1:lemma:dissolve' 498 +-0.688760 O b'+1:lemma:cell'
499 --0.803671 O b'+1:lemma:methanol' 499 +-0.696400 Gtype b'lemma[:1]:m'
500 --0.833476 Supp b'+1:lemma:acetate' 500 +-0.709438 O b'-1:lemma:rpob'
501 --0.838362 O b'-1:lemma:ompr' 501 +-0.746988 O b'+1:lemma:supplement'
502 --0.851164 O b'lemma:37' 502 +-0.748227 O b'-1:lemma:nsrr'
503 --0.866382 O b'lemma:2h' 503 +-0.750862 Gtype b'lemma[:1]:c'
504 --0.866382 O b'-1:lemma:additional' 504 +-0.762647 O b'lemma:mid-log'
505 --0.882690 O b'-1:postag:VBG' 505 +-0.764019 O b'+1:lemma:g/l'
506 --0.885831 O b'+1:lemma:g/l' 506 +-0.820923 O b'-1:lemma:dissolve'
507 --0.888919 Phase b'postag:JJ' 507 +-0.820923 O b'+1:lemma:methanol'
508 --0.905015 O b'lemma:of' 508 +-0.849761 Phase b'hUpper'
509 --0.906507 Anti b'postag:NNP' 509 +-0.849761 Phase b'hLower'
510 --1.026494 O b'lemma:mid-log' 510 +-0.878961 O b'lemma:rifampicin'
511 --1.028079 O b'lemma:wt' 511 +-0.991808 O b'-1:lemma:co2'
512 --1.060908 O b'+1:lemma:supplement' 512 +-1.038541 O b'lemma[:1]:0'
513 --1.075926 O b'-1:lemma:co2' 513 +-1.156169 O b'+1:lemma:at'
514 --1.341090 O b'-1:lemma:nsrr' 514 +-1.157980 Gtype b'lemma[:1]:a'
515 --1.359406 O b'+1:lemma:at' 515 +-1.204180 Supp b'symb'
516 --1.375702 Air b'+1:postag:JJ' 516 +-1.233540 O b'lemma[:1]:\xce\xb4'
517 --1.442763 O b'lemma:rifampicin' 517 +-1.266754 Supp b'hGreek'
518 --1.637602 O b'lemma:methanol' 518 +-1.301358 O b'-1:postag:VBG'
519 --1.645866 Air b'postag:NN' 519 +-1.514277 O b'-1:postag::'
520 --1.720675 Supp b'postag:JJ' 520 +-1.655597 OD b'postag[:1]:-'
521 --1.885525 OD b'postag:-LRB-' 521 +-1.753063 O b'+1:lemma:in'
522 --1.959132 O b'+1:lemma:in' 522 +-1.852806 OD b'lemma[:1]:-'
523 --2.128110 O b'+1:lemma:2' 523 +-1.885226 O b'-1:lemma:2'
524 --2.307682 O b'-1:lemma:2' 524 +-1.959854 O b'+1:lemma:2'
525 --2.374565 O b'+1:lemma:1' 525 +-2.144976 O b'+1:lemma:1'
526 --4.058703 O b'-1:lemma:_' 526 +-3.787456 O b'-1:lemma::'
527 --4.145888 O b'-1:lemma::' 527 +-4.714231 O b'-1:lemma:_'
528 528
......
1 +********** TRAINING AND TESTING REPORT **********
2 +Training file: training-data-set-70_v4.txt
3 +
4 +best params:{'c1': 0.279361962019874, 'c2': 0.0038200106679588276}
5 +best CV score:0.8186573824050531
6 +model size: 0.07M
7 +
8 +Flat F1: 0.8128691445699846
9 + precision recall f1-score support
10 +
11 + OD 0.789 0.405 0.536 37
12 + pH 1.000 1.000 1.000 12
13 + Technique 1.000 0.909 0.952 22
14 + Med 0.897 0.912 0.904 57
15 + Temp 0.818 1.000 0.900 18
16 + Vess 0.000 0.000 0.000 0
17 + Agit 0.000 0.000 0.000 0
18 + Phase 1.000 0.947 0.973 19
19 + Air 0.780 0.742 0.760 62
20 + Anti 1.000 0.889 0.941 9
21 + Strain 1.000 1.000 1.000 1
22 + Gtype 0.918 0.849 0.882 106
23 + Substrain 0.000 0.000 0.000 1
24 + Supp 0.835 0.669 0.743 136
25 + Gversion 0.000 0.000 0.000 0
26 +
27 +avg / total 0.869 0.773 0.813 480
28 +
29 +
30 +Top likely transitions:
31 +Agit -> Agit 7.239488
32 +OD -> OD 6.986110
33 +Temp -> Temp 6.018161
34 +Anti -> Anti 5.460406
35 +Med -> Med 5.405632
36 +Supp -> Supp 4.891085
37 +Air -> Air 4.827197
38 +Phase -> Phase 4.808148
39 +Gversion -> Gversion 4.563407
40 +Gtype -> Gtype 4.416717
41 +O -> O 3.914205
42 +Technique -> Technique 3.585291
43 +pH -> pH 2.066900
44 +O -> Supp 2.030835
45 +Gtype -> Supp 1.504335
46 +Air -> O 1.080882
47 +O -> Technique 0.833471
48 +O -> Gtype 0.713793
49 +O -> Anti 0.531693
50 +OD -> Phase 0.408195
51 +Substrain -> Gtype 0.381038
52 +O -> Gversion 0.245512
53 +O -> Temp 0.216347
54 +Med -> O 0.140439
55 +Supp -> O 0.136031
56 +Phase -> O 0.111016
57 +O -> Phase 0.102578
58 +O -> Med 0.027873
59 +Technique -> Air 0.004864
60 +Temp -> O 0.002877
61 +Phase -> Air 0.002070
62 +O -> OD -0.000053
63 +Air -> Temp -0.001109
64 +Technique -> pH -0.003137
65 +Anti -> O -0.004004
66 +OD -> Air -0.082107
67 +Supp -> Med -0.222493
68 +Gtype -> Anti -0.266509
69 +Phase -> OD -0.268963
70 +OD -> O -0.365524
71 +Gtype -> O -0.470283
72 +Supp -> Gtype -0.575625
73 +Agit -> O -0.740344
74 +O -> Air -0.754198
75 +Med -> Supp -0.916394
76 +Technique -> O -0.944892
77 +Substrain -> O -1.056452
78 +
79 +
80 +Top unlikely transitions:
81 +Agit -> Agit 7.239488
82 +OD -> OD 6.986110
83 +Temp -> Temp 6.018161
84 +Anti -> Anti 5.460406
85 +Med -> Med 5.405632
86 +Supp -> Supp 4.891085
87 +Air -> Air 4.827197
88 +Phase -> Phase 4.808148
89 +Gversion -> Gversion 4.563407
90 +Gtype -> Gtype 4.416717
91 +O -> O 3.914205
92 +Technique -> Technique 3.585291
93 +pH -> pH 2.066900
94 +O -> Supp 2.030835
95 +Gtype -> Supp 1.504335
96 +Air -> O 1.080882
97 +O -> Technique 0.833471
98 +O -> Gtype 0.713793
99 +O -> Anti 0.531693
100 +OD -> Phase 0.408195
101 +Substrain -> Gtype 0.381038
102 +O -> Gversion 0.245512
103 +O -> Temp 0.216347
104 +Med -> O 0.140439
105 +Supp -> O 0.136031
106 +Phase -> O 0.111016
107 +O -> Phase 0.102578
108 +O -> Med 0.027873
109 +Technique -> Air 0.004864
110 +Temp -> O 0.002877
111 +Phase -> Air 0.002070
112 +O -> OD -0.000053
113 +Air -> Temp -0.001109
114 +Technique -> pH -0.003137
115 +Anti -> O -0.004004
116 +OD -> Air -0.082107
117 +Supp -> Med -0.222493
118 +Gtype -> Anti -0.266509
119 +Phase -> OD -0.268963
120 +OD -> O -0.365524
121 +Gtype -> O -0.470283
122 +Supp -> Gtype -0.575625
123 +Agit -> O -0.740344
124 +O -> Air -0.754198
125 +Med -> Supp -0.916394
126 +Technique -> O -0.944892
127 +Substrain -> O -1.056452
128 +
129 +
130 +Top positive:
131 +8.966672 Technique b'lemma[:2]:Ch'
132 +6.588612 Phase b'lemma:stationary'
133 +5.718268 Air b'lemma:anaerobic'
134 +5.159572 O b'lemma[:2]:re'
135 +4.823035 O b'-1:lemma:tag'
136 +4.717845 Air b'lemma:aerobic'
137 +4.658070 Phase b'lemma:mid-log'
138 +4.421877 OD b'lemma[:2]:od'
139 +4.420602 Gtype b'lemma:arca8myc'
140 +4.062533 O b'lemma:1'
141 +4.062533 O b'lemma[:2]:1'
142 +3.912148 Gtype b'-1:lemma:\xe2\x88\x86'
143 +3.888418 Air b'-1:lemma:ChIP-Seq'
144 +3.848911 O b'lemma:rpob'
145 +3.769611 O b'lemma[:2]:ge'
146 +3.714984 Strain b'+1:lemma:substr'
147 +3.670004 Gtype b'lemma[:2]:fl'
148 +3.560689 O b'lemma:with'
149 +3.436525 O b'-1:lemma:ChIP-exo'
150 +3.429177 Supp b'lemma:arginine'
151 +3.425608 Technique b'lemma[:2]:rn'
152 +3.371645 Med b'+1:lemma:0.4'
153 +3.328846 Supp b'lemma:Iron'
154 +3.328846 Supp b'lemma[:2]:Ir'
155 +3.321795 Supp b'+1:lemma:1'
156 +3.310404 Supp b'+1:lemma:\xc2\xb5m'
157 +3.308999 Temp b'-1:lemma:sample'
158 +3.277763 Technique b'lemma:chipseq'
159 +3.240649 Gversion b'-1:lemma:nc'
160 +3.124383 Gtype b'lemma[:1]:\xce\xb4'
161 +3.090861 O b'-1:lemma:Aerobic'
162 +3.008868 O b'lemma:3'
163 +3.008868 O b'lemma[:2]:3'
164 +3.007173 O b'+1:lemma:pq'
165 +3.000180 O b'+1:lemma:od600'
166 +3.000100 Gtype b'lemma[:2]:cr'
167 +2.948508 OD b'+1:lemma:stationary'
168 +2.947897 O b'-1:lemma:0.3-0.35'
169 +2.947877 O b'lemma:2'
170 +2.947877 O b'lemma[:2]:2'
171 +2.932527 Gtype b'lemma:fnr8myc'
172 +2.885967 Supp b'lemma:fructose'
173 +2.838346 Temp b'lemma[:1]:3'
174 +2.804560 Supp b'+1:lemma:2'
175 +2.762138 Med b'lemma:MOPS'
176 +2.762138 Med b'lemma[:1]:M'
177 +2.762138 Med b'lemma[:2]:MO'
178 +2.737960 O b'-1:lemma:anaerobic'
179 +2.712644 Gtype b'lemma[:2]:de'
180 +2.710120 Anti b'+1:lemma:antibody'
181 +2.704453 Supp b'lemma[:2]:0.'
182 +2.695502 O b'-1:lemma:0.3'
183 +2.674794 O b'lemma:_'
184 +2.674794 O b'lemma[:1]:_'
185 +2.674794 O b'lemma[:2]:_'
186 +2.661858 Supp b'-1:lemma:Cra'
187 +2.648028 Anti b'lemma[:2]:an'
188 +2.616030 Supp b'lemma:nitrate'
189 +2.616030 Supp b'lemma[:2]:ni'
190 +2.599686 Technique b'-1:lemma:input'
191 +2.597924 Med b'lemma[:1]:L'
192 +2.576426 Gtype b'-1:lemma:rpob'
193 +2.565057 Gtype b'lemma:type'
194 +2.565057 Gtype b'lemma[:2]:ty'
195 +2.560359 pH b'lemma:ph5'
196 +2.560359 pH b'+1:lemma:.5'
197 +2.509084 O b'lemma:delta'
198 +2.478623 Gtype b'lemma[:1]:W'
199 +2.469353 O b'+1:postag:RB'
200 +2.432106 Gtype b'lemma:nsrr'
201 +2.432106 Gtype b'lemma[:2]:ns'
202 +2.399084 Temp b'-1:lemma:\xcf\x8332'
203 +2.385698 Gversion b'lemma:nc'
204 +2.385698 Gversion b'lemma[:2]:nc'
205 +2.368284 Supp b'lemma:rifampicin'
206 +2.366613 Gtype b'lemma:flag-tag'
207 +2.366613 Gtype b'-1:lemma:c-terminal'
208 +2.365159 O b'+1:lemma:sparging'
209 +2.361737 Gversion b'lemma[:2]:00'
210 +2.353117 Substrain b'lemma:mg1655'
211 +2.347459 O b'-1:lemma:lb'
212 +2.343081 Supp b'lemma[:2]:ri'
213 +2.304781 O b'lemma:b'
214 +2.304781 O b'lemma[:2]:b'
215 +2.284446 Gversion b'lemma:chip-seq'
216 +2.229948 Supp b'lemma:pq'
217 +2.229948 Supp b'lemma[:2]:pq'
218 +2.222205 Strain b'lemma:k-12'
219 +2.222205 Strain b'lemma[:2]:k-'
220 +2.167335 Supp b'lemma[:1]:I'
221 +2.161918 Gtype b'+1:lemma:flagtag'
222 +2.159386 Gversion b'lemma:asm584v2'
223 +2.144731 Gversion b'lemma[:2]:as'
224 +2.113656 Supp b'+1:lemma:_'
225 +2.112060 Supp b'lemma:acetate'
226 +2.090761 O b'lemma[:2]:fo'
227 +2.078514 O b'-1:lemma:glucose'
228 +2.068162 Air b'lemma[:2]:an'
229 +2.062479 Air b'lemma[:2]:ae'
230 +2.059001 Strain b'lemma[:1]:k'
231 +2.056638 Technique b'+1:lemma:chip-exo'
232 +2.052703 O b'-1:lemma:type'
233 +2.051285 O b'lemma:\xcf\x8332'
234 +2.051285 O b'lemma[:1]:\xcf\x83'
235 +2.051285 O b'lemma[:2]:\xcf\x833'
236 +2.050334 Vess b'lemma:flask'
237 +2.050334 Vess b'-1:lemma:warm'
238 +2.032344 Substrain b'lemma[:2]:mg'
239 +2.030892 Vess b'lemma[:2]:fl'
240 +2.027838 Air b'-1:lemma:-'
241 +2.024791 Air b'lemma[:1]:A'
242 +2.015955 Technique b'lemma[:2]:ch'
243 +2.002652 O b'lemma:a'
244 +2.002652 O b'lemma[:2]:a'
245 +1.996430 Substrain b'+1:lemma:phtpg'
246 +1.981067 Supp b'lemma[:1]:1'
247 +1.954710 pH b'+1:postag:CD'
248 +1.953189 Gtype b'lemma[:2]:ar'
249 +1.939301 Gtype b'hGreek'
250 +1.934603 Gtype b'-1:lemma:_'
251 +1.932040 Med b'+1:lemma:2.0'
252 +1.930878 O b'lemma:0.4'
253 +1.909748 Supp b'-1:lemma:+'
254 +1.867334 O b'+1:postag:NNP'
255 +1.854658 Supp b'+1:lemma:hour'
256 +1.852643 Supp b'lemma[:2]:gl'
257 +1.850156 Supp b'-1:lemma:with'
258 +1.841046 O b'postag:IN'
259 +1.841046 O b'postag[:1]:I'
260 +1.841046 O b'postag[:2]:IN'
261 +1.840736 Air b'lemma:Aerobic'
262 +1.840736 Air b'lemma[:2]:Ae'
263 +1.839093 O b'lemma[:1]:C'
264 +1.831912 Gtype b'+1:lemma::'
265 +1.810536 Med b'lemma:lb'
266 +1.810536 Med b'lemma[:2]:lb'
267 +1.802382 Gtype b'-1:lemma:vector'
268 +1.794761 Supp b'lemma[:1]:\xc2\xb5'
269 +1.793907 O b'lemma:Custom'
270 +1.793907 O b'lemma[:2]:Cu'
271 +1.710377 Anti b'lemma:none'
272 +1.695245 Air b'lemma[:1]:a'
273 +1.679966 Gtype b'+1:lemma:with'
274 +1.678353 O b'postag::'
275 +1.678353 O b'postag[:1]::'
276 +1.678353 O b'postag[:2]::'
277 +1.672503 O b'-1:lemma:l1'
278 +1.660511 O b'+1:lemma:nacl'
279 +1.634575 Gtype b'+1:lemma:type'
280 +1.633916 Air b'-1:lemma:co2'
281 +1.633212 Temp b'lemma:43'
282 +1.633212 Temp b'lemma[:2]:43'
283 +1.630422 Technique b'+1:lemma:rna-seq'
284 +1.627467 Supp b'lemma[:1]:2'
285 +1.617176 Med b'+1:lemma:g/l'
286 +1.591078 Temp b'-1:lemma:43'
287 +1.584703 Phase b'lemma:exponentially'
288 +1.580088 Gtype b'lemma[:1]:w'
289 +1.569142 Technique b'symb'
290 +1.544136 Med b'+1:lemma:minimal'
291 +1.543828 Gversion b'lemma:.2'
292 +1.543828 Gversion b'-1:lemma:u00096'
293 +1.543828 Gversion b'lemma[:2]:.2'
294 +1.539233 Technique b'-1:lemma:1'
295 +1.535225 Gtype b'-1:lemma:Combined'
296 +1.530825 O b'lemma[:1]:-'
297 +1.529855 Gtype b'lemma:wt'
298 +1.529855 Gtype b'lemma[:2]:wt'
299 +1.526054 Med b'lemma:broth'
300 +1.526054 Med b'-1:lemma:L'
301 +1.526054 Med b'lemma[:2]:br'
302 +1.523299 O b'lemma:chip'
303 +1.508452 Supp b'lemma:Fe'
304 +1.508452 Supp b'lemma[:2]:Fe'
305 +1.503882 O b'+1:lemma:mid-log'
306 +1.496251 Anti b'-1:lemma::'
307 +1.486906 Supp b'lemma[:2]:fe'
308 +1.470644 Anti b'lemma:anti-rpos'
309 +1.462451 Supp b'lemma:dpd'
310 +1.462451 Supp b'lemma[:2]:dp'
311 +1.460661 Med b'+1:lemma:-lrb-'
312 +1.458027 O b'lemma[:2]:in'
313 +1.451098 pH b'lemma:.5'
314 +1.451098 pH b'-1:lemma:ph5'
315 +1.451098 pH b'lemma[:2]:.5'
316 +1.446735 Med b'+1:postag:-LRB-'
317 +1.442566 O b'+1:lemma:ph5'
318 +1.438411 Supp b'lemma:no3'
319 +1.436805 Supp b'lemma:iptg'
320 +1.433263 O b'lemma:.'
321 +1.433263 O b'postag:.'
322 +1.433263 O b'postag[:1]:.'
323 +1.433263 O b'postag[:2]:.'
324 +1.433263 O b'lemma[:2]:.'
325 +1.423900 O b'-1:lemma:\xc2\xb0c'
326 +1.418739 Supp b'lemma:0.1'
327 +1.401196 O b'lemma:purr'
328 +1.384007 Med b'+1:lemma:contain'
329 +1.375436 Supp b'lemma:nh4cl'
330 +1.375436 Supp b'lemma[:2]:nh'
331 +
332 +
333 +Top negative:
334 +-0.001541 O b'+1:lemma:mm'
335 +-0.001854 Gtype b'postag[:1]:V'
336 +-0.001854 Gtype b'postag[:2]:VB'
337 +-0.001951 Med b'-1:postag:IN'
338 +-0.002248 Air b'lemma:-rrb-'
339 +-0.002552 O b'+1:lemma:phase'
340 +-0.002974 O b'lemma[:2]:an'
341 +-0.003066 OD b'postag[:1]:N'
342 +-0.003066 OD b'postag[:2]:NN'
343 +-0.003120 O b'lemma[:2]:de'
344 +-0.004645 Supp b'lemma:2'
345 +-0.004645 Supp b'lemma[:2]:2'
346 +-0.004667 Med b'+1:postag:NNS'
347 +-0.005354 O b'-1:lemma:from'
348 +-0.006386 Temp b'postag:NN'
349 +-0.006593 Air b'-1:postag:-LRB-'
350 +-0.007131 Supp b'postag:NNS'
351 +-0.007895 O b'-1:lemma:mid-log'
352 +-0.011115 O b'+1:lemma:delta'
353 +-0.011562 Agit b'-1:postag:NN'
354 +-0.011701 Air b'-1:lemma:-lrb-'
355 +-0.012537 Technique b'postag[:1]:N'
356 +-0.012537 Technique b'postag[:2]:NN'
357 +-0.013175 OD b'+1:postag:CC'
358 +-0.013422 O b'-1:lemma:o2'
359 +-0.014314 Air b'-1:lemma:aerobically'
360 +-0.014690 OD b'+1:lemma:of'
361 +-0.019165 Air b'lemma:and'
362 +-0.019727 Air b'-1:lemma:and'
363 +-0.020299 Gtype b'lemma[:1]:g'
364 +-0.020563 O b'-1:lemma:mm'
365 +-0.020740 O b'+1:lemma:shake'
366 +-0.024009 Supp b'-1:lemma:for'
367 +-0.028824 Phase b'-1:postag:NN'
368 +-0.029809 Supp b'lemma[:1]:t'
369 +-0.031578 Gtype b'lemma[:1]:,'
370 +-0.032015 Gtype b'lemma:,'
371 +-0.032015 Gtype b'postag:,'
372 +-0.032015 Gtype b'postag[:1]:,'
373 +-0.032015 Gtype b'postag[:2]:,'
374 +-0.032015 Gtype b'lemma[:2]:,'
375 +-0.032915 Gversion b'+1:postag:NN'
376 +-0.035323 Air b'lemma[:1]:o'
377 +-0.039237 O b'-1:postag:JJ'
378 +-0.040153 Supp b'+1:postag:IN'
379 +-0.043438 Supp b'hUpper'
380 +-0.043438 Supp b'hLower'
381 +-0.046431 O b'lemma[:1]:d'
382 +-0.048385 O b'+1:lemma:co2'
383 +-0.051633 Supp b'+1:lemma:rifampicin'
384 +-0.053267 O b'+1:lemma:c'
385 +-0.060706 O b'+1:lemma:until'
386 +-0.062235 pH b'postag[:1]:N'
387 +-0.062235 pH b'postag[:2]:NN'
388 +-0.063097 O b'lemma[:2]:30'
389 +-0.065359 Air b'-1:postag:RB'
390 +-0.065508 O b'lemma:phase'
391 +-0.071547 Agit b'postag[:1]:N'
392 +-0.071547 Agit b'postag[:2]:NN'
393 +-0.071659 O b'+1:lemma:or'
394 +-0.072012 O b'+1:lemma:%'
395 +-0.072345 Gtype b'-1:postag:NN'
396 +-0.075128 Gtype b'-1:lemma:,'
397 +-0.075128 Gtype b'-1:postag:,'
398 +-0.076044 Supp b'-1:postag:NNP'
399 +-0.076147 O b'-1:lemma:of'
400 +-0.082454 O b'-1:lemma:IP'
401 +-0.085284 Supp b'lemma[:1]:o'
402 +-0.086193 O b'lemma[:2]:ce'
403 +-0.091551 O b'lemma[:2]:fe'
404 +-0.091759 O b'+1:lemma:+'
405 +-0.095917 O b'lemma:co2'
406 +-0.101416 O b'lemma:anaerobically'
407 +-0.101520 Temp b'hGreek'
408 +-0.111323 O b'lemma:37'
409 +-0.111323 O b'lemma[:2]:37'
410 +-0.114466 O b'-1:lemma:od600'
411 +-0.114596 OD b'postag:CD'
412 +-0.114596 OD b'postag[:2]:CD'
413 +-0.117991 Air b'+1:postag:-LRB-'
414 +-0.119139 O b'lemma[:2]:mg'
415 +-0.122079 Air b'+1:lemma:-lrb-'
416 +-0.123263 O b'-1:lemma:rna'
417 +-0.128253 O b'-1:postag:VBN'
418 +-0.135604 O b'+1:lemma:\xc2\xb0c'
419 +-0.137855 Air b'symb'
420 +-0.144842 Supp b'postag:CD'
421 +-0.144842 Supp b'postag[:2]:CD'
422 +-0.147096 Gtype b'+1:lemma:-rrb-'
423 +-0.154114 Med b'postag:NN'
424 +-0.155465 Phase b'postag:JJ'
425 +-0.156939 Med b'+1:postag:IN'
426 +-0.159442 O b'-1:lemma:rpob'
427 +-0.159504 Air b'postag:CC'
428 +-0.159504 Air b'postag[:2]:CC'
429 +-0.165569 O b'lemma:anaerobic'
430 +-0.169530 Air b'+1:postag:JJ'
431 +-0.175033 Anti b'symb'
432 +-0.207569 Technique b'-1:lemma::'
433 +-0.211170 O b'-1:lemma:the'
434 +-0.212648 Med b'postag[:1]:C'
435 +-0.215967 O b'-1:lemma:grow'
436 +-0.217662 Med b'+1:postag:NN'
437 +-0.222008 Technique b'postag:NN'
438 +-0.224207 O b'+1:lemma:-rrb-'
439 +-0.227966 O b'lemma[:2]:od'
440 +-0.234046 O b'-1:lemma:-lrb-'
441 +-0.242892 Anti b'+1:lemma:anti-fur'
442 +-0.243109 O b'lemma[:2]:me'
443 +-0.257081 O b'lemma:of'
444 +-0.257081 O b'lemma[:2]:of'
445 +-0.276390 Phase b'-1:postag:JJ'
446 +-0.293682 O b'lemma:wt'
447 +-0.293682 O b'lemma[:2]:wt'
448 +-0.295413 O b'+1:postag:IN'
449 +-0.297541 OD b'+1:postag:CD'
450 +-0.307394 O b'lemma[:2]:ae'
451 +-0.307787 O b'-1:lemma:ml'
452 +-0.308022 O b'lemma[:1]:p'
453 +-0.312845 O b'-1:lemma:37'
454 +-0.316240 Temp b'+1:lemma:to'
455 +-0.316240 Temp b'+1:postag:TO'
456 +-0.318530 Phase b'-1:lemma:at'
457 +-0.325023 Agit b'symb'
458 +-0.330260 O b'lemma:2h'
459 +-0.330260 O b'-1:lemma:additional'
460 +-0.330260 O b'lemma[:2]:2h'
461 +-0.331312 Air b'postag[:1]:N'
462 +-0.331312 Air b'postag[:2]:NN'
463 +-0.335232 O b'postag:VBP'
464 +-0.345145 Phase b'postag[:1]:J'
465 +-0.345145 Phase b'postag[:2]:JJ'
466 +-0.346773 O b'lemma[:2]:0.'
467 +-0.347618 Air b'-1:postag:CC'
468 +-0.356296 O b'-1:postag:-LRB-'
469 +-0.358625 O b'+1:lemma:fecl2'
470 +-0.364284 O b'+1:postag:-RRB-'
471 +-0.380241 Med b'-1:postag:CD'
472 +-0.399176 O b'+1:postag:VBG'
473 +-0.399486 O b'lemma[:2]:gl'
474 +-0.403156 O b'lemma:20'
475 +-0.442379 O b'+1:lemma:cell'
476 +-0.447923 Technique b'-1:postag::'
477 +-0.457780 Med b'-1:postag:NN'
478 +-0.460270 Supp b'+1:postag:VBN'
479 +-0.472546 O b'lemma[:1]:L'
480 +-0.491295 O b'-1:postag:IN'
481 +-0.492050 O b'lemma[:2]:ri'
482 +-0.496617 Supp b'postag[:1]:C'
483 +-0.506785 O b'-1:lemma:ompr'
484 +-0.527743 Supp b'postag:JJ'
485 +-0.527772 Agit b'hUpper'
486 +-0.527772 Agit b'hLower'
487 +-0.536034 Air b'postag:NN'
488 +-0.546321 Supp b'postag[:1]:J'
489 +-0.546321 Supp b'postag[:2]:JJ'
490 +-0.559301 Air b'-1:lemma:or'
491 +-0.562023 Gtype b'lemma:delta'
492 +-0.583547 O b'+1:lemma:.'
493 +-0.583547 O b'+1:postag:.'
494 +-0.587969 O b'lemma:mid-log'
495 +-0.616736 O b'-1:lemma:cra'
496 +-0.626025 Supp b'lemma[:1]:c'
497 +-0.634232 Med b'symb'
498 +-0.636392 Supp b'lemma[:2]:an'
499 +-0.643020 O b'-1:lemma:nsrr'
500 +-0.651532 O b'+1:postag:NNS'
501 +-0.679804 Gtype b'lemma[:1]:m'
502 +-0.686303 O b'lemma[:1]:0'
503 +-0.688904 O b'+1:lemma:supplement'
504 +-0.736464 Supp b'-1:lemma:%'
505 +-0.766132 O b'+1:lemma:hour'
506 +-0.767111 O b'lemma:rifampicin'
507 +-0.796135 O b'+1:lemma:g/l'
508 +-0.812830 O b'-1:lemma:co2'
509 +-0.838937 Gtype b'lemma[:1]:c'
510 +-0.841550 O b'-1:lemma:dissolve'
511 +-0.841550 O b'+1:lemma:methanol'
512 +-0.856382 O b'lemma:methanol'
513 +-0.892060 Phase b'hUpper'
514 +-0.892060 Phase b'hLower'
515 +-0.975475 O b'+1:lemma:at'
516 +-0.989308 O b'lemma[:1]:A'
517 +-1.004723 Anti b'postag:NNP'
518 +-1.018629 OD b'+1:postag:NN'
519 +-1.026001 Air b'-1:postag:JJ'
520 +-1.155732 O b'-1:postag:VBG'
521 +-1.224739 Gtype b'lemma[:1]:a'
522 +-1.278104 O b'-1:postag::'
523 +-1.599751 Supp b'hGreek'
524 +-1.606260 Supp b'symb'
525 +-1.617602 O b'lemma[:1]:\xce\xb4'
526 +-1.739815 OD b'postag[:1]:-'
527 +-1.843942 O b'+1:lemma:in'
528 +-1.945645 O b'+1:lemma:2'
529 +-1.964299 OD b'lemma[:1]:-'
530 +-2.043167 O b'-1:lemma:2'
531 +-2.316510 O b'+1:lemma:1'
532 +-4.221572 O b'-1:lemma::'
533 +-4.721306 O b'-1:lemma:_'
534 +
1 ********** TRAINING AND TESTING REPORT ********** 1 ********** TRAINING AND TESTING REPORT **********
2 Training file: training-data-set-70_v4.txt 2 Training file: training-data-set-70_v4.txt
3 3
4 -best params:{'c1': 0.03056779653153922, 'c2': 0.04972818685122124} 4 +best params:{'c1': 0.27193776724339846, 'c2': 0.057295268767110843}
5 -best CV score:0.7979170694802522 5 +best CV score:0.8163630580002407
6 -model size: 0.10M 6 +model size: 0.08M
7 7
8 -Flat F1: 0.7933473757323906 8 +Flat F1: 0.8109731224696033
9 precision recall f1-score support 9 precision recall f1-score support
10 10
11 - OD 1.000 0.405 0.577 37 11 + OD 0.789 0.405 0.536 37
12 pH 1.000 1.000 1.000 12 12 pH 1.000 1.000 1.000 12
13 - Technique 0.952 0.909 0.930 22 13 + Technique 1.000 0.909 0.952 22
14 - Med 0.891 0.860 0.875 57 14 + Med 0.897 0.912 0.904 57
15 Temp 0.818 1.000 0.900 18 15 Temp 0.818 1.000 0.900 18
16 Vess 0.000 0.000 0.000 0 16 Vess 0.000 0.000 0.000 0
17 Agit 0.000 0.000 0.000 0 17 Agit 0.000 0.000 0.000 0
18 - Phase 1.000 0.947 0.973 19 18 + Phase 1.000 0.895 0.944 19
19 - Air 0.754 0.742 0.748 62 19 + Air 0.807 0.742 0.773 62
20 - Anti 1.000 0.667 0.800 9 20 + Anti 0.800 0.889 0.842 9
21 Strain 1.000 1.000 1.000 1 21 Strain 1.000 1.000 1.000 1
22 - Gtype 0.862 0.764 0.810 106 22 + Gtype 0.896 0.811 0.851 106
23 Substrain 0.000 0.000 0.000 1 23 Substrain 0.000 0.000 0.000 1
24 - Supp 0.865 0.662 0.750 136 24 + Supp 0.835 0.706 0.765 136
25 Gversion 0.000 0.000 0.000 0 25 Gversion 0.000 0.000 0.000 0
26 26
27 -avg / total 0.876 0.742 0.793 480 27 +avg / total 0.864 0.773 0.811 480
28 28
29 29
30 Top likely transitions: 30 Top likely transitions:
31 -OD -> OD 5.500349 31 +OD -> OD 6.289427
32 -Temp -> Temp 4.915043 32 +Agit -> Agit 6.267353
33 -Agit -> Agit 4.909226 33 +Temp -> Temp 5.783774
34 -Air -> Air 4.785921 34 +Air -> Air 5.351944
35 -Med -> Med 4.785670 35 +Med -> Med 5.160137
36 -Anti -> Anti 4.760878 36 +Anti -> Anti 4.729843
37 -O -> O 4.531217 37 +Gversion -> Gversion 4.256435
38 -Gversion -> Gversion 4.225381 38 +Gtype -> Gtype 4.229740
39 -Phase -> Phase 3.928282 39 +Supp -> Supp 4.114596
40 -Gtype -> Gtype 3.900260 40 +Phase -> Phase 4.079539
41 -Supp -> Supp 3.589674 41 +Technique -> Technique 3.363448
42 -Technique -> Technique 2.798353 42 +O -> O 3.125273
43 -pH -> pH 2.196128 43 +pH -> pH 2.487113
44 -O -> Supp 1.783329 44 +O -> Supp 1.331978
45 -Substrain -> Gtype 1.742663 45 +Air -> O 1.197935
46 -Gtype -> Supp 1.431329 46 +Substrain -> Gtype 0.867656
47 -Air -> O 1.367539 47 +O -> Technique 0.848943
48 -O -> Gtype 1.348906 48 +Gtype -> Supp 0.842999
49 -O -> Technique 1.109884 49 +O -> Gtype 0.806504
50 -Technique -> Air 1.076025 50 +Med -> O 0.277505
51 -O -> Temp 0.929238 51 +OD -> Phase 0.274387
52 -Gtype -> pH 0.717732 52 +Technique -> Air 0.254899
53 -O -> Anti 0.700988 53 +Gtype -> Air 0.194030
54 -Med -> O 0.588191 54 +O -> Anti 0.155845
55 -Gtype -> Air 0.487796 55 +Temp -> O 0.076714
56 -O -> Strain 0.399055 56 +O -> Temp 0.055684
57 -O -> Gversion 0.366108 57 +O -> Gversion 0.011422
58 -O -> pH 0.354024 58 +Phase -> Technique -0.000422
59 -O -> Vess 0.200749 59 +O -> Med -0.114582
60 -Phase -> O 0.164004 60 +Supp -> Technique -0.122463
61 -OD -> Phase 0.128366 61 +Phase -> OD -0.142889
62 -O -> Med 0.084648 62 +Supp -> O -0.146822
63 -Supp -> O 0.064532 63 +O -> Phase -0.168062
64 -O -> Phase 0.054268 64 +O -> OD -0.179767
65 -Temp -> O 0.034554 65 +OD -> Gtype -0.206495
66 -O -> OD 0.002316 66 +Supp -> Gtype -0.284656
67 -pH -> Gversion -0.000024 67 +Gtype -> Med -0.297248
68 -O -> Substrain -0.000046 68 +Gtype -> OD -0.310283
69 -Agit -> OD -0.000091 69 +Technique -> OD -0.344965
70 -Technique -> Phase -0.002460 70 +OD -> Air -0.364197
71 -Phase -> Air -0.004039 71 +Anti -> O -0.368065
72 -Med -> OD -0.010012 72 +Technique -> pH -0.470302
73 -Gversion -> pH -0.019017 73 +Gversion -> O -0.499305
74 -Air -> Anti -0.028855 74 +Supp -> Med -0.541780
75 -Gtype -> Strain -0.034925 75 +Gtype -> Anti -0.621750
76 -Air -> Gversion -0.046350 76 +OD -> O -0.828115
77 -Gtype -> Agit -0.051780 77 +O -> Air -0.867377
78 -pH -> Temp -0.055396 78 +Med -> Supp -0.872960
79 -Anti -> pH -0.065064 79 +Gtype -> O -0.956730
80 -Substrain -> Supp -0.073862 80 +Substrain -> O -1.072085
81 81
82 82
83 Top unlikely transitions: 83 Top unlikely transitions:
84 -OD -> Anti -0.306626 84 +Temp -> Temp 5.783774
85 -Technique -> Med -0.317775 85 +Air -> Air 5.351944
86 -Technique -> O -0.337656 86 +Med -> Med 5.160137
87 -Technique -> Gversion -0.339632 87 +Anti -> Anti 4.729843
88 -Anti -> Supp -0.346709 88 +Gversion -> Gversion 4.256435
89 -Gversion -> Gtype -0.359654 89 +Gtype -> Gtype 4.229740
90 -OD -> Temp -0.364068 90 +Supp -> Supp 4.114596
91 -Anti -> Gtype -0.374696 91 +Phase -> Phase 4.079539
92 -Air -> Temp -0.398364 92 +Technique -> Technique 3.363448
93 -Gversion -> Technique -0.424722 93 +O -> O 3.125273
94 -Gversion -> Supp -0.427358 94 +pH -> pH 2.487113
95 -Gtype -> Phase -0.440633 95 +O -> Supp 1.331978
96 -OD -> Technique -0.441830 96 +Air -> O 1.197935
97 -Gversion -> Air -0.472797 97 +Substrain -> Gtype 0.867656
98 -Med -> Air -0.491373 98 +O -> Technique 0.848943
99 -OD -> Supp -0.502001 99 +Gtype -> Supp 0.842999
100 -Anti -> OD -0.541429 100 +O -> Gtype 0.806504
101 -Supp -> pH -0.552035 101 +Med -> O 0.277505
102 -Temp -> Med -0.559365 102 +OD -> Phase 0.274387
103 -O -> Air -0.562556 103 +Technique -> Air 0.254899
104 -Supp -> Temp -0.563090 104 +Gtype -> Air 0.194030
105 -Gtype -> Technique -0.587403 105 +O -> Anti 0.155845
106 -Phase -> Technique -0.587965 106 +Temp -> O 0.076714
107 -Supp -> Phase -0.590123 107 +O -> Temp 0.055684
108 -Air -> Supp -0.631042 108 +O -> Gversion 0.011422
109 -Air -> Med -0.640889 109 +Phase -> Technique -0.000422
110 -OD -> Med -0.665368 110 +O -> Med -0.114582
111 -Technique -> Supp -0.671196 111 +Supp -> Technique -0.122463
112 -Gtype -> Gversion -0.722812 112 +Phase -> OD -0.142889
113 -Supp -> Anti -0.732707 113 +Supp -> O -0.146822
114 -Supp -> OD -0.751148 114 +O -> Phase -0.168062
115 -Air -> OD -0.751415 115 +O -> OD -0.179767
116 -OD -> Gtype -0.801738 116 +OD -> Gtype -0.206495
117 -Agit -> O -0.827165 117 +Supp -> Gtype -0.284656
118 -Supp -> Technique -0.836650 118 +Gtype -> Med -0.297248
119 -Supp -> Gversion -0.836877 119 +Gtype -> OD -0.310283
120 -Gtype -> Med -0.875397 120 +Technique -> OD -0.344965
121 -Supp -> Air -0.884655 121 +OD -> Air -0.364197
122 -Gtype -> Anti -0.943614 122 +Anti -> O -0.368065
123 -Supp -> Gtype -0.974424 123 +Technique -> pH -0.470302
124 -OD -> O -1.010665 124 +Gversion -> O -0.499305
125 -OD -> Air -1.028154 125 +Supp -> Med -0.541780
126 -Substrain -> O -1.046580 126 +Gtype -> Anti -0.621750
127 -Gtype -> OD -1.131529 127 +OD -> O -0.828115
128 -Technique -> Gtype -1.214725 128 +O -> Air -0.867377
129 -Technique -> pH -1.220888 129 +Med -> Supp -0.872960
130 -Technique -> OD -1.238019 130 +Gtype -> O -0.956730
131 -Supp -> Med -1.342545 131 +Substrain -> O -1.072085
132 -Med -> Supp -1.444556 132 +Agit -> O -1.092872
133 -Phase -> OD -1.784428 133 +Technique -> O -1.136884
134 134
135 135
136 Top positive: 136 Top positive:
137 -6.692463 O b'lemma:_' 137 +4.371447 Technique b'lemma[:2]:Ch'
138 -5.657865 O b'lemma:1' 138 +3.412737 O b'lemma[:2]:re'
139 -4.942948 Phase b'lemma:stationary' 139 +3.346233 Air b'lemma:anaerobic'
140 -4.925287 O b'lemma:2' 140 +3.006455 O b'lemma:1'
141 -4.843804 Air b'lemma:anaerobic' 141 +3.006455 O b'lemma[:2]:1'
142 -4.814975 Strain b'lemma:k-12' 142 +2.974851 Gtype b'lemma[:1]:\xce\xb4'
143 -4.647361 Technique b'lemma:ChIP-exo' 143 +2.912775 Gtype b'lemma:arca8myc'
144 -4.622048 Supp b'lemma:Iron' 144 +2.849140 Supp b'+1:lemma:\xc2\xb5m'
145 -4.599836 Technique b'lemma:chipseq' 145 +2.828513 Phase b'lemma:mid-log'
146 -4.422488 Air b'lemma:aerobic' 146 +2.792393 O b'lemma:_'
147 -4.412579 O b'lemma:rpob' 147 +2.792393 O b'lemma[:1]:_'
148 -4.377913 O b'postag:IN' 148 +2.792393 O b'lemma[:2]:_'
149 -4.349481 Supp b'lemma:pq' 149 +2.775899 Gtype b'-1:lemma:\xe2\x88\x86'
150 -4.294520 O b'lemma:3' 150 +2.625937 Air b'-1:lemma:ChIP-Seq'
151 -4.161278 Supp b'lemma:nh4cl' 151 +2.548311 Phase b'lemma:stationary'
152 -4.073955 Supp b'lemma:glucose' 152 +2.540916 Supp b'+1:lemma:1'
153 -3.969533 O b'lemma:rep1' 153 +2.487761 Supp b'+1:lemma:2'
154 -3.919806 Gtype b'lemma:arca8myc' 154 +2.442931 Air b'lemma:aerobic'
155 -3.916893 Gtype b'lemma:flag-tag' 155 +2.440190 O b'lemma[:2]:ge'
156 -3.916893 Gtype b'-1:lemma:c-terminal' 156 +2.435018 Gtype b'lemma[:2]:fl'
157 -3.877994 Gtype b'lemma:\xce\xb4cra' 157 +2.424212 O b'-1:lemma:tag'
158 -3.870087 Phase b'lemma:mid-log' 158 +2.408234 Supp b'lemma:Iron'
159 -3.844857 Air b'-1:lemma:ChIP-Seq' 159 +2.408234 Supp b'lemma[:2]:Ir'
160 -3.795026 O b'lemma:rep2' 160 +2.348537 Technique b'lemma[:1]:C'
161 -3.756394 Gtype b'lemma:wt' 161 +2.317292 O b'lemma:2'
162 -3.756244 Gversion b'lemma:asm584v2' 162 +2.317292 O b'lemma[:2]:2'
163 -3.735954 Substrain b'lemma:mg1655' 163 +2.308110 OD b'lemma[:2]:od'
164 -3.630823 Gtype b'-1:lemma:\xe2\x88\x86' 164 +2.302326 Gtype b'lemma:type'
165 -3.587007 Supp b'lemma:nitrate' 165 +2.302326 Gtype b'lemma[:2]:ty'
166 -3.584699 Supp b'+1:lemma:\xc2\xb5m' 166 +2.269875 Supp b'lemma:nitrate'
167 -3.571404 O b'lemma:Cra' 167 +2.269875 Supp b'lemma[:2]:ni'
168 -3.546169 Supp b'lemma:acetate' 168 +2.232923 O b'-1:lemma:ChIP-exo'
169 -3.518531 O b'lemma:b' 169 +2.212341 Air b'lemma[:2]:an'
170 -3.492146 O b'postag::' 170 +2.211030 Air b'lemma[:2]:ae'
171 -3.490669 O b'lemma:rep3' 171 +2.210563 Med b'+1:lemma:0.4'
172 -3.441030 O b'lemma:a' 172 +2.190483 O b'lemma:3'
173 -3.439329 O b'-1:lemma:tag' 173 +2.190483 O b'lemma[:2]:3'
174 -3.376019 Supp b'lemma:no3' 174 +2.182751 O b'+1:lemma:pq'
175 -3.358527 Gtype b'lemma:delta-arca' 175 +2.164071 Anti b'lemma[:2]:an'
176 -3.341462 Med b'lemma:LB' 176 +2.150488 O b'lemma:rpob'
177 -3.335616 Air b'lemma:Aerobic' 177 +2.116867 Gtype b'lemma:flag-tag'
178 -3.304114 OD b'lemma:od600' 178 +2.116867 Gtype b'-1:lemma:c-terminal'
179 -3.286213 Supp b'lemma:Fe' 179 +2.113845 Technique b'lemma:chipseq'
180 -3.283134 Supp b'lemma:dpd' 180 +2.106619 O b'+1:lemma:od600'
181 -3.262389 O b'lemma:.' 181 +2.103057 Anti b'+1:lemma:antibody'
182 -3.262389 O b'postag:.' 182 +2.102593 O b'lemma:with'
183 -3.262118 Gtype b'lemma:fnr8myc' 183 +2.082800 O b'+1:postag:RB'
184 -3.241225 Technique b'lemma:rna-seq' 184 +2.080780 Supp b'lemma:pq'
185 -3.161606 Med b'lemma:lb' 185 +2.080780 Supp b'lemma[:2]:pq'
186 -3.100373 Technique b'lemma:chip-seq' 186 +2.074963 Technique b'lemma[:2]:rn'
187 -3.056207 O b'lemma:\xcf\x8332' 187 +2.067178 Gtype b'lemma[:2]:cr'
188 -3.050606 O b'-1:lemma:Aerobic' 188 +2.064575 Med b'lemma[:1]:L'
189 -3.038793 Med b'lemma:MOPS' 189 +2.061976 Supp b'lemma:arginine'
190 -3.034791 Anti b'lemma:none' 190 +2.026279 Supp b'-1:lemma:Cra'
191 -3.020225 O b'postag:VBN' 191 +2.019223 Supp b'lemma:fructose'
192 -2.971269 O b'-1:lemma:ChIP-exo' 192 +1.992770 Gversion b'lemma:nc'
193 -2.958452 Anti b'lemma:seqa' 193 +1.992770 Gversion b'lemma[:2]:nc'
194 -2.958367 O b'lemma:CEL' 194 +1.980198 O b'lemma:0.4'
195 -2.941302 OD b'lemma:od450' 195 +1.979285 Gtype b'lemma[:2]:de'
196 -2.935356 O b'+1:lemma:od600' 196 +1.970609 O b'isLower'
197 -2.927938 Gtype b'lemma:\xe2\x88\x86' 197 +1.937619 Strain b'lemma:k-12'
198 -2.911881 Supp b'+1:lemma:1' 198 +1.937619 Strain b'lemma[:2]:k-'
199 -2.911524 Supp b'lemma:fructose' 199 +1.931122 O b'-1:lemma:0.3-0.35'
200 -2.871399 Technique b'lemma:rnaseq' 200 +1.881593 Supp b'-1:lemma:with'
201 -2.859600 O b'+1:postag:RB' 201 +1.875598 Gtype b'lemma:nsrr'
202 -2.839822 Gtype b'lemma:delta-fnr' 202 +1.875598 Gtype b'lemma[:2]:ns'
203 -2.810955 O b'lemma:Custom' 203 +1.852069 Technique b'lemma[:2]:ch'
204 -2.809182 Supp b'lemma:rifampicin' 204 +1.836687 pH b'lemma:ph5'
205 -2.808831 O b'lemma:-' 205 +1.836687 pH b'+1:lemma:.5'
206 -2.789937 Gtype b'lemma:type' 206 +1.832664 Gtype b'lemma[:2]:ar'
207 -2.788256 Supp b'+1:lemma:Deficient' 207 +1.831556 Air b'lemma[:1]:A'
208 -2.770982 Gtype b'+1:lemma:type' 208 +1.826833 Temp b'lemma[:1]:3'
209 -2.748917 Supp b'+1:lemma:2' 209 +1.823899 Substrain b'lemma:mg1655'
210 -2.743490 Gversion b'lemma:nc' 210 +1.820738 Gversion b'-1:lemma:nc'
211 -2.738725 Med b'+1:lemma:0.4' 211 +1.820497 O b'postag::'
212 -2.720595 pH b'lemma:ph5' 212 +1.820497 O b'postag[:1]::'
213 -2.720595 pH b'+1:lemma:.5' 213 +1.820497 O b'postag[:2]::'
214 -2.676119 Supp b'-1:lemma:Cra' 214 +1.813703 O b'-1:lemma:Aerobic'
215 -2.658000 Gtype b'lemma:\xce\xb4fur' 215 +1.796031 Gtype b'lemma[:1]:w'
216 -2.652362 Gtype b'+1:lemma:with' 216 +1.792963 O b'postag:IN'
217 -2.618562 Gversion b'lemma:chip-seq' 217 +1.792963 O b'postag[:1]:I'
218 -2.610176 Air b'postag:RB' 218 +1.792963 O b'postag[:2]:IN'
219 -2.594937 Gtype b'lemma:nsrr' 219 +1.783756 Gtype b'lemma:wt'
220 -2.583087 Technique b'lemma:ChIP-Seq' 220 +1.783756 Gtype b'lemma[:2]:wt'
221 -2.578250 Vess b'lemma:flask' 221 +1.779970 Gtype b'lemma[:1]:W'
222 -2.578250 Vess b'-1:lemma:warm' 222 +1.766922 Air b'lemma:Aerobic'
223 -2.563672 O b'lemma:affyexp' 223 +1.766922 Air b'lemma[:2]:Ae'
224 -2.551761 O b'-1:lemma:glucose' 224 +1.762347 Strain b'lemma[:1]:k'
225 -2.545085 O b'lemma:chip-arca' 225 +1.759570 Technique b'symb'
226 -2.505127 Supp b'+1:lemma:_' 226 +1.750706 Gversion b'lemma[:2]:00'
227 -2.499915 O b'-1:lemma:anaerobic' 227 +1.749953 Gtype b'-1:lemma:_'
228 -2.495203 Supp b'lemma:arginine' 228 +1.737043 Substrain b'lemma[:2]:mg'
229 -2.492742 O b'lemma:s' 229 +1.733603 O b'-1:lemma:anaerobic'
230 -2.486425 Gversion b'lemma:000913' 230 +1.709162 Gversion b'lemma:chip-seq'
231 -2.464249 O b'-1:lemma:0.3-0.35' 231 +1.701695 Temp b'-1:lemma:sample'
232 -2.449997 O b'lemma:oxyr' 232 +1.688968 Gtype b'+1:lemma:with'
233 -2.448215 Gversion b'lemma:.2' 233 +1.684459 O b'-1:lemma:lb'
234 -2.448215 Gversion b'-1:lemma:u00096' 234 +1.661522 Supp b'-1:postag:CC'
235 -2.435265 Anti b'lemma:anti-myc' 235 +1.650389 O b'lemma:b'
236 -2.432726 Gtype b'lemma:wild-type' 236 +1.650389 O b'lemma[:2]:b'
237 -2.423727 Temp b'lemma:\xc2\xb0c' 237 +1.646363 O b'-1:lemma:0.3'
238 -2.395174 Technique b'-1:lemma:IP' 238 +1.639941 Gtype b'+1:lemma:type'
239 -2.393484 O b'-1:lemma:stpa' 239 +1.637375 Air b'-1:lemma:co2'
240 -2.388764 Gversion b'lemma:u00096' 240 +1.636378 Med b'lemma:lb'
241 -2.388764 Gversion b'+1:lemma:.2' 241 +1.636378 Med b'lemma[:2]:lb'
242 -2.368933 Phase b'-1:lemma:mid-log' 242 +1.622025 Vess b'lemma[:2]:fl'
243 -2.366886 Gtype b'lemma:WT' 243 +1.617013 O b'-1:lemma:glucose'
244 -2.348028 O b'lemma:with' 244 +1.592815 Med b'isUpper'
245 -2.344016 O b'lemma:or' 245 +1.589934 Supp b'lemma:rifampicin'
246 -2.343871 O b'+1:lemma:anti-fur' 246 +1.589786 O b'lemma:a'
247 -2.313839 Gtype b'lemma:\xce\xb4soxs' 247 +1.589786 O b'lemma[:2]:a'
248 -2.310686 Strain b'+1:lemma:substr' 248 +1.586603 O b'+1:lemma:nacl'
249 -2.303744 O b'-1:lemma:lb' 249 +1.583003 Supp b'lemma[:1]:I'
250 -2.288133 O b'lemma:argr' 250 +1.580604 Supp b'lemma[:2]:gl'
251 -2.284029 Gtype b'+1:lemma:pq' 251 +1.576478 Supp b'lemma[:2]:ri'
252 -2.277137 O b'+1:lemma:pq' 252 +1.566704 Vess b'lemma:flask'
253 -2.253710 O b'lemma:ompr' 253 +1.566704 Vess b'-1:lemma:warm'
254 -2.244848 Gtype b'-1:lemma:ptac' 254 +1.563672 O b'-1:lemma:l1'
255 -2.214837 Med b'lemma:m63' 255 +1.557695 Med b'lemma:MOPS'
256 -2.208372 Air b'lemma:anaerobically' 256 +1.557695 Med b'lemma[:1]:M'
257 -2.207760 Gversion b'-1:lemma:nc' 257 +1.557695 Med b'lemma[:2]:MO'
258 -2.185269 Air b'lemma:Anaerobic' 258 +1.555428 O b'+1:postag:NNP'
259 -2.177809 Supp b'lemma:nacl' 259 +1.545733 Gtype b'hGreek'
260 -2.172428 Gtype b'+1:lemma:flagtag' 260 +1.540517 Supp b'+1:lemma:_'
261 -2.169963 Med b'+1:lemma:2.0' 261 +1.532630 Strain b'+1:lemma:substr'
262 -2.169550 O b'postag:SYM' 262 +1.524978 Phase b'-1:lemma:mid-log'
263 -2.165014 O b'lemma:purr' 263 +1.523410 O b'lemma:Custom'
264 -2.160892 pH b'+1:postag:CD' 264 +1.523410 O b'lemma[:2]:Cu'
265 -2.150124 Temp b'-1:lemma:37' 265 +1.506527 Supp b'lemma[:2]:0.'
266 -2.150116 O b'lemma:chip' 266 +1.493748 Med b'+1:lemma:2.0'
267 -2.133824 O b'+1:lemma:mid-log' 267 +1.489084 Gtype b'-1:lemma:rpob'
268 -2.130811 Gtype b'lemma:\xce\xb4ompr' 268 +1.468114 Technique b'lemma:ChIP-exo'
269 -2.113515 Air b'-1:lemma:-' 269 +1.462941 Vess b'-1:postag:VBN'
270 -2.112847 Gtype b'lemma:ptac' 270 +1.460306 Supp b'-1:postag:CD'
271 -2.087871 O b'lemma:Lrp' 271 +1.447232 Gversion b'lemma:asm584v2'
272 -2.073270 Gtype b'-1:lemma:_' 272 +1.442845 Gversion b'lemma[:2]:as'
273 -2.071479 Technique b'-1:lemma:chip-exo' 273 +1.436821 Supp b'lemma[:1]:n'
274 -2.052465 O b'-1:lemma:type' 274 +1.435640 Temp b'lemma:43'
275 -2.046273 O b'+1:lemma:o.d.' 275 +1.435640 Temp b'lemma[:2]:43'
276 -2.034128 Technique b'postag:NNP' 276 +1.430453 Gtype b'lemma:fnr8myc'
277 -2.032694 OD b'+1:lemma:stationary' 277 +1.423051 Temp b'-1:lemma:43'
278 -2.029532 Gtype b'lemma:deltaseqa' 278 +1.422224 O b'+1:lemma:ph5'
279 -2.029532 Gtype b'-1:lemma:old' 279 +1.419624 Supp b'lemma:acetate'
280 -2.029028 Technique b'-1:lemma:input' 280 +1.403936 Med b'lemma[:1]:m'
281 -2.028724 Temp b'+1:lemma:\xc2\xb0c' 281 +1.397641 O b'lemma:Cra'
282 -2.028052 Med b'postag:NNP' 282 +1.397641 O b'lemma[:2]:Cr'
283 -2.019887 O b'+1:lemma:chip-seq' 283 +1.395977 Temp b'-1:lemma:\xcf\x8332'
284 -2.016529 Vess b'-1:postag:VBN' 284 +1.392367 O b'lemma:.'
285 -2.014709 Anti b'+1:lemma:antibody' 285 +1.392367 O b'postag:.'
286 -2.004528 Supp b'+1:lemma:hour' 286 +1.392367 O b'postag[:1]:.'
287 -1.986808 Gtype b'+1:lemma:ph5' 287 +1.392367 O b'postag[:2]:.'
288 -1.982154 Temp b'-1:lemma:43' 288 +1.392367 O b'lemma[:2]:.'
289 -1.979758 Gtype b'+1:lemma:aerobic' 289 +1.391334 Gtype b'+1:lemma:flagtag'
290 -1.979385 Supp b'lemma:Leu' 290 +1.377069 OD b'+1:lemma:stationary'
291 -1.977544 Med b'+1:lemma:minimal' 291 +1.376467 Supp b'lemma[:1]:1'
292 -1.972140 Substrain b'+1:lemma:phtpg' 292 +1.373778 Gtype b'-1:postag:VBG'
293 -1.966671 O b'lemma:Fur' 293 +1.369190 pH b'+1:postag:CD'
294 -1.952996 Technique b'-1:lemma:_' 294 +1.364150 Phase b'-1:lemma:until'
295 -1.947488 Supp b'lemma:iptg' 295 +1.356359 Air b'+1:postag:IN'
296 -1.947369 O b'+1:lemma:43' 296 +1.353508 Air b'lemma[:1]:a'
297 -1.947148 Temp b'lemma:43' 297 +1.350471 Supp b'lemma:no3'
298 -1.946657 Supp b'-1:lemma:\xc2\xb5m' 298 +1.347435 Med b'lemma:broth'
299 -1.946349 Med b'+1:lemma:+' 299 +1.347435 Med b'-1:lemma:L'
300 -1.946188 Phase b'lemma:phase' 300 +1.347435 Med b'lemma[:2]:br'
301 -1.940761 Gtype b'lemma:pk4854' 301 +1.340636 Gtype b'symb'
302 -1.924723 O b'lemma:genotype/variation' 302 +1.337653 Supp b'lemma[:1]:2'
303 -1.911694 Gtype b'+1:lemma:_' 303 +1.337468 OD b'lemma[:1]:o'
304 -1.910805 Temp b'-1:lemma:\xcf\x8332' 304 +1.332813 O b'+1:lemma:anti-fur'
305 -1.907106 Supp b'lemma:Adenine' 305 +1.329231 Gtype b'+1:lemma::'
306 -1.906722 Technique b'+1:lemma:chip-exo' 306 +1.323371 Temp b'+1:lemma:\xc2\xb0c'
307 -1.906375 Anti b'lemma:anti-rpos' 307 +1.316239 O b'-1:lemma:media'
308 -1.904230 Air b'+1:lemma:at' 308 +1.308580 Anti b'-1:lemma::'
309 -1.903056 Gversion b'+1:lemma:000913' 309 +1.308448 Technique b'-1:lemma:input'
310 -1.901487 Med b'lemma:glucose' 310 +1.305697 Gtype b'lemma[:1]:f'
311 -1.889441 O b'lemma:chip-fnr' 311 +1.304733 O b'lemma[:1]:r'
312 -1.887601 Gtype b'-1:lemma:nsrr' 312 +1.298211 Gversion b'+1:lemma:000913'
313 -1.878766 O b'postag:DT' 313 +1.282839 Supp b'lemma:methanol'
314 -1.873733 pH b'lemma:.5' 314 +1.281363 Air b'-1:postag:CD'
315 -1.873733 pH b'-1:lemma:ph5' 315 +1.280599 Supp b'lemma:Fe'
316 -1.865998 O b'lemma:culture' 316 +1.280599 Supp b'lemma[:2]:Fe'
317 -1.855758 O b'lemma:for' 317 +1.280195 O b'lemma[:1]:C'
318 -1.853813 Gtype b'-1:lemma:rpob' 318 +1.274450 O b'-1:lemma:type'
319 -1.853644 O b'lemma:soxs' 319 +1.274241 Supp b'lemma:dpd'
320 -1.853644 O b'lemma:soxr' 320 +1.274241 Supp b'lemma[:2]:dp'
321 -1.846904 Gtype b'-1:lemma::' 321 +1.264726 Phase b'lemma[:2]:st'
322 -1.845474 Temp b'-1:lemma:sample' 322 +1.261615 Med b'+1:lemma:-lrb-'
323 -1.841250 Air b'lemma:anerobically' 323 +1.258563 Phase b'lemma[:2]:mi'
324 -1.838140 Air b'-1:postag:CD' 324 +1.256496 Supp b'lemma:of'
325 -1.831417 Med b'-1:lemma:ml' 325 +1.256496 Supp b'lemma[:2]:of'
326 -1.825450 Phase b'+1:lemma:for' 326 +1.254569 Substrain b'+1:lemma:phtpg'
327 -1.820952 O b'-1:lemma:0.3' 327 +1.254075 Technique b'-1:lemma:_'
328 -1.816339 Air b'-1:postag::' 328 +1.245791 Med b'+1:postag:-LRB-'
329 -1.812600 O b'postag:CC' 329 +1.240716 Technique b'lemma[:1]:c'
330 -1.810282 Supp b'+1:lemma:respiratory' 330 +1.237704 Anti b'lemma:none'
331 -1.805085 Supp b'lemma:methanol' 331 +1.235216 Supp b'lemma[:2]:ac'
332 -1.803745 Supp b'lemma:20' 332 +1.234140 Gtype b'-1:lemma:nsrr'
333 -1.782276 Med b'lemma:L' 333 +1.233335 O b'lemma:\xcf\x8332'
334 -1.782276 Med b'+1:lemma:broth' 334 +1.233335 O b'lemma[:1]:\xcf\x83'
335 -1.779488 O b'lemma:pt7' 335 +1.233335 O b'lemma[:2]:\xcf\x833'
336 -1.771701 OD b'-1:lemma:~' 336 +1.229676 Air b'-1:lemma:-'
337 337
338 338
339 Top negative: 339 Top negative:
340 --0.098597 OD b'+1:lemma:in' 340 +-0.051463 Temp b'postag:JJ'
341 --0.100809 O b'+1:lemma:pahse' 341 +-0.054116 Air b'postag[:1]:C'
342 --0.103942 Gtype b'-1:lemma:,' 342 +-0.059372 Phase b'postag[:1]:J'
343 --0.103942 Gtype b'-1:postag:,' 343 +-0.059372 Phase b'postag[:2]:JJ'
344 --0.109064 Supp b'+1:postag:IN' 344 +-0.059941 Temp b'postag:NN'
345 --0.116184 O b'-1:lemma:the' 345 +-0.060299 Air b'lemma[:1]:n'
346 --0.120961 Phase b'-1:postag:NN' 346 +-0.060598 Temp b'isLower'
347 --0.125524 Air b'-1:postag:CC' 347 +-0.062297 O b'+1:lemma:or'
348 --0.130098 O b'+1:lemma:sample' 348 +-0.065185 Supp b'+1:postag:VBN'
349 --0.133275 Med b'lemma:-lrb-' 349 +-0.065466 Air b'lemma:and'
350 --0.133905 OD b'+1:lemma:0.4' 350 +-0.066813 Gtype b'-1:postag:NN'
351 --0.137686 O b'-1:lemma:minimal' 351 +-0.068526 O b'lemma[:2]:ce'
352 --0.138574 Air b'-1:postag:-RRB-' 352 +-0.071041 O b'-1:postag:JJ'
353 --0.140110 Air b'-1:lemma:-rrb-' 353 +-0.071759 OD b'lemma:-lrb-'
354 --0.141778 Med b'postag:-LRB-' 354 +-0.074300 OD b'lemma[:1]:t'
355 --0.148667 Med b'-1:postag:NN' 355 +-0.074669 Supp b'postag:CD'
356 --0.152662 O b'-1:postag:IN' 356 +-0.074669 Supp b'postag[:2]:CD'
357 --0.152746 O b'lemma:medium' 357 +-0.078783 O b'lemma[:2]:30'
358 --0.153545 O b'lemma:n2' 358 +-0.079591 OD b'postag:-LRB-'
359 --0.154206 Air b'postag:CC' 359 +-0.079591 OD b'postag[:2]:-L'
360 --0.163582 O b'-1:postag:VBN' 360 +-0.079591 OD b'lemma[:2]:-l'
361 --0.164052 O b'-1:lemma:n2' 361 +-0.080662 O b'lemma[:2]:an'
362 --0.167774 Gtype b'+1:lemma:cra' 362 +-0.083375 O b'-1:postag:-RRB-'
363 --0.171535 O b'-1:lemma:with' 363 +-0.083466 O b'lemma:150'
364 --0.177101 Gtype b'+1:lemma:-lrb-' 364 +-0.083466 O b'+1:lemma:mg/ml'
365 --0.181072 Gtype b'postag:CD' 365 +-0.083466 O b'lemma[:2]:15'
366 --0.190005 O b'lemma:pahse' 366 +-0.084358 O b'lemma:glucose'
367 --0.191122 Gtype b'+1:lemma:a' 367 +-0.089803 Supp b'lemma[:1]:o'
368 --0.193246 O b'+1:lemma:_' 368 +-0.090889 Gtype b'lemma[:1]:r'
369 --0.200535 OD b'+1:lemma:mid-log' 369 +-0.094789 OD b'+1:postag:CD'
370 --0.201151 O b'lemma:co2' 370 +-0.096046 O b'lemma:co2'
371 --0.203533 O b'-1:lemma:-lrb-' 371 +-0.096854 Supp b'lemma:2'
372 --0.203756 O b'+1:lemma:phase' 372 +-0.096854 Supp b'lemma[:2]:2'
373 --0.207632 O b'-1:lemma:e.' 373 +-0.107550 OD b'+1:lemma:of'
374 --0.208480 O b'-1:lemma:purify' 374 +-0.110054 OD b'postag:JJ'
375 --0.211803 O b'lemma:grow' 375 +-0.111139 O b'-1:lemma:rna'
376 --0.213447 O b'+1:lemma:delta' 376 +-0.113070 Air b'postag:CC'
377 --0.215349 Air b'postag:CD' 377 +-0.113070 Air b'postag[:2]:CC'
378 --0.217993 O b'+1:lemma:-rrb-' 378 +-0.116092 OD b'postag[:1]:J'
379 --0.219170 Supp b'lemma:and' 379 +-0.116092 OD b'postag[:2]:JJ'
380 --0.221278 O b'lemma:10' 380 +-0.116551 O b'-1:lemma:\xe2\x88\x86'
381 --0.224277 O b'+1:lemma:.' 381 +-0.119208 O b'-1:lemma:of'
382 --0.224277 O b'+1:postag:.' 382 +-0.120060 O b'+1:lemma:arginine'
383 --0.226140 O b'-1:lemma:fresh' 383 +-0.120674 pH b'isLower'
384 --0.227840 O b'+1:lemma:mg1655' 384 +-0.122477 O b'+1:lemma:300'
385 --0.233692 O b'-1:postag:VBP' 385 +-0.123572 Phase b'postag:JJ'
386 --0.243094 O b'+1:lemma:-lcb-' 386 +-0.126294 O b'-1:lemma:iptg'
387 --0.244688 O b'lemma:30' 387 +-0.129027 Gtype b'-1:lemma:,'
388 --0.248768 Med b'-1:postag:CD' 388 +-0.129027 Gtype b'-1:postag:,'
389 --0.248953 O b'lemma:8' 389 +-0.130686 Med b'postag[:1]:C'
390 --0.252377 O b'+1:lemma:%' 390 +-0.131309 Supp b'+1:lemma:rifampicin'
391 --0.257481 O b'lemma:minimal' 391 +-0.137449 O b'-1:lemma:o2'
392 --0.257830 Technique b'-1:lemma::' 392 +-0.138824 O b'-1:lemma:ml'
393 --0.259100 Gversion b'+1:postag:NN' 393 +-0.142350 O b'lemma[:2]:20'
394 --0.259164 O b'-1:postag:-LRB-' 394 +-0.147695 Air b'-1:lemma:anaerobically'
395 --0.259192 Med b'+1:postag:NN' 395 +-0.147731 pH b'postag[:1]:N'
396 --0.265097 O b'+1:lemma:strain' 396 +-0.147731 pH b'postag[:2]:NN'
397 --0.270448 O b'-1:lemma:mm' 397 +-0.150331 Supp b'hUpper'
398 --0.271962 O b'+1:lemma:0.4' 398 +-0.150331 Supp b'hLower'
399 --0.272630 O b'-1:lemma:chip-exo' 399 +-0.151031 Gtype b'-1:postag:SYM'
400 --0.277009 OD b'+1:postag:CD' 400 +-0.152040 O b'+1:lemma:rep1'
401 --0.278470 O b'+1:lemma:minimal' 401 +-0.154569 O b'+1:lemma:-rrb-'
402 --0.286163 O b'+1:lemma:antibody' 402 +-0.155464 O b'lemma:dissolve'
403 --0.294848 Gtype b'-1:postag:CD' 403 +-0.163005 O b'lemma[:1]:k'
404 --0.294973 O b'+1:lemma:from' 404 +-0.166515 Anti b'+1:lemma:anti-fur'
405 --0.303885 O b'-1:lemma:grow' 405 +-0.166530 O b'-1:postag:VBN'
406 --0.306933 O b'lemma:e.' 406 +-0.168761 Vess b'hUpper'
407 --0.309307 Air b'-1:lemma:or' 407 +-0.168761 Vess b'hLower'
408 --0.312327 O b'postag:RB' 408 +-0.172221 O b'lemma:od600'
409 --0.312620 OD b'+1:postag:CC' 409 +-0.173580 O b'+1:lemma:0.3'
410 --0.316727 Anti b'+1:postag:JJ' 410 +-0.174879 O b'+1:lemma:c'
411 --0.319089 O b'-1:lemma:mid-log' 411 +-0.176207 O b'-1:lemma:grow'
412 --0.321702 O b'-1:lemma:um' 412 +-0.180767 Supp b'isUpper'
413 --0.321702 O b'+1:lemma:paraquat' 413 +-0.182914 O b'lemma:phase'
414 --0.322815 O b'-1:lemma:0.1' 414 +-0.183166 Air b'isUpper'
415 --0.325506 Supp b'+1:postag:VBN' 415 +-0.186591 O b'-1:lemma:-lrb-'
416 --0.327089 Med b'+1:postag:NNS' 416 +-0.187451 O b'-1:lemma:od600'
417 --0.329088 Supp b'-1:lemma:%' 417 +-0.193271 O b'+1:lemma:phase'
418 --0.335665 Med b'postag:CD' 418 +-0.200473 Air b'+1:postag:-LRB-'
419 --0.345089 O b'+1:lemma:shake' 419 +-0.200591 Gtype b'postag[:1]:V'
420 --0.346024 O b'lemma:nacl' 420 +-0.200591 Gtype b'postag[:2]:VB'
421 --0.346568 Med b'-1:postag:IN' 421 +-0.202895 O b'lemma[:2]:ae'
422 --0.349877 O b'-1:lemma:iptg' 422 +-0.203770 O b'lemma[:1]:d'
423 --0.351934 Supp b'-1:postag:VBG' 423 +-0.213212 Air b'-1:postag:CC'
424 --0.361114 Phase b'-1:lemma:at' 424 +-0.216984 Technique b'isUpper'
425 --0.363308 Gtype b'+1:lemma:b' 425 +-0.218975 O b'+1:lemma:antibody'
426 --0.369166 O b'+1:lemma:b' 426 +-0.219469 OD b'postag:CD'
427 --0.370353 O b'+1:postag:IN' 427 +-0.219469 OD b'postag[:2]:CD'
428 --0.375482 O b'+1:lemma:rep1' 428 +-0.220367 Air b'+1:lemma:-lrb-'
429 --0.382649 OD b'postag:JJ' 429 +-0.229132 O b'lemma[:1]:I'
430 --0.389625 O b'-1:lemma:rifampicin' 430 +-0.237062 Med b'+1:postag:NN'
431 --0.390229 O b'-1:lemma:20' 431 +-0.244233 O b'+1:lemma:.'
432 --0.392434 O b'+1:lemma:300' 432 +-0.244233 O b'+1:postag:.'
433 --0.392765 O b'-1:lemma:od600' 433 +-0.253501 O b'lemma[:1]:p'
434 --0.396162 O b'lemma:\xc2\xb0c' 434 +-0.255478 O b'+1:postag:IN'
435 --0.397112 Temp b'postag:JJ' 435 +-0.268269 Air b'+1:postag:JJ'
436 --0.398067 O b'+1:postag:-RRB-' 436 +-0.270663 Supp b'lemma[:2]:an'
437 --0.412750 O b'-1:lemma:affinity' 437 +-0.277051 O b'+1:lemma:\xc2\xb0c'
438 --0.416189 O b'+1:lemma:dissolve' 438 +-0.289474 Phase b'-1:postag:JJ'
439 --0.417913 O b'+1:lemma:cell' 439 +-0.290989 O b'-1:lemma:ompr'
440 --0.426120 O b'-1:lemma:from' 440 +-0.299880 OD b'isNumber'
441 --0.472958 O b'-1:lemma:30' 441 +-0.300487 O b'lemma:of'
442 --0.483340 Technique b'-1:postag::' 442 +-0.300487 O b'lemma[:2]:of'
443 --0.483753 Temp b'+1:lemma:to' 443 +-0.301898 O b'lemma:wt'
444 --0.483753 Temp b'+1:postag:TO' 444 +-0.301898 O b'lemma[:2]:wt'
445 --0.484495 O b'+1:lemma:c' 445 +-0.302943 O b'lemma[:2]:0.'
446 --0.487031 Supp b'+1:lemma:glucose' 446 +-0.307135 O b'-1:postag:IN'
447 --0.495206 Gtype b'lemma:_' 447 +-0.308105 O b'+1:lemma:fecl2'
448 --0.505255 Supp b'postag:CC' 448 +-0.311660 Technique b'-1:lemma::'
449 --0.505610 O b'-1:lemma:cra' 449 +-0.327682 O b'lemma:37'
450 --0.512805 O b'lemma:dissolve' 450 +-0.327682 O b'lemma[:2]:37'
451 --0.519407 O b'lemma:glucose' 451 +-0.327793 Supp b'postag[:1]:C'
452 --0.530802 O b'+1:lemma:Aerobic' 452 +-0.335851 Phase b'-1:lemma:at'
453 --0.536055 O b'lemma:mg1655' 453 +-0.337349 Supp b'-1:lemma:%'
454 --0.538193 O b'+1:lemma:arginine' 454 +-0.337470 Med b'-1:postag:CD'
455 --0.540056 O b'lemma:dpd' 455 +-0.339976 Air b'-1:lemma:or'
456 --0.543308 O b'+1:lemma:until' 456 +-0.355481 O b'-1:postag:-LRB-'
457 --0.553627 pH b'postag:NN' 457 +-0.358486 O b'lemma:anaerobically'
458 --0.557904 O b'-1:lemma:until' 458 +-0.362559 Technique b'postag:NN'
459 --0.560304 OD b'+1:postag:NN' 459 +-0.363246 Air b'symb'
460 --0.577595 O b'-1:lemma:g/l' 460 +-0.369284 Temp b'+1:lemma:to'
461 --0.579159 OD b'+1:lemma:and' 461 +-0.369284 Temp b'+1:postag:TO'
462 --0.595749 O b'lemma:phase' 462 +-0.371266 O b'+1:postag:-RRB-'
463 --0.611587 Gtype b'+1:lemma:\xe2\x88\x86' 463 +-0.373089 O b'lemma[:2]:od'
464 --0.614217 Gtype b'-1:postag:SYM' 464 +-0.392668 Gtype b'lemma[:1]:g'
465 --0.624715 O b'lemma:purify' 465 +-0.401430 O b'lemma[:1]:L'
466 --0.636366 O b'lemma:150' 466 +-0.407738 OD b'+1:postag:NN'
467 --0.636366 O b'+1:lemma:mg/ml' 467 +-0.416254 Agit b'symb'
468 --0.638397 Gtype b'-1:postag:DT' 468 +-0.418662 O b'-1:lemma:co2'
469 --0.657927 O b'lemma:m63' 469 +-0.425645 Med b'+1:postag:IN'
470 --0.664969 Gtype b'lemma:delta' 470 +-0.435796 Agit b'hUpper'
471 --0.666049 OD b'lemma:-lrb-' 471 +-0.435796 Agit b'hLower'
472 --0.682691 Supp b'+1:lemma:rifampicin' 472 +-0.441773 O b'lemma:2h'
473 --0.692119 Temp b'-1:lemma:\xc2\xb0c' 473 +-0.441773 O b'-1:lemma:additional'
474 --0.706829 O b'lemma:lb' 474 +-0.441773 O b'lemma[:2]:2h'
475 --0.708511 Med b'+1:postag:IN' 475 +-0.446576 Air b'postag[:1]:N'
476 --0.711784 O b'-1:lemma:~' 476 +-0.446576 Air b'postag[:2]:NN'
477 --0.714372 O b'+1:lemma:0.3' 477 +-0.451999 O b'lemma:20'
478 --0.716136 O b'+1:postag:NNS' 478 +-0.454739 Technique b'isLower'
479 --0.736106 O b'+1:lemma:\xc2\xb0c' 479 +-0.455345 Air b'isLower'
480 --0.738116 Phase b'postag:JJ' 480 +-0.459952 Med b'-1:postag:NN'
481 --0.744781 O b'-1:lemma:1' 481 +-0.491723 O b'lemma[:2]:me'
482 --0.764657 OD b'postag:-LRB-' 482 +-0.493797 Supp b'postag:JJ'
483 --0.767869 Temp b'postag:NN' 483 +-0.504237 O b'-1:lemma:37'
484 --0.772655 O b'lemma:of' 484 +-0.511772 Supp b'postag[:1]:J'
485 --0.774528 O b'-1:lemma:\xe2\x88\x86' 485 +-0.511772 Supp b'postag[:2]:JJ'
486 --0.806745 O b'+1:lemma:fecl2' 486 +-0.518180 Temp b'hGreek'
487 --0.808726 O b'lemma:anaerobically' 487 +-0.530228 O b'-1:lemma:from'
488 --0.817926 O b'-1:lemma:0.2' 488 +-0.537664 Technique b'-1:postag::'
489 --0.828109 O b'lemma:media' 489 +-0.540107 O b'+1:lemma:cell'
490 --0.860850 Phase b'-1:postag:JJ' 490 +-0.544422 Gtype b'lemma[:1]:m'
491 --0.869705 Air b'-1:postag:JJ' 491 +-0.545010 O b'-1:lemma:cra'
492 --0.869779 Anti b'+1:lemma:anti-fur' 492 +-0.547384 O b'lemma[:1]:0'
493 --0.913352 O b'lemma:0.3' 493 +-0.555352 O b'lemma[:1]:A'
494 --0.926265 O b'lemma:20' 494 +-0.579802 Gtype b'lemma[:1]:c'
495 --0.966551 O b'+1:lemma:in' 495 +-0.584906 Air b'postag:NN'
496 --0.967999 O b'-1:lemma:co2' 496 +-0.624005 O b'-1:lemma:IP'
497 --0.983473 O b'lemma:\xe2\x88\x86' 497 +-0.630245 O b'-1:lemma:the'
498 --1.005883 O b'lemma:0.1' 498 +-0.631759 O b'+1:lemma:supplement'
499 --1.012563 O b'+1:lemma:supplement' 499 +-0.642073 Med b'symb'
500 --1.015961 O b'lemma:2h' 500 +-0.648245 O b'lemma[:2]:gl'
501 --1.015961 O b'-1:lemma:additional' 501 +-0.651355 O b'-1:lemma:sample'
502 --1.030442 O b'lemma:fecl2' 502 +-0.664904 Gtype b'lemma:delta'
503 --1.035342 Supp b'+1:lemma:acetate' 503 +-0.696355 O b'+1:postag:NNS'
504 --1.055745 O b'+1:lemma:g/l' 504 +-0.717210 Anti b'postag:NNP'
505 --1.058371 O b'+1:lemma:at' 505 +-0.724215 Supp b'lemma[:1]:c'
506 --1.065986 O b'+1:postag:VBG' 506 +-0.728404 Air b'-1:postag:JJ'
507 --1.108278 O b'lemma:anaerobic' 507 +-0.738219 O b'+1:lemma:+'
508 --1.137604 O b'-1:lemma:ompr' 508 +-0.750040 Gversion b'isLower'
509 --1.149433 O b'-1:postag:VBG' 509 +-0.776375 O b'+1:lemma:g/l'
510 --1.157369 O b'-1:lemma:dissolve' 510 +-0.778177 O b'-1:lemma:dissolve'
511 --1.157369 O b'+1:lemma:methanol' 511 +-0.778177 O b'+1:lemma:methanol'
512 --1.161744 O b'lemma:0.2' 512 +-0.796433 O b'+1:lemma:hour'
513 --1.176749 O b'lemma:mid-log' 513 +-0.798962 Gtype b'isNumber'
514 --1.210434 O b'lemma:\xce\xb4fur' 514 +-0.864076 O b'lemma[:2]:ri'
515 --1.224092 O b'-1:lemma:sample' 515 +-0.864983 O b'-1:lemma:nsrr'
516 --1.241862 O b'-1:lemma:ml' 516 +-0.897796 Gtype b'isUpper'
517 --1.249714 O b'lemma:37' 517 +-0.915145 Phase b'hUpper'
518 --1.287855 O b'postag:VBP' 518 +-0.915145 Phase b'hLower'
519 --1.290513 O b'lemma:od600' 519 +-0.971040 O b'lemma:mid-log'
520 --1.322257 O b'lemma:k-12' 520 +-0.973820 O b'lemma:rifampicin'
521 --1.332061 O b'-1:lemma:rpob' 521 +-0.985135 O b'lemma[:1]:\xce\xb4'
522 --1.387093 Supp b'postag:JJ' 522 +-0.989912 Supp b'symb'
523 --1.418093 O b'-1:postag::' 523 +-1.024646 O b'-1:lemma:rpob'
524 --1.520563 Anti b'postag:NNP' 524 +-1.027096 O b'lemma:methanol'
525 --1.552213 O b'-1:lemma:37' 525 +-1.040232 O b'+1:postag:VBG'
526 --1.582655 O b'lemma:methanol' 526 +-1.074775 Gtype b'lemma[:2]:rp'
527 --1.634214 Air b'+1:postag:JJ' 527 +-1.135014 O b'+1:lemma:at'
528 --1.656961 O b'-1:lemma:2' 528 +-1.242720 O b'-1:postag:VBG'
529 --1.660038 O b'-1:lemma:nsrr' 529 +-1.254198 O b'+1:lemma:in'
530 --1.778068 O b'-1:lemma:IP' 530 +-1.381811 Gtype b'lemma[:1]:a'
531 --1.782125 O b'lemma:rifampicin' 531 +-1.431865 Supp b'hGreek'
532 --1.784846 Air b'postag:NN' 532 +-1.551257 O b'-1:postag::'
533 --1.792093 O b'+1:lemma:hour' 533 +-1.707232 O b'-1:lemma:2'
534 --1.833447 O b'+1:lemma:+' 534 +-1.771113 OD b'postag[:1]:-'
535 --1.873023 O b'lemma:wt' 535 +-1.831476 O b'+1:lemma:2'
536 --1.948439 O b'+1:lemma:2' 536 +-1.836996 OD b'lemma[:1]:-'
537 --2.447797 O b'+1:lemma:1' 537 +-2.234728 O b'+1:lemma:1'
538 --2.955767 O b'-1:lemma:_' 538 +-3.071950 O b'-1:lemma::'
539 --3.288596 O b'-1:lemma::' 539 +-3.880058 O b'-1:lemma:_'
540 540
......