Estefani Gaytan Nunez

update

......@@ -137,28 +137,26 @@ def word2features(sent, i, S1, S2):
#====================== S1 ======================#
if S1:
listElem = sent[i - 1].split('|')
lemma1 = listElem[1]
postag1 = listElem[2]
print("S1")
features['hUpper']: hUpper(word)
features['hLower']: hUpper(word)
features['hGreek']: hGreek(word)
features['symb']: symb(word)
features['hUpper']= hUpper(word)
features['hLower']= hUpper(word)
features['hGreek']= hGreek(word)
features['symb']= symb(word)
#firstChar
features['lemma1[:1]']: lemma1[:1]
features['lemma[:1]']= lemma[:1]
features['postag[:1]']= postag[:1]
#secondChar
features['postag[:1]']: lemma1[:1]
features['postag[:2]']: lemma1[:2]
features['lemma[:2]']: lemma1[:2]
features['postag[:2]']= postag[:2]
features['lemma[:2]']= lemma[:2]
#====================== S2 ======================#
if S2:
#S2
features['isUpper']: word.isupper()
features['isLower']: word.isLower()
features['isGreek']: isGreek(word)
features['isNumber']: word.isdigit()
print("S2")
features['isUpper']= word.isupper()
features['isLower']= word.islower()
features['isGreek']= isGreek(word)
features['isNumber'] = word.isdigit()
'''
......@@ -348,7 +346,7 @@ if __name__ == "__main__":
# crf = rs.best_estimator_
nameReport = str(options.S1) + '_S2_' + str(options.S2) + str(options.version) + '.txt'
nameReport = 'S1_' + str(options.S1) + '_S2_' + str(options.S2) + str(options.version) + '.txt'
with open(os.path.join(options.outputPath, "reports", "report_" + nameReport), mode="w") as oFile:
oFile.write("********** TRAINING AND TESTING REPORT **********\n")
oFile.write("Training file: " + options.trainingFile + '\n')
......
No preview for this file type
No preview for this file type
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.0845144703859872, 'c2': 0.0014492583407590665}
best CV score:0.803457407167867
best params:{'c1': 0.16058815571126603, 'c2': 0.009129664457456948}
best CV score:0.7991895289243558
model size: 0.07M
Flat F1: 0.7886994187596283
Flat F1: 0.7842038431135264
precision recall f1-score support
OD 1.000 0.405 0.577 37
pH 1.000 1.000 1.000 12
Technique 0.952 0.909 0.930 22
Med 0.812 0.912 0.860 57
Med 0.800 0.842 0.821 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.947 0.973 19
Air 0.730 0.742 0.736 62
Air 0.780 0.742 0.760 62
Anti 0.571 0.444 0.500 9
Strain 1.000 1.000 1.000 1
Gtype 0.863 0.774 0.816 106
Gtype 0.872 0.774 0.820 106
Substrain 0.000 0.000 0.000 1
Supp 0.815 0.713 0.761 136
Supp 0.823 0.684 0.747 136
Gversion 0.000 0.000 0.000 0
avg / total 0.841 0.760 0.789 480
avg / total 0.850 0.744 0.784 480
Top likely transitions:
Agit -> Agit 7.567868
OD -> OD 7.283561
Temp -> Temp 6.525111
Anti -> Anti 6.338173
Med -> Med 6.068203
Air -> Air 5.490227
Gtype -> Gtype 5.364943
O -> O 5.360015
Phase -> Phase 5.088291
Gversion -> Gversion 5.052937
Technique -> Technique 4.734097
Supp -> Supp 4.592596
Gtype -> Supp 1.928700
pH -> pH 1.873562
O -> Supp 1.656908
O -> Technique 1.579934
Substrain -> Gtype 1.367059
O -> Gtype 1.299889
Air -> O 1.168469
O -> Temp 0.796125
O -> Anti 0.464004
OD -> Phase 0.334945
Med -> O 0.323185
O -> Gversion 0.294223
Technique -> Air 0.120065
Temp -> O 0.058292
Gversion -> O 0.017060
Gtype -> pH 0.014023
Anti -> O 0.004741
O -> Med 0.003586
O -> Strain 0.000914
Phase -> O 0.000079
Technique -> O -0.064766
Supp -> Air -0.085487
Air -> OD -0.140828
Supp -> OD -0.140855
OD -> Gtype -0.154848
Gtype -> O -0.178619
Air -> Supp -0.190285
Phase -> Air -0.254683
Supp -> O -0.331239
OD -> Air -0.339236
Supp -> Technique -0.352046
Technique -> OD -0.381551
Gtype -> Anti -0.576175
Agit -> O -0.582420
O -> Air -0.710972
OD -> Med -0.720546
OD -> O -0.754296
Gtype -> OD -0.821534
Agit -> Agit 6.719064
OD -> OD 6.323533
Temp -> Temp 5.626965
Med -> Med 5.518631
Anti -> Anti 5.387568
Air -> Air 5.306006
Gtype -> Gtype 4.649741
O -> O 4.602569
Phase -> Phase 4.554949
Gversion -> Gversion 4.497882
Supp -> Supp 4.147792
Technique -> Technique 4.061262
pH -> pH 2.238372
O -> Supp 1.895496
Air -> O 1.750002
Gtype -> Supp 1.554366
Substrain -> Gtype 1.504459
O -> Gtype 1.372037
O -> Technique 1.353039
Technique -> Air 0.944695
O -> Anti 0.631594
O -> Temp 0.503749
Med -> O 0.429416
O -> Gversion 0.344788
OD -> Phase 0.332615
Temp -> O 0.259256
O -> Med 0.223793
Gtype -> Air 0.098960
Supp -> O 0.061572
O -> Phase 0.048636
Gtype -> pH 0.031023
Phase -> O 0.028306
O -> Strain 0.026662
OD -> Air -0.000013
Technique -> O -0.002223
Technique -> Gtype -0.072225
Supp -> Air -0.245156
Technique -> OD -0.270904
OD -> Med -0.284259
Gtype -> Med -0.389196
Gtype -> O -0.401680
OD -> O -0.570578
Agit -> O -0.633985
Gtype -> Anti -0.634022
O -> Air -0.700283
Gtype -> OD -0.910835
Supp -> Med -0.967944
Substrain -> O -1.090330
Med -> Supp -1.725214
Phase -> OD -1.762859
Top unlikely transitions:
Med -> Med 6.068203
Air -> Air 5.490227
Gtype -> Gtype 5.364943
O -> O 5.360015
Phase -> Phase 5.088291
Gversion -> Gversion 5.052937
Technique -> Technique 4.734097
Supp -> Supp 4.592596
Gtype -> Supp 1.928700
pH -> pH 1.873562
O -> Supp 1.656908
O -> Technique 1.579934
Substrain -> Gtype 1.367059
O -> Gtype 1.299889
Air -> O 1.168469
O -> Temp 0.796125
O -> Anti 0.464004
OD -> Phase 0.334945
Med -> O 0.323185
O -> Gversion 0.294223
Technique -> Air 0.120065
Temp -> O 0.058292
Gversion -> O 0.017060
Gtype -> pH 0.014023
Anti -> O 0.004741
O -> Med 0.003586
O -> Strain 0.000914
Phase -> O 0.000079
Technique -> O -0.064766
Supp -> Air -0.085487
Air -> OD -0.140828
Supp -> OD -0.140855
OD -> Gtype -0.154848
Gtype -> O -0.178619
Air -> Supp -0.190285
Phase -> Air -0.254683
Supp -> O -0.331239
OD -> Air -0.339236
Supp -> Technique -0.352046
Technique -> OD -0.381551
Gtype -> Anti -0.576175
Agit -> O -0.582420
O -> Air -0.710972
OD -> Med -0.720546
OD -> O -0.754296
Gtype -> OD -0.821534
Supp -> Med -1.118820
Substrain -> O -1.830467
Phase -> OD -2.403512
Med -> Supp -2.548799
Agit -> Agit 6.719064
OD -> OD 6.323533
Temp -> Temp 5.626965
Med -> Med 5.518631
Anti -> Anti 5.387568
Air -> Air 5.306006
Gtype -> Gtype 4.649741
O -> O 4.602569
Phase -> Phase 4.554949
Gversion -> Gversion 4.497882
Supp -> Supp 4.147792
Technique -> Technique 4.061262
pH -> pH 2.238372
O -> Supp 1.895496
Air -> O 1.750002
Gtype -> Supp 1.554366
Substrain -> Gtype 1.504459
O -> Gtype 1.372037
O -> Technique 1.353039
Technique -> Air 0.944695
O -> Anti 0.631594
O -> Temp 0.503749
Med -> O 0.429416
O -> Gversion 0.344788
OD -> Phase 0.332615
Temp -> O 0.259256
O -> Med 0.223793
Gtype -> Air 0.098960
Supp -> O 0.061572
O -> Phase 0.048636
Gtype -> pH 0.031023
Phase -> O 0.028306
O -> Strain 0.026662
OD -> Air -0.000013
Technique -> O -0.002223
Technique -> Gtype -0.072225
Supp -> Air -0.245156
Technique -> OD -0.270904
OD -> Med -0.284259
Gtype -> Med -0.389196
Gtype -> O -0.401680
OD -> O -0.570578
Agit -> O -0.633985
Gtype -> Anti -0.634022
O -> Air -0.700283
Gtype -> OD -0.910835
Supp -> Med -0.967944
Substrain -> O -1.090330
Med -> Supp -1.725214
Phase -> OD -1.762859
Top positive:
12.504936 Supp b'lemma:Iron'
10.792779 O b'lemma:_'
10.427539 Air b'lemma:aerobic'
10.207513 Air b'lemma:anaerobic'
9.451231 Supp b'lemma:nitrate'
9.115772 Phase b'lemma:stationary'
8.575457 O b'lemma:1'
8.408994 Technique b'lemma:ChIP-exo'
8.354108 Air b'-1:lemma:ChIP-Seq'
8.314194 O b'lemma:rpob'
8.264287 Med b'lemma:MOPS'
8.077335 Technique b'lemma:chipseq'
7.675786 O b'-1:lemma:ChIP-exo'
7.432466 Strain b'lemma:k-12'
7.338742 O b'lemma:Custom'
7.132224 O b'-1:lemma:tag'
6.872851 Substrain b'lemma:mg1655'
6.656592 Supp b'lemma:pq'
6.656346 Gtype b'lemma:\xce\xb4cra'
6.631548 O b'lemma:3'
6.608233 O b'lemma:2'
6.514523 Air b'lemma:Aerobic'
6.354650 Technique b'lemma:ChIP-Seq'
6.321273 Gtype b'lemma:flag-tag'
6.321273 Gtype b'-1:lemma:c-terminal'
6.285172 O b'lemma:rep1'
6.282612 O b'lemma:b'
6.260165 Gversion b'lemma:asm584v2'
6.243462 Gversion b'-1:lemma:nc'
6.129172 Gversion b'lemma:nc'
6.117441 O b'lemma:rep2'
6.056865 O b'lemma:rep3'
6.042591 OD b'+1:lemma:stationary'
5.905730 O b'lemma:Cra'
5.761961 Gtype b'lemma:arca8myc'
5.631643 Gtype b'-1:lemma:\xe2\x88\x86'
5.616482 Phase b'lemma:mid-log'
5.599676 Med b'lemma:LB'
5.591086 O b'lemma:a'
5.417363 O b'lemma:chip'
5.415483 O b'lemma:\xcf\x8332'
5.410036 O b'-1:lemma:0.3'
5.383641 Supp b'+1:lemma:\xc2\xb5m'
5.378485 OD b'lemma:od600'
5.357822 O b'postag::'
5.343662 Gtype b'lemma:delta-arca'
5.329601 Supp b'lemma:nh4cl'
5.310595 Gtype b'lemma:fnr8myc'
5.291721 OD b'lemma:od450'
5.278396 Supp b'lemma:Fe'
5.198206 O b'postag:IN'
5.152255 O b'lemma:or'
5.142263 O b'-1:lemma:Aerobic'
5.072815 Med b'lemma:lb'
4.967279 Technique b'lemma:rna-seq'
4.960999 Gtype b'lemma:type'
4.958285 Strain b'+1:lemma:substr'
4.905998 Gtype b'lemma:wt'
4.808130 Supp b'lemma:glucose'
4.806347 Vess b'lemma:flask'
4.806347 Vess b'-1:lemma:warm'
4.772284 O b'lemma:for'
4.744261 Supp b'lemma:arginine'
4.737788 Gtype b'lemma:delta-fnr'
4.691753 O b'-1:lemma:0.3-0.35'
4.668554 Gtype b'+1:lemma:type'
4.631710 Technique b'lemma:rnaseq'
4.584824 Gtype b'lemma:nsrr'
4.584359 O b'-1:lemma:glucose'
4.556168 O b'-1:lemma:anaerobic'
4.539600 Supp b'-1:lemma:Cra'
4.538972 O b'lemma:-'
4.508141 Gtype b'-1:lemma:rpob'
4.499586 Technique b'lemma:chip-seq'
4.488070 Anti b'lemma:none'
4.462302 O b'lemma:ompr'
4.460124 Anti b'lemma:anti-rpos'
4.460049 Supp b'lemma:no3'
4.451202 O b'+1:lemma:od600'
4.424279 Gtype b'lemma:\xce\xb4fur'
4.389978 Supp b'lemma:acetate'
4.387749 Med b'+1:lemma:0.4'
4.335328 O b'lemma:.'
4.335328 O b'postag:.'
4.197130 Temp b'-1:lemma:\xcf\x8332'
4.152430 Anti b'lemma:seqa'
4.141879 O b'lemma:with'
4.081039 Supp b'-1:lemma:+'
4.005391 O b'+1:lemma:o.d.'
3.986966 O b'-1:lemma:type'
3.971115 O b'+1:lemma:sparging'
3.914608 Gversion b'lemma:chip-seq'
3.905122 Supp b'+1:lemma:1'
3.886730 Technique b'-1:lemma:IP'
3.875182 Supp b'+1:lemma:hour'
3.871343 Temp b'-1:lemma:43'
3.798383 pH b'lemma:ph5'
3.798383 pH b'+1:lemma:.5'
3.766343 Supp b'lemma:Leu'
3.758437 Med b'lemma:m63'
3.755680 Supp b'lemma:rifampicin'
3.717291 Gtype b'+1:lemma:ph5'
3.691820 Gtype b'-1:lemma:ptac'
3.686748 Gtype b'lemma:\xe2\x88\x86'
3.655665 Anti b'+1:lemma:antibody'
3.645147 Temp b'-1:lemma:37'
3.584169 O b'lemma:s'
3.582382 Gversion b'lemma:000913'
3.513265 O b'postag:VBN'
3.504182 Temp b'-1:lemma:sample'
3.476410 O b'lemma:CEL'
3.471641 Gtype b'+1:lemma:flagtag'
3.469424 O b'+1:lemma:pq'
3.442038 Med b'+1:lemma:minimal'
3.441203 Gtype b'lemma:\xce\xb4ompr'
3.440050 Supp b'+1:lemma:2'
3.439274 O b'lemma:oxyr'
3.430689 Gtype b'lemma:\xce\xb4soxs'
3.424081 Supp b'lemma:Adenine'
3.394933 O b'-1:lemma:lb'
3.382358 Supp b'lemma:dpd'
3.374432 Anti b'lemma:anti-myc'
3.354369 O b'+1:lemma:chip-seq'
3.325764 O b'-1:lemma:\xc2\xb0c'
3.324069 Air b'lemma:anerobically'
3.306589 Gversion b'lemma:u00096'
3.306589 Gversion b'+1:lemma:.2'
3.290810 Supp b'lemma:fructose'
3.286471 Med b'+1:lemma:2.0'
3.281346 Gversion b'lemma:.2'
3.281346 Gversion b'-1:lemma:u00096'
3.224316 Gtype b'lemma:wild-type'
3.206842 Gtype b'+1:lemma:with'
3.204237 O b'+1:lemma:rifampicin'
3.192028 Gtype b'+1:lemma:aerobic'
3.176568 Supp b'lemma:iptg'
3.174757 Supp b'lemma:nacl'
3.142082 Phase b'-1:lemma:until'
3.138505 Gtype b'lemma:pk4854'
3.102435 Supp b'+1:lemma:_'
3.077765 Technique b'-1:lemma:input'
3.043564 Med b'+1:lemma:contain'
3.043460 O b'lemma:affyexp'
3.030477 O b'+1:postag:NNP'
3.011575 Gtype b'+1:lemma:pq'
3.009802 Technique b'-1:lemma:rna-seq'
3.009086 Phase b'+1:lemma:for'
3.006591 O b'lemma:chip-arca'
2.961198 Technique b'+1:lemma:chip-exo'
2.918766 Gtype b'lemma:deltaseqa'
2.918766 Gtype b'-1:lemma:old'
2.895206 O b'lemma:soxs'
2.895206 O b'lemma:soxr'
2.893483 O b'lemma:argr'
2.883608 Supp b'-1:lemma:\xc2\xb5m'
2.871795 Technique b'-1:lemma:chip-exo'
2.840922 Air b'postag:RB'
2.837804 O b'-1:lemma:l1'
2.834031 O b'lemma:purr'
2.816068 pH b'lemma:.5'
2.816068 pH b'-1:lemma:ph5'
2.793907 O b'+1:postag:RB'
2.787764 Temp b'lemma:43'
2.783505 Gtype b'+1:lemma:knock-out'
2.777516 Med b'-1:lemma:ml'
2.776744 Gtype b'lemma:ptac'
2.754900 Air b'lemma:anaerobically'
2.728375 O b'+1:lemma:acetate'
2.677194 Gtype b'lemma:\xce\xb4oxyr'
2.676114 Gtype b'lemma:WT'
2.664380 O b'-1:lemma:dpd'
2.623289 O b'lemma:at'
2.622409 Air b'+1:lemma:at'
2.621682 O b'lemma:Fur'
2.613642 OD b'lemma:0.3'
2.611845 O b'postag:DT'
2.601745 O b'-1:lemma:stpa'
2.558195 OD b'-1:lemma:about'
2.551265 Gtype b'lemma:\xce\xb4soxr'
2.545283 Gtype b'-1:lemma:from'
2.537660 Med b'lemma:L'
2.537660 Med b'+1:lemma:broth'
2.520762 Temp b'-1:lemma:30'
2.512014 Supp b'+1:lemma:and'
2.485033 Gtype b'lemma:dfnr'
2.478336 Temp b'lemma:\xc2\xb0c'
2.477157 pH b'+1:postag:CD'
2.474581 O b'lemma:2-3'
2.467989 O b'lemma:Lrp'
2.464584 Med b'-1:lemma:LB'
2.446412 O b'+1:postag:VBP'
2.443891 Supp b'lemma:leucine'
2.443008 Air b'-1:lemma:-'
2.331881 Med b'lemma:broth'
2.331881 Med b'-1:lemma:L'
2.324108 Gtype b'+1:lemma:_'
2.320318 O b'-1:lemma:min'
2.319595 O b'+1:lemma:mid-log'
2.316477 Supp b'+1:lemma:iptg'
2.316285 O b'+1:lemma:43'
8.837637 Phase b'lemma:stationary'
8.799335 Supp b'lemma:Iron'
8.611049 O b'lemma:_'
7.279883 O b'lemma:1'
6.932654 Supp b'lemma:nitrate'
6.880712 Air b'lemma:anaerobic'
6.848692 Strain b'lemma:k-12'
6.839307 Air b'lemma:aerobic'
6.789788 Technique b'lemma:ChIP-exo'
6.727217 Phase b'lemma:mid-log'
6.413420 O b'lemma:rpob'
5.946980 O b'lemma:2'
5.848343 Technique b'lemma:chipseq'
5.826514 Substrain b'lemma:mg1655'
5.584982 Supp b'lemma:pq'
5.578193 O b'-1:lemma:tag'
5.564380 Gtype b'lemma:\xce\xb4cra'
5.533718 Air b'-1:lemma:ChIP-Seq'
5.522763 Gversion b'lemma:asm584v2'
5.497653 O b'lemma:3'
5.471837 Med b'lemma:MOPS'
5.411070 O b'lemma:\xcf\x8332'
5.308684 Gtype b'lemma:type'
5.245931 O b'-1:lemma:ChIP-exo'
5.210520 O b'lemma:rep1'
5.173302 Air b'lemma:Aerobic'
4.949891 O b'lemma:rep2'
4.893059 Med b'lemma:LB'
4.891835 O b'lemma:b'
4.883141 O b'postag:IN'
4.880173 Gtype b'lemma:flag-tag'
4.880173 Gtype b'-1:lemma:c-terminal'
4.852218 O b'lemma:rep3'
4.830297 OD b'lemma:od600'
4.826485 Supp b'lemma:nh4cl'
4.743281 Technique b'lemma:ChIP-Seq'
4.722036 O b'lemma:Custom'
4.717849 Gversion b'lemma:nc'
4.701135 Gtype b'+1:lemma:type'
4.682123 O b'postag::'
4.648660 Gtype b'-1:lemma:\xe2\x88\x86'
4.639269 Supp b'+1:lemma:\xc2\xb5m'
4.607690 O b'lemma:a'
4.570893 Med b'lemma:lb'
4.466395 O b'lemma:Cra'
4.390246 Supp b'lemma:glucose'
4.349340 Gtype b'lemma:arca8myc'
4.320335 Gtype b'lemma:wt'
4.311807 Gtype b'lemma:delta-arca'
4.197474 Technique b'lemma:rna-seq'
4.168693 O b'-1:lemma:Aerobic'
4.160315 Supp b'lemma:Fe'
4.109646 Gtype b'lemma:fnr8myc'
4.033076 OD b'lemma:od450'
3.947930 Gversion b'-1:lemma:nc'
3.908993 Anti b'lemma:none'
3.885757 O b'-1:lemma:0.3-0.35'
3.879994 Technique b'lemma:rnaseq'
3.842850 Supp b'lemma:dpd'
3.840223 Supp b'lemma:rifampicin'
3.804681 Vess b'lemma:flask'
3.804681 Vess b'-1:lemma:warm'
3.791974 Supp b'lemma:no3'
3.760306 O b'lemma:.'
3.760306 O b'postag:.'
3.728479 Technique b'lemma:chip-seq'
3.712550 Gtype b'lemma:\xe2\x88\x86'
3.655598 Gtype b'lemma:delta-fnr'
3.646988 Supp b'lemma:acetate'
3.634096 Gtype b'lemma:\xce\xb4fur'
3.586071 Gtype b'lemma:nsrr'
3.578964 OD b'+1:lemma:stationary'
3.567614 Med b'+1:lemma:0.4'
3.480912 Supp b'+1:lemma:1'
3.460781 Anti b'lemma:seqa'
3.449791 Supp b'lemma:arginine'
3.441583 Supp b'+1:lemma:hour'
3.432425 O b'lemma:-'
3.371367 O b'+1:lemma:od600'
3.362556 O b'-1:lemma:type'
3.291275 O b'lemma:or'
3.273720 O b'postag:VBN'
3.265269 Temp b'-1:lemma:\xcf\x8332'
3.250448 Supp b'lemma:fructose'
3.225849 Gtype b'+1:lemma:ph5'
3.222217 Temp b'-1:lemma:sample'
3.219063 Med b'lemma:m63'
3.216977 O b'lemma:CEL'
3.176530 Anti b'lemma:anti-myc'
3.146575 O b'+1:postag:RB'
3.134788 O b'-1:lemma:glucose'
3.125043 Gtype b'lemma:\xce\xb4ompr'
3.100972 Strain b'+1:lemma:substr'
3.072971 pH b'lemma:ph5'
3.072971 pH b'+1:lemma:.5'
3.067075 O b'-1:lemma:0.3'
3.036857 O b'lemma:chip'
3.030617 Supp b'-1:lemma:Cra'
3.025659 Gtype b'+1:lemma:with'
3.008031 Gversion b'lemma:chip-seq'
2.994019 Gversion b'lemma:u00096'
2.994019 Gversion b'+1:lemma:.2'
2.993336 Supp b'+1:lemma:2'
2.990986 Gtype b'lemma:wild-type'
2.989694 O b'-1:lemma:anaerobic'
2.983685 Anti b'+1:lemma:antibody'
2.981744 Technique b'+1:lemma:chip-exo'
2.956476 Gtype b'+1:lemma:pq'
2.936131 Technique b'-1:lemma:IP'
2.919804 Gtype b'-1:lemma:ptac'
2.910451 Med b'+1:lemma:minimal'
2.869576 Gversion b'lemma:000913'
2.862556 O b'lemma:s'
2.839985 O b'lemma:with'
2.828830 Gtype b'-1:lemma:rpob'
2.818885 Anti b'lemma:anti-rpos'
2.813806 Gtype b'+1:lemma:flagtag'
2.813297 O b'-1:lemma:lb'
2.741808 Temp b'-1:lemma:43'
2.719888 Supp b'-1:lemma:+'
2.682019 Technique b'-1:lemma:chip-exo'
2.665763 O b'+1:postag:NNP'
2.664036 O b'postag:CC'
2.648305 Supp b'lemma:nacl'
2.635798 Gversion b'lemma:.2'
2.635798 Gversion b'-1:lemma:u00096'
2.631519 OD b'-1:lemma:~'
2.630404 pH b'lemma:.5'
2.630404 pH b'-1:lemma:ph5'
2.610537 Temp b'-1:lemma:37'
2.585402 O b'postag:VBG'
2.582024 O b'lemma:oxyr'
2.534944 Gtype b'lemma:\xce\xb4soxs'
2.529286 Med b'lemma:media'
2.526833 O b'lemma:for'
2.522683 Temp b'lemma:\xc2\xb0c'
2.517678 O b'+1:lemma:pq'
2.481621 O b'postag:DT'
2.467547 Air b'postag:RB'
2.465592 Supp b'+1:lemma:_'
2.465328 Supp b'-1:lemma:\xc2\xb5m'
2.462075 Supp b'lemma:Leu'
2.457045 Air b'-1:lemma:-'
2.398092 Supp b'lemma:20'
2.393465 O b'-1:lemma:l1'
2.392516 OD b'lemma:0.3'
2.388541 O b'+1:lemma:chip-seq'
2.372930 O b'lemma:culture'
2.354906 Med b'+1:lemma:2.0'
2.354774 O b'lemma:2-3'
2.346860 O b'lemma:affyexp'
2.323757 Technique b'-1:lemma:input'
2.321220 Gtype b'lemma:pk4854'
2.318926 O b'+1:lemma:o.d.'
2.307787 Temp b'lemma:43'
2.301344 Med b'+1:lemma:g/l'
2.300110 Med b'-1:lemma:ml'
2.281743 Air b'lemma:anaerobically'
2.255382 Gtype b'lemma:deltaseqa'
2.255382 Gtype b'-1:lemma:old'
2.248647 Temp b'lemma:37'
2.228191 O b'lemma:ompr'
2.227705 O b'-1:lemma:\xc2\xb0c'
2.223375 Supp b'lemma:Adenine'
2.216690 Supp b'lemma:iptg'
2.192106 Gtype b'lemma:ptac'
2.185607 Phase b'-1:lemma:until'
2.150538 O b'-1:lemma:stpa'
2.139915 Gtype b'-1:lemma:nsrr'
2.138681 O b'+1:lemma:sparging'
2.124332 Med b'lemma:L'
2.124332 Med b'+1:lemma:broth'
2.090590 Air b'lemma:Anaerobic'
2.084963 O b'lemma:condition'
2.083373 Supp b'lemma:0.2'
2.071469 O b'lemma:at'
2.070008 O b'+1:lemma:anti-fur'
2.046312 O b'lemma:Lrp'
2.038220 Phase b'-1:lemma:mid-log'
2.029113 O b'lemma:chip-arca'
2.027744 Supp b'lemma:methanol'
2.017925 Technique b'+1:lemma:rna-seq'
2.017005 Substrain b'+1:lemma:phtpg'
2.011726 Med b'lemma:broth'
2.011726 Med b'-1:lemma:L'
1.998337 pH b'+1:postag:CD'
1.982325 O b'lemma:Fur'
1.968163 Med b'lemma:glucose'
1.939193 Gversion b'postag:CD'
1.930022 Phase b'+1:postag:NNS'
1.926820 O b'lemma:soxs'
1.926820 O b'lemma:soxr'
1.910127 Supp b'-1:lemma:with'
1.904564 Air b'lemma:anerobically'
1.901117 O b'lemma:genotype/variation'
1.899206 Gtype b'+1:lemma:_'
1.889629 Gtype b'lemma:WT'
1.854673 Phase b'+1:lemma:for'
1.839203 Temp b'-1:lemma:30'
1.838657 Temp b'+1:lemma:\xc2\xb0c'
Top negative:
0.000009 Anti b'+1:lemma:\xce\xb2'
0.000008 Anti b'+1:lemma:subunit'
0.000005 O b'-1:lemma:Deficient'
0.000001 OD b'+1:lemma:0.15'
-0.000001 Temp b'-1:postag:IN'
-0.000007 O b'lemma:medium'
-0.000045 O b'+1:lemma:rep1'
-0.000145 Gtype b'+1:lemma:2'
-0.000168 O b'+1:lemma:culture'
-0.000168 O b'+1:lemma:dissolve'
-0.000355 O b'-1:lemma:1'
-0.000451 OD b'+1:lemma:-lrb-'
-0.000593 O b'+1:lemma:c'
-0.000597 OD b'+1:postag:VBN'
-0.000854 Gtype b'+1:postag:NNS'
-0.001125 O b'lemma:10'
-0.001603 O b'-1:lemma:fresh'
-0.002085 Supp b'-1:lemma:-'
-0.002163 O b'+1:lemma:300'
-0.002264 Air b'-1:postag:NNP'
-0.002713 O b'+1:lemma:min'
-0.003522 Air b'+1:postag:-LRB-'
-0.003594 O b'-1:lemma:iptg'
-0.004379 O b'lemma:cell'
-0.004450 O b'+1:lemma:antibody'
-0.007530 Gtype b'-1:postag:NNP'
-0.011566 Air b'postag:CC'
-0.011603 O b'+1:lemma:a'
-0.011880 O b'+1:lemma:dpd'
-0.013535 OD b'postag:NNS'
-0.013622 Supp b'+1:lemma:glucose'
-0.013806 O b'-1:lemma:the'
-0.014085 O b'+1:lemma:25'
-0.014120 OD b'-1:postag:DT'
-0.016761 OD b'-1:lemma:a'
-0.021729 OD b'+1:postag:-LRB-'
-0.024283 O b'-1:lemma:25'
-0.024519 O b'postag:VBP'
-0.027011 OD b'+1:lemma:0.4'
-0.027020 O b'+1:lemma:co2'
-0.030020 O b'+1:lemma:mm'
-0.030904 Gtype b'postag:NNS'
-0.031338 O b'+1:lemma:grow'
-0.032633 Gtype b'-1:postag:NN'
-0.034461 Med b'-1:lemma:m63'
-0.038347 O b'lemma:coli'
-0.039331 Gtype b'+1:postag:IN'
-0.040098 Air b'+1:postag:NN'
-0.043802 O b'lemma:o2'
-0.044786 Anti b'-1:postag:NN'
-0.050998 Phase b'+1:postag:NN'
-0.053029 Supp b'-1:postag:VBG'
-0.059606 O b'+1:lemma:shake'
-0.060227 O b'lemma:\xc2\xb0c'
-0.061576 O b'+1:lemma:k-12'
-0.068548 O b'lemma:mg/ml'
-0.068548 O b'-1:lemma:150'
-0.071993 O b'-1:lemma:minimal'
-0.075882 OD b'+1:postag:CD'
-0.076224 O b'lemma:glucose'
-0.078957 O b'-1:lemma:at'
-0.082806 O b'lemma:grow'
-0.087424 OD b'-1:postag:NNS'
-0.090506 Supp b'-1:postag:NN'
-0.093124 Temp b'-1:lemma:\xc2\xb0c'
-0.093134 O b'-1:lemma:-lrb-'
-0.093606 O b'lemma:minimal'
-0.094232 O b'+1:lemma:o2'
-0.097879 O b'-1:lemma:mm'
-0.098068 Med b'-1:postag:NN'
-0.107118 O b'-1:lemma:o2'
-0.118175 O b'+1:lemma:phase'
-0.119815 Technique b'-1:lemma::'
-0.130823 Temp b'postag:JJ'
-0.132875 O b'+1:lemma:arginine'
-0.134855 O b'-1:lemma:30'
-0.146776 O b'lemma:aerobically'
-0.147575 O b'-1:lemma:n2'
-0.149484 OD b'postag:IN'
-0.156867 Air b'postag:CD'
-0.156918 O b'-1:lemma:from'
-0.166087 Supp b'+1:postag:IN'
-0.177934 O b'lemma:mg1655'
-0.179064 Anti b'+1:postag:JJ'
-0.179551 Supp b'lemma:and'
-0.188276 O b'-1:lemma:um'
-0.188276 O b'+1:lemma:paraquat'
-0.189403 O b'lemma:n2'
-0.195278 O b'lemma:\xce\xb4fur'
-0.198127 Med b'+1:postag:IN'
-0.214634 O b'+1:lemma:\xc2\xb0c'
-0.215441 O b'lemma:30'
-0.215519 O b'-1:lemma:e.'
-0.226406 O b'-1:postag:IN'
-0.226968 Gtype b'postag:CD'
-0.227233 Phase b'-1:lemma:at'
-0.230930 O b'-1:postag:VBN'
-0.231525 O b'-1:lemma:of'
-0.235093 O b'+1:postag:NNS'
-0.235942 O b'+1:lemma:5'
-0.237587 O b'+1:lemma:_'
-0.253207 Supp b'+1:lemma:rifampicin'
-0.254236 Gversion b'+1:postag:NN'
-0.261414 Med b'postag:CD'
-0.269201 O b'-1:postag:-LRB-'
-0.283772 O b'-1:lemma:od600'
-0.286133 O b'lemma:co2'
-0.286584 O b'+1:lemma:or'
-0.289081 O b'+1:lemma:-rrb-'
-0.293131 O b'+1:lemma:cell'
-0.293510 O b'-1:lemma:0.1'
-0.315643 O b'lemma:phase'
-0.317100 Air b'-1:postag:CC'
-0.328206 Supp b'postag:CC'
-0.328374 O b'-1:lemma:0.2'
-0.342964 Supp b'+1:postag:VBN'
-0.347291 O b'lemma:150'
-0.347291 O b'+1:lemma:mg/ml'
-0.349307 O b'lemma:od600'
-0.351495 OD b'postag:JJ'
-0.353086 Temp b'+1:lemma:to'
-0.353086 Temp b'+1:postag:TO'
-0.374885 O b'-1:lemma:mid-log'
-0.378947 Air b'-1:postag:JJ'
-0.382276 O b'postag:RB'
-0.384726 pH b'postag:NN'
-0.388651 O b'+1:lemma:until'
-0.395876 O b'lemma:e.'
-0.396410 O b'+1:lemma:.'
-0.396410 O b'+1:postag:.'
-0.419403 O b'-1:lemma:ml'
-0.438819 O b'lemma:anaerobic'
-0.441115 Agit b'postag:NN'
-0.458507 Med b'+1:postag:NN'
-0.467746 O b'-1:lemma:grow'
-0.468347 OD b'+1:lemma:and'
-0.477039 Anti b'+1:lemma:anti-fur'
-0.477272 O b'+1:postag:-RRB-'
-0.539475 Phase b'-1:postag:JJ'
-0.544246 O b'-1:lemma:rifampicin'
-0.554986 Technique b'-1:postag::'
-0.557503 O b'-1:lemma:~'
-0.566406 O b'-1:lemma:cra'
-0.585219 O b'-1:lemma:sample'
-0.592872 OD b'lemma:-lrb-'
-0.597579 O b'+1:lemma:0.3'
-0.637939 OD b'+1:postag:CC'
-0.640528 Air b'+1:postag:JJ'
-0.641855 O b'lemma:0.3'
-0.663280 O b'lemma:20'
-0.678531 O b'lemma:media'
-0.679754 O b'+1:postag:IN'
-0.692879 O b'+1:lemma:%'
-0.704594 O b'lemma:of'
-0.746312 O b'-1:lemma:co2'
-0.752462 O b'lemma:dissolve'
-0.774185 O b'+1:lemma:fecl2'
-0.784660 Med b'-1:postag:IN'
-0.813078 O b'-1:lemma:IP'
-0.845987 O b'lemma:dpd'
-0.856881 O b'+1:lemma:+'
-0.917781 O b'-1:postag:VBG'
-0.924251 O b'+1:lemma:g/l'
-0.950062 Temp b'postag:NN'
-0.956490 O b'-1:lemma:dissolve'
-0.956490 O b'+1:lemma:methanol'
-0.973571 OD b'+1:postag:NN'
-0.985083 O b'-1:lemma:rpob'
-1.088717 Supp b'+1:lemma:acetate'
-1.116443 O b'lemma:0.1'
-1.121770 O b'+1:lemma:at'
-1.139282 O b'lemma:fecl2'
-1.139658 O b'lemma:0.2'
-1.143368 O b'lemma:2h'
-1.143368 O b'-1:lemma:additional'
-1.162871 O b'lemma:mid-log'
-1.218300 O b'+1:lemma:in'
-1.230428 OD b'postag:-LRB-'
-1.237811 O b'+1:lemma:supplement'
-1.238950 O b'-1:lemma:37'
-1.269797 O b'+1:postag:VBG'
-1.280950 O b'lemma:anaerobically'
-1.360526 O b'lemma:37'
-1.412947 O b'-1:postag::'
-1.467612 O b'lemma:wt'
-1.469772 O b'+1:lemma:hour'
-1.551225 Supp b'-1:lemma:%'
-1.646983 O b'lemma:methanol'
-1.652478 O b'-1:lemma:nsrr'
-1.705441 Phase b'postag:JJ'
-1.865099 Anti b'postag:NNP'
-2.110303 Supp b'postag:JJ'
-2.251438 Air b'postag:NN'
-2.402454 O b'lemma:rifampicin'
-2.570647 O b'-1:lemma:ompr'
-2.620057 O b'-1:lemma:2'
-2.709520 O b'+1:lemma:2'
-3.092706 O b'+1:lemma:1'
-4.538028 O b'-1:lemma:_'
-4.976237 O b'-1:lemma::'
0.009154 Gtype b'-1:lemma:small'
0.008958 O b'-1:lemma:concentration'
0.008958 O b'+1:lemma:150'
0.008749 Supp b'+1:lemma:%'
0.008295 Gtype b'-1:postag:IN'
0.007225 Temp b'-1:postag:NN'
0.007001 O b'+1:lemma:dpd'
0.006253 O b'-1:lemma:to'
0.006253 O b'-1:postag:TO'
0.005971 O b'lemma:25'
0.005588 Supp b'-1:postag:VBN'
0.005564 Supp b'postag:NNP'
0.005481 Vess b'+1:postag:IN'
0.005374 Med b'-1:lemma:w2'
0.005034 Med b'-1:lemma:2'
0.004923 Phase b'+1:lemma:aerobically'
0.004818 Air b'-1:lemma:-lrb-'
0.004778 Phase b'+1:postag:RB'
0.002918 Supp b'+1:lemma:dpd'
0.001853 Supp b'-1:postag:NN'
0.001254 O b'-1:lemma:25'
0.001130 O b'+1:lemma:minute'
0.000839 Supp b'lemma:2'
0.000645 O b'lemma:250'
0.000633 O b'+1:lemma:use'
0.000599 OD b'+1:lemma:-rrb-'
0.000522 Gtype b'postag::'
0.000521 O b'lemma:contain'
0.000301 Air b'postag:CC'
0.000277 O b'-1:postag:DT'
0.000223 Air b'-1:lemma:and'
0.000188 O b'-1:lemma:Iron'
0.000172 Technique b'+1:lemma:-rrb-'
0.000156 O b'+1:lemma:um'
0.000120 Technique b'+1:postag:-RRB-'
0.000082 O b'lemma:fresh'
0.000007 O b'-1:lemma:chip'
0.000004 Technique b'-1:postag:NN'
0.000004 Gtype b'lemma:input'
0.000002 Supp b'+1:lemma:feso4'
-0.000001 Supp b'+1:lemma:-rrb-'
-0.000002 Supp b'+1:postag:-RRB-'
-0.000013 O b'+1:lemma:95'
-0.000014 Gtype b'+1:postag:NNS'
-0.000015 OD b'+1:postag:-LRB-'
-0.000019 Gtype b'postag:CD'
-0.000030 O b'lemma:purify'
-0.000053 O b'lemma:10'
-0.000099 O b'lemma:\xe2\x88\x86'
-0.000279 Temp b'postag:JJ'
-0.000305 O b'+1:lemma:0.4'
-0.000901 O b'-1:lemma:iptg'
-0.002039 OD b'+1:postag:NNS'
-0.002046 O b'+1:lemma:mm'
-0.002243 O b'-1:lemma:the'
-0.003015 O b'-1:lemma:with'
-0.004660 Technique b'-1:lemma::'
-0.005024 OD b'+1:lemma:of'
-0.006171 O b'+1:postag:CD'
-0.006255 Air b'+1:postag:-LRB-'
-0.006748 O b'+1:lemma:rep1'
-0.009757 O b'-1:lemma:g/l'
-0.010305 OD b'lemma:~'
-0.012303 Air b'+1:lemma:-lrb-'
-0.014317 O b'+1:lemma:25'
-0.017635 O b'lemma:lb'
-0.020425 O b'-1:postag:VBN'
-0.020857 Air b'-1:lemma:70'
-0.021641 OD b'+1:postag:CD'
-0.026926 Anti b'+1:postag:JJ'
-0.030050 O b'-1:lemma:rifampicin'
-0.030184 O b'+1:lemma:o2'
-0.033398 O b'+1:lemma:grow'
-0.034272 O b'lemma:o2'
-0.038973 O b'lemma:medium'
-0.041512 O b'+1:lemma:phase'
-0.047966 O b'+1:lemma:300'
-0.051332 O b'-1:lemma:mm'
-0.052636 O b'lemma:e.'
-0.055634 Med b'postag:CD'
-0.055801 Phase b'+1:postag:NN'
-0.062955 Air b'-1:postag:CC'
-0.065091 O b'-1:lemma:o2'
-0.065456 OD b'+1:lemma:and'
-0.079195 OD b'+1:lemma:0.4'
-0.085840 Med b'+1:postag:NN'
-0.089782 Gversion b'+1:postag:NN'
-0.090118 O b'-1:lemma:e.'
-0.091747 O b'+1:lemma:shake'
-0.096366 O b'+1:lemma:5'
-0.104686 OD b'postag:JJ'
-0.110082 O b'+1:lemma:-rrb-'
-0.117489 Phase b'-1:postag:NN'
-0.118330 Gtype b'-1:postag:CD'
-0.123321 Air b'-1:lemma:or'
-0.125308 O b'lemma:co2'
-0.126112 Air b'postag:CD'
-0.127371 O b'-1:lemma:from'
-0.128004 Supp b'lemma:and'
-0.138630 Med b'+1:postag:IN'
-0.140700 OD b'+1:postag:CC'
-0.141775 Med b'-1:postag:NN'
-0.143861 O b'lemma:grow'
-0.147202 O b'-1:lemma:um'
-0.147202 O b'+1:lemma:paraquat'
-0.151027 O b'-1:postag:IN'
-0.151499 Gtype b'-1:postag:NN'
-0.158428 Supp b'+1:lemma:rifampicin'
-0.162488 O b'-1:lemma:30'
-0.173747 O b'-1:lemma:1'
-0.185340 O b'-1:lemma:0.1'
-0.197510 O b'lemma:anaerobic'
-0.202853 Supp b'postag:CC'
-0.212861 O b'-1:lemma:-lrb-'
-0.215175 O b'-1:lemma:cra'
-0.224143 Supp b'+1:postag:VBN'
-0.230836 O b'-1:lemma:of'
-0.240457 O b'lemma:aerobically'
-0.244805 O b'+1:postag:IN'
-0.254690 Phase b'-1:lemma:at'
-0.255175 Temp b'postag:NN'
-0.261806 O b'+1:postag:NNS'
-0.267878 pH b'postag:NN'
-0.269047 O b'postag:VBP'
-0.270124 O b'lemma:150'
-0.270124 O b'+1:lemma:mg/ml'
-0.276353 O b'+1:lemma:until'
-0.286173 O b'+1:lemma:.'
-0.286173 O b'+1:postag:.'
-0.305770 O b'+1:lemma:%'
-0.305965 O b'-1:lemma:ml'
-0.324166 O b'lemma:media'
-0.339524 O b'lemma:phase'
-0.352773 O b'+1:lemma:arginine'
-0.363361 O b'lemma:\xce\xb4fur'
-0.388894 O b'lemma:dissolve'
-0.389770 O b'-1:postag:-LRB-'
-0.397946 O b'-1:lemma:mid-log'
-0.420065 O b'-1:lemma:~'
-0.440463 O b'+1:lemma:0.3'
-0.449972 O b'-1:lemma:od600'
-0.451810 O b'+1:postag:-RRB-'
-0.452722 Temp b'+1:lemma:to'
-0.452722 Temp b'+1:postag:TO'
-0.483420 OD b'+1:postag:NN'
-0.485997 Phase b'-1:postag:JJ'
-0.497094 O b'-1:lemma:0.2'
-0.501676 O b'lemma:od600'
-0.531049 O b'lemma:20'
-0.559644 O b'-1:lemma:grow'
-0.580617 O b'+1:lemma:\xc2\xb0c'
-0.620523 Technique b'-1:postag::'
-0.630289 O b'lemma:0.3'
-0.679102 Supp b'-1:lemma:%'
-0.685275 O b'lemma:anaerobically'
-0.715057 OD b'lemma:-lrb-'
-0.717401 O b'+1:lemma:fecl2'
-0.759134 O b'-1:lemma:37'
-0.770187 Air b'-1:postag:JJ'
-0.786415 O b'lemma:0.2'
-0.821217 O b'+1:postag:VBG'
-0.822213 O b'lemma:37'
-0.824982 O b'+1:lemma:supplement'
-0.842762 O b'-1:lemma:sample'
-0.857711 Supp b'+1:lemma:acetate'
-0.859301 O b'+1:lemma:cell'
-0.865248 O b'lemma:fecl2'
-0.895821 OD b'postag:-LRB-'
-0.909763 O b'-1:postag:VBG'
-0.924925 O b'lemma:of'
-0.938966 O b'+1:lemma:hour'
-0.948215 O b'lemma:2h'
-0.948215 O b'-1:lemma:additional'
-1.035032 O b'-1:lemma:co2'
-1.038239 O b'-1:lemma:rpob'
-1.049551 O b'-1:lemma:dissolve'
-1.049551 O b'+1:lemma:methanol'
-1.057377 O b'-1:postag::'
-1.072361 O b'lemma:mid-log'
-1.076264 O b'lemma:0.1'
-1.182064 O b'+1:lemma:+'
-1.269769 O b'+1:lemma:g/l'
-1.341512 O b'+1:lemma:at'
-1.349849 O b'-1:lemma:IP'
-1.412012 Air b'+1:postag:JJ'
-1.427656 O b'-1:lemma:ompr'
-1.459404 O b'lemma:wt'
-1.465487 Anti b'postag:NNP'
-1.539253 O b'lemma:rifampicin'
-1.604435 O b'lemma:methanol'
-1.624731 Supp b'postag:JJ'
-1.646056 O b'-1:lemma:nsrr'
-1.650493 Air b'postag:NN'
-1.947720 O b'+1:lemma:in'
-1.988778 O b'+1:lemma:2'
-2.105490 O b'+1:lemma:1'
-2.188210 O b'-1:lemma:2'
-2.454354 Phase b'postag:JJ'
-4.082146 O b'-1:lemma::'
-4.315245 O b'-1:lemma:_'
......
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.004866974423027767, 'c2': 0.056472219713063834}
best CV score:0.7979749356861161
model size: 0.13M
Flat F1: 0.788756583016598
precision recall f1-score support
OD 1.000 0.405 0.577 37
pH 1.000 1.000 1.000 12
Technique 0.952 0.909 0.930 22
Med 0.891 0.860 0.875 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.895 0.944 19
Air 0.754 0.742 0.748 62
Anti 1.000 0.444 0.615 9
Strain 1.000 1.000 1.000 1
Gtype 0.862 0.764 0.810 106
Substrain 0.000 0.000 0.000 1
Supp 0.865 0.662 0.750 136
Gversion 0.000 0.000 0.000 0
avg / total 0.876 0.735 0.789 480
Top likely transitions:
OD -> OD 5.351049
Med -> Med 4.871670
Temp -> Temp 4.705964
Air -> Air 4.663634
Anti -> Anti 4.552648
Agit -> Agit 4.406608
O -> O 4.159955
Gversion -> Gversion 4.029197
Phase -> Phase 3.961410
Gtype -> Gtype 3.736759
Supp -> Supp 3.715319
Technique -> Technique 2.638663
pH -> pH 2.247503
O -> Supp 1.602461
Substrain -> Gtype 1.572374
Gtype -> Supp 1.509554
Air -> O 1.254615
Technique -> Air 1.032953
O -> Gtype 1.031819
O -> Technique 0.950111
Gtype -> pH 0.787931
O -> Temp 0.697463
O -> Anti 0.689482
Gtype -> Air 0.553152
Med -> O 0.452122
O -> Strain 0.249152
O -> pH 0.230580
OD -> Phase 0.217826
Phase -> O 0.176822
O -> Vess 0.163152
O -> Gversion 0.124767
Supp -> O 0.087651
Temp -> O 0.034867
Strain -> Substrain -0.000001
Substrain -> Phase -0.000221
Strain -> Gversion -0.003698
Vess -> Technique -0.004821
Temp -> Substrain -0.012876
Agit -> Gversion -0.014323
Temp -> Strain -0.014360
Temp -> Vess -0.017410
Substrain -> Med -0.018817
pH -> Agit -0.019211
Med -> Agit -0.020010
Gversion -> Agit -0.021113
Phase -> Vess -0.022758
O -> Phase -0.024164
Med -> Strain -0.025997
pH -> Phase -0.028833
pH -> Anti -0.029581
Top unlikely transitions:
Technique -> Med -0.461151
O -> Agit -0.476494
Gtype -> Temp -0.480794
Technique -> O -0.518387
Gtype -> Phase -0.520282
Air -> Temp -0.525360
Gversion -> Technique -0.535188
Air -> Gtype -0.543291
Anti -> Gtype -0.553848
Technique -> Gversion -0.562140
OD -> Anti -0.571138
Gversion -> Air -0.589331
OD -> Temp -0.589841
Anti -> OD -0.591125
Supp -> pH -0.600581
Supp -> Phase -0.607554
Med -> Air -0.627218
OD -> Supp -0.663510
Air -> Supp -0.665817
OD -> Technique -0.667134
Air -> Med -0.686105
Gtype -> Technique -0.710838
Air -> OD -0.743300
Technique -> Supp -0.744356
Phase -> Technique -0.789682
Temp -> Med -0.799451
Supp -> Anti -0.809910
Supp -> Temp -0.821276
OD -> Med -0.825536
Gtype -> Gversion -0.857454
Supp -> OD -0.882092
Supp -> Technique -0.895485
Supp -> Air -0.917425
O -> Air -0.919505
Supp -> Gversion -0.925617
Gtype -> Med -0.929322
Supp -> Gtype -0.987028
OD -> Gtype -0.992669
Gtype -> Anti -1.017609
Agit -> O -1.031217
Gtype -> OD -1.100242
OD -> O -1.178810
Substrain -> O -1.224261
OD -> Air -1.229479
Supp -> Med -1.270572
Technique -> OD -1.299192
Technique -> Gtype -1.368938
Technique -> pH -1.381051
Med -> Supp -1.415487
Phase -> OD -1.647415
Top positive:
6.440045 O b'lemma:_'
5.284742 O b'lemma:1'
4.692157 Air b'lemma:anaerobic'
4.658957 O b'lemma:2'
4.619385 Technique b'lemma:ChIP-exo'
4.561015 Strain b'lemma:k-12'
4.494705 Supp b'lemma:Iron'
4.430737 Technique b'lemma:chipseq'
4.213284 O b'lemma:rpob'
4.193080 Air b'lemma:aerobic'
4.127725 Phase b'lemma:stationary'
4.112519 Supp b'lemma:pq'
4.107025 Supp b'lemma:nh4cl'
4.068762 O b'postag:IN'
3.990976 Supp b'lemma:glucose'
3.981614 O b'lemma:3'
3.895423 O b'lemma:rep1'
3.893328 Gtype b'lemma:arca8myc'
3.831178 Gtype b'lemma:wt'
3.766316 Gtype b'lemma:flag-tag'
3.766316 Gtype b'-1:lemma:c-terminal'
3.741501 Gtype b'lemma:\xce\xb4cra'
3.650417 Phase b'lemma:mid-log'
3.632631 O b'lemma:rep2'
3.630470 Substrain b'lemma:mg1655'
3.547965 Gversion b'lemma:asm584v2'
3.532543 Supp b'lemma:acetate'
3.517907 O b'lemma:Cra'
3.498084 Air b'-1:lemma:ChIP-Seq'
3.480891 Gtype b'-1:lemma:\xe2\x88\x86'
3.424575 Supp b'lemma:no3'
3.422537 Supp b'+1:lemma:\xc2\xb5m'
3.363386 Supp b'lemma:nitrate'
3.346533 O b'lemma:b'
3.329553 O b'-1:lemma:tag'
3.312533 O b'lemma:rep3'
3.288138 O b'postag::'
3.274111 O b'lemma:a'
3.231297 Technique b'lemma:rna-seq'
3.218715 O b'lemma:.'
3.218715 O b'postag:.'
3.215008 Gtype b'lemma:delta-arca'
3.202775 Supp b'lemma:Fe'
3.165237 Gtype b'lemma:fnr8myc'
3.155991 Air b'lemma:Aerobic'
3.133804 Supp b'lemma:dpd'
3.090343 Med b'lemma:LB'
3.073422 Technique b'lemma:chip-seq'
3.060962 Med b'lemma:lb'
3.050123 O b'postag:VBN'
3.028391 Med b'lemma:MOPS'
3.017487 O b'+1:postag:RB'
2.979906 Anti b'lemma:none'
2.978981 O b'-1:lemma:Aerobic'
2.962117 Supp b'lemma:fructose'
2.953345 O b'lemma:\xcf\x8332'
2.890455 Anti b'lemma:seqa'
2.860514 O b'-1:lemma:ChIP-exo'
2.856286 Gtype b'lemma:\xe2\x88\x86'
2.827313 O b'lemma:CEL'
2.783360 Technique b'lemma:rnaseq'
2.775420 Med b'+1:lemma:0.4'
2.774305 OD b'lemma:od600'
2.753373 O b'lemma:-'
2.742915 Supp b'lemma:rifampicin'
2.675772 Gtype b'lemma:delta-fnr'
2.630113 Supp b'+1:lemma:1'
2.629618 Supp b'+1:lemma:Deficient'
2.620392 Vess b'lemma:flask'
2.620392 Vess b'-1:lemma:warm'
2.618241 O b'lemma:affyexp'
2.609048 pH b'lemma:ph5'
2.609048 pH b'+1:lemma:.5'
2.605367 Temp b'lemma:\xc2\xb0c'
2.605338 Gtype b'+1:lemma:type'
2.604381 Gtype b'lemma:\xce\xb4fur'
2.603271 Air b'postag:RB'
2.594594 Gtype b'+1:lemma:with'
2.582369 O b'lemma:Custom'
2.567820 Gtype b'lemma:type'
2.567689 Gversion b'lemma:nc'
2.557861 Supp b'-1:lemma:Cra'
2.552038 OD b'lemma:od450'
2.550932 Gtype b'lemma:nsrr'
2.550177 Gversion b'lemma:chip-seq'
2.524549 O b'+1:lemma:od600'
2.502467 O b'-1:lemma:glucose'
2.498403 Gtype b'lemma:wild-type'
2.496663 Supp b'lemma:arginine'
2.495738 Supp b'+1:lemma:_'
2.483625 O b'lemma:chip-arca'
2.479625 O b'lemma:with'
2.455411 Supp b'+1:lemma:2'
2.454463 Gtype b'lemma:WT'
2.388316 O b'-1:lemma:stpa'
2.376289 O b'lemma:s'
2.368051 Phase b'-1:lemma:mid-log'
2.360684 Technique b'lemma:ChIP-Seq'
2.349033 O b'lemma:argr'
2.347947 Strain b'+1:lemma:substr'
2.329446 O b'lemma:oxyr'
2.326483 Gversion b'lemma:u00096'
2.326483 Gversion b'+1:lemma:.2'
2.322186 O b'-1:lemma:anaerobic'
2.319676 Anti b'lemma:anti-myc'
2.310676 Gversion b'lemma:.2'
2.310676 Gversion b'-1:lemma:u00096'
2.309895 Gtype b'lemma:\xce\xb4soxs'
2.304666 O b'-1:lemma:lb'
2.286012 Gversion b'-1:lemma:nc'
2.283995 Med b'+1:lemma:2.0'
2.263722 Gtype b'-1:lemma:ptac'
2.251060 Technique b'-1:lemma:IP'
2.241105 O b'postag:CC'
2.233213 O b'postag:SYM'
2.228846 Air b'lemma:Anaerobic'
2.221020 O b'+1:lemma:pq'
2.217171 O b'lemma:purr'
2.215541 Med b'lemma:m63'
2.210660 Gversion b'lemma:000913'
2.208620 Phase b'lemma:phase'
2.200256 Air b'lemma:anaerobically'
2.160285 Supp b'lemma:nacl'
2.159816 O b'lemma:Lrp'
2.146260 O b'+1:lemma:anti-fur'
2.142375 Gtype b'+1:lemma:pq'
2.137685 O b'lemma:ompr'
2.137493 O b'-1:lemma:0.3-0.35'
2.135033 pH b'+1:postag:CD'
2.132965 Gtype b'+1:lemma:flagtag'
2.132516 Air b'-1:lemma:-'
2.129831 O b'lemma:or'
2.127593 Air b'-1:postag::'
2.100892 Technique b'postag:NNP'
2.095024 Air b'-1:lemma:_'
2.079808 Gtype b'lemma:ptac'
2.078817 Med b'postag:NNP'
2.065995 Supp b'lemma:Leu'
2.045237 O b'lemma:chip'
2.027925 Temp b'lemma:43'
2.022011 Gtype b'lemma:\xce\xb4ompr'
2.015716 Supp b'-1:lemma:+'
2.010073 Substrain b'+1:lemma:phtpg'
2.008340 Temp b'-1:lemma:37'
2.004601 Temp b'-1:lemma:43'
1.996465 Gtype b'lemma:deltaseqa'
1.996465 Gtype b'-1:lemma:old'
1.991818 Anti b'+1:lemma:antibody'
1.986009 Gtype b'lemma:pk4854'
1.981713 Technique b'-1:lemma:input'
1.981625 Med b'+1:lemma:+'
1.979648 Gtype b'-1:lemma:rpob'
1.974870 Gtype b'-1:lemma:_'
1.973288 O b'lemma:chip-fnr'
1.969889 Temp b'+1:lemma:\xc2\xb0c'
1.968489 O b'-1:lemma:type'
1.959681 Supp b'lemma:iptg'
1.950150 Gtype b'+1:lemma:_'
1.947863 Supp b'lemma:Adenine'
1.947687 Technique b'-1:lemma:chip-exo'
1.941978 Anti b'lemma:anti-rpos'
1.937288 Med b'-1:lemma:ml'
1.924562 Gtype b'+1:lemma:aerobic'
1.924487 Phase b'+1:lemma:for'
1.922675 O b'postag:DT'
1.914419 Supp b'+1:lemma:hour'
1.913395 O b'+1:lemma:43'
1.912727 O b'lemma:Fur'
1.876476 O b'lemma:genotype/variation'
1.869806 Supp b'-1:lemma:\xc2\xb5m'
1.868961 O b'+1:lemma:mid-log'
1.867289 O b'+1:lemma:chip-seq'
1.863790 Supp b'lemma:methanol'
1.861757 Supp b'lemma:20'
1.857902 Supp b'-1:lemma:with'
1.856991 OD b'+1:lemma:stationary'
1.852369 Temp b'-1:lemma:sample'
1.848158 Gversion b'+1:lemma:000913'
1.846987 Gtype b'-1:lemma:nsrr'
1.845305 O b'lemma:for'
1.843025 Technique b'+1:lemma:chip-exo'
1.842623 O b'postag:VBG'
1.827664 Gversion b'postag:CD'
1.820283 O b'lemma:soxs'
1.820283 O b'lemma:soxr'
1.820233 Gtype b'+1:lemma:ph5'
1.815561 Supp b'+1:lemma:respiratory'
1.810671 O b'lemma:culture'
1.809579 pH b'lemma:.5'
1.809579 pH b'-1:lemma:ph5'
1.802708 Gtype b'lemma:\xce\xb4oxyr'
1.802434 Temp b'lemma:37'
1.802103 Med b'+1:lemma:minimal'
1.788823 Gtype b'lemma:\xce\xb4soxr'
1.787884 Supp b'+1:lemma:deficient'
1.781577 O b'lemma:at'
1.774963 O b'lemma:pt7'
1.766232 Vess b'-1:postag:VBN'
1.758278 Gversion b'lemma:_'
1.754083 Supp b'+1:lemma:and'
Top negative:
-0.165340 O b'-1:lemma:with'
-0.170223 Phase b'+1:postag:NN'
-0.171143 Med b'-1:lemma:MOPS'
-0.171691 O b'lemma:co2'
-0.172496 O b'+1:lemma:antibody'
-0.173573 O b'-1:lemma:control'
-0.175923 O b'-1:postag:-LRB-'
-0.178273 O b'+1:lemma:purify'
-0.178964 Gtype b'+1:lemma:1'
-0.179388 O b'lemma:medium'
-0.190175 Gtype b'+1:lemma:-lrb-'
-0.193476 Anti b'+1:postag:JJ'
-0.194108 O b'+1:lemma:2.0'
-0.195669 O b'lemma:n2'
-0.198645 O b'-1:lemma:300'
-0.201659 O b'-1:lemma:of'
-0.210827 O b'lemma:aerobically'
-0.216287 O b'+1:lemma:pahse'
-0.216954 Gtype b'+1:lemma:2'
-0.222719 Technique b'-1:lemma::'
-0.225921 Gtype b'lemma:rna'
-0.227807 O b'+1:lemma:sample'
-0.229277 Gtype b'+1:postag:NNS'
-0.232261 O b'-1:lemma:n2'
-0.233570 Gtype b'-1:lemma:-'
-0.237526 OD b'+1:lemma:in'
-0.240536 Gtype b'lemma:control'
-0.242225 Phase b'-1:postag:NN'
-0.252367 O b'-1:lemma:delta'
-0.255317 O b'-1:postag:VBP'
-0.255936 O b'-1:lemma:rna'
-0.260735 Gtype b'postag:NNS'
-0.263059 O b'-1:lemma:e.'
-0.265319 O b'+1:lemma:from'
-0.273429 O b'-1:lemma:minimal'
-0.276572 O b'lemma:e.'
-0.276704 Gtype b'-1:lemma:,'
-0.276704 Gtype b'-1:postag:,'
-0.279370 O b'postag:RB'
-0.280295 O b'-1:lemma:grow'
-0.282926 O b'+1:lemma:mg1655'
-0.288333 O b'lemma:10'
-0.289288 O b'lemma:pahse'
-0.291441 Gtype b'+1:lemma:cra'
-0.295834 Air b'postag:CD'
-0.300317 O b'lemma:nacl'
-0.302273 Supp b'+1:postag:IN'
-0.304479 O b'lemma:30'
-0.305051 O b'-1:lemma:purify'
-0.306221 OD b'+1:lemma:0.4'
-0.306561 OD b'+1:lemma:and'
-0.315073 Supp b'lemma:and'
-0.317269 O b'-1:lemma:0.1'
-0.320606 O b'+1:lemma:delta'
-0.324445 O b'+1:lemma:%'
-0.328680 O b'+1:lemma:or'
-0.335995 Gtype b'lemma:ompr'
-0.337994 Med b'postag:CD'
-0.339794 O b'+1:lemma:-lcb-'
-0.341876 O b'+1:postag:-RRB-'
-0.348075 OD b'+1:postag:CC'
-0.350623 O b'+1:lemma:strain'
-0.351953 O b'-1:lemma:mm'
-0.354366 Med b'+1:postag:NN'
-0.359119 Gtype b'+1:lemma:a'
-0.368580 Med b'-1:postag:CD'
-0.369042 O b'-1:lemma:mid-log'
-0.369832 O b'+1:lemma:phase'
-0.374612 O b'-1:lemma:um'
-0.374612 O b'+1:lemma:paraquat'
-0.378047 Gtype b'-1:postag:CD'
-0.378990 O b'lemma:\xc2\xb0c'
-0.382063 O b'+1:lemma:cell'
-0.383941 O b'lemma:minimal'
-0.383980 Temp b'postag:JJ'
-0.384553 O b'+1:lemma:dissolve'
-0.390868 O b'+1:lemma:until'
-0.397770 Technique b'-1:postag::'
-0.403782 O b'+1:postag:IN'
-0.420663 Supp b'+1:lemma:glucose'
-0.421882 O b'-1:lemma:fresh'
-0.423208 O b'-1:lemma:iptg'
-0.425203 O b'lemma:8'
-0.425322 O b'lemma:phase'
-0.426379 Gtype b'+1:lemma:b'
-0.436102 O b'+1:lemma:shake'
-0.441221 O b'-1:lemma:rifampicin'
-0.444583 Air b'-1:lemma:or'
-0.447161 Supp b'-1:postag:VBG'
-0.448411 Med b'+1:postag:NNS'
-0.460422 O b'-1:lemma:affinity'
-0.461216 Supp b'+1:postag:VBN'
-0.467958 O b'-1:lemma:cra'
-0.469465 O b'+1:lemma:minimal'
-0.469624 Supp b'-1:lemma:%'
-0.477155 O b'-1:lemma:20'
-0.479874 O b'lemma:of'
-0.505244 O b'lemma:glucose'
-0.508080 O b'-1:lemma:from'
-0.508329 Phase b'postag:JJ'
-0.519825 O b'lemma:mg1655'
-0.520316 O b'+1:lemma:0.4'
-0.531961 Gtype b'lemma:_'
-0.540846 O b'lemma:dissolve'
-0.541927 Temp b'+1:lemma:to'
-0.541927 Temp b'+1:postag:TO'
-0.543538 OD b'+1:lemma:mid-log'
-0.554268 Phase b'-1:lemma:at'
-0.567076 O b'lemma:150'
-0.567076 O b'+1:lemma:mg/ml'
-0.586115 O b'+1:lemma:Aerobic'
-0.590065 OD b'+1:postag:NN'
-0.591060 O b'+1:lemma:b'
-0.601984 OD b'lemma:-lrb-'
-0.602651 O b'-1:lemma:30'
-0.610779 Gtype b'-1:postag:SYM'
-0.611922 O b'-1:lemma:chip-exo'
-0.624890 pH b'postag:NN'
-0.628877 Supp b'postag:CC'
-0.642872 O b'lemma:lb'
-0.645246 O b'+1:lemma:rep1'
-0.646910 O b'+1:postag:NNS'
-0.648451 Gtype b'-1:postag:DT'
-0.656497 O b'+1:lemma:c'
-0.671297 Temp b'-1:lemma:\xc2\xb0c'
-0.672555 Supp b'+1:lemma:rifampicin'
-0.675146 Med b'+1:postag:IN'
-0.684210 OD b'postag:-LRB-'
-0.690268 O b'lemma:m63'
-0.692418 O b'lemma:purify'
-0.711910 O b'-1:lemma:g/l'
-0.714120 O b'+1:lemma:300'
-0.719637 O b'+1:lemma:arginine'
-0.720246 Temp b'postag:NN'
-0.723885 Gtype b'+1:lemma:\xe2\x88\x86'
-0.729214 O b'-1:lemma:until'
-0.731048 O b'+1:lemma:fecl2'
-0.733838 O b'-1:lemma:1'
-0.754956 O b'+1:lemma:\xc2\xb0c'
-0.760036 O b'-1:lemma:od600'
-0.785671 Anti b'+1:lemma:anti-fur'
-0.789666 OD b'postag:JJ'
-0.822362 O b'lemma:dpd'
-0.825176 O b'-1:lemma:o2'
-0.856382 O b'-1:lemma:~'
-0.858874 O b'lemma:od600'
-0.861229 O b'+1:lemma:0.3'
-0.867648 O b'lemma:media'
-0.877526 O b'+1:lemma:in'
-0.899345 O b'+1:lemma:at'
-0.903562 Gtype b'lemma:delta'
-0.909951 O b'-1:lemma:0.2'
-0.924018 O b'-1:lemma:\xe2\x88\x86'
-0.936952 Phase b'-1:postag:JJ'
-0.937687 O b'lemma:anaerobically'
-0.958929 O b'lemma:0.3'
-0.977286 Air b'-1:postag:JJ'
-0.979403 O b'lemma:20'
-0.989887 O b'lemma:0.1'
-1.003141 O b'lemma:mid-log'
-1.016700 Supp b'+1:lemma:acetate'
-1.042214 O b'lemma:2h'
-1.042214 O b'-1:lemma:additional'
-1.072377 O b'+1:postag:VBG'
-1.075398 O b'-1:lemma:dissolve'
-1.075398 O b'+1:lemma:methanol'
-1.082645 O b'+1:lemma:g/l'
-1.096557 O b'lemma:anaerobic'
-1.126451 O b'lemma:0.2'
-1.166660 O b'lemma:\xe2\x88\x86'
-1.172209 O b'lemma:fecl2'
-1.173636 O b'+1:lemma:supplement'
-1.193870 O b'-1:postag:VBG'
-1.194541 O b'-1:lemma:ompr'
-1.232022 O b'lemma:k-12'
-1.253980 O b'lemma:\xce\xb4fur'
-1.288532 O b'-1:lemma:ml'
-1.301101 O b'postag:VBP'
-1.312157 O b'-1:lemma:co2'
-1.347620 O b'-1:lemma:rpob'
-1.379029 O b'-1:postag::'
-1.416689 Supp b'postag:JJ'
-1.422574 O b'-1:lemma:37'
-1.454115 O b'-1:lemma:sample'
-1.461328 O b'lemma:37'
-1.464702 Anti b'postag:NNP'
-1.488429 Air b'+1:postag:JJ'
-1.542774 O b'lemma:rifampicin'
-1.620387 O b'-1:lemma:2'
-1.621084 O b'lemma:wt'
-1.634867 Air b'postag:NN'
-1.635440 O b'-1:lemma:IP'
-1.705295 O b'lemma:methanol'
-1.742392 O b'+1:lemma:+'
-1.747036 O b'-1:lemma:nsrr'
-1.856713 O b'+1:lemma:hour'
-1.966783 O b'+1:lemma:2'
-2.387888 O b'+1:lemma:1'
-2.893303 O b'-1:lemma::'
-2.945684 O b'-1:lemma:_'
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.04733824675634195, 'c2': 0.013567747033585223}
best CV score:0.7954499755233463
model size: 0.08M
best params:{'c1': 0.29457600411613616, 'c2': 0.0017589762043383245}
best CV score:0.8078796055237475
model size: 0.05M
Flat F1: 0.8073047538765561
Flat F1: 0.7794612343667667
precision recall f1-score support
OD 1.000 0.405 0.577 37
pH 1.000 1.000 1.000 12
Technique 0.952 0.909 0.930 22
Med 0.891 0.860 0.875 57
Med 1.000 0.737 0.848 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.947 0.973 19
Air 0.939 0.742 0.829 62
Anti 1.000 0.444 0.615 9
Phase 1.000 0.895 0.944 19
Air 0.780 0.742 0.760 62
Anti 0.571 0.444 0.500 9
Strain 1.000 1.000 1.000 1
Gtype 0.865 0.783 0.822 106
Gtype 0.848 0.792 0.820 106
Substrain 0.000 0.000 0.000 1
Supp 0.869 0.684 0.765 136
Supp 0.796 0.662 0.723 136
Gversion 0.000 0.000 0.000 0
avg / total 0.901 0.748 0.807 480
avg / total 0.861 0.727 0.779 480
Top likely transitions:
Agit -> Agit 6.351306
OD -> OD 6.016578
Temp -> Temp 5.927690
Anti -> Anti 5.530188
Med -> Med 5.290933
Air -> Air 4.824974
Gversion -> Gversion 4.795717
Phase -> Phase 4.587222
O -> O 4.562384
Gtype -> Gtype 4.485788
Supp -> Supp 4.175027
Technique -> Technique 3.738966
pH -> pH 2.445982
Substrain -> Gtype 1.983414
O -> Supp 1.704431
Gtype -> Supp 1.702624
Technique -> Air 1.053845
O -> Technique 1.011581
O -> Gtype 0.959004
O -> Temp 0.852096
Air -> O 0.791615
Gtype -> pH 0.696397
O -> Anti 0.684439
O -> Gversion 0.269497
Gtype -> Air 0.261457
O -> Strain 0.143898
Med -> O 0.029331
O -> pH 0.007540
O -> Vess 0.000124
O -> Med 0.000090
Temp -> O 0.000022
Phase -> O -0.002114
Vess -> O -0.020913
O -> Phase -0.027016
Anti -> Gtype -0.034769
Gversion -> Air -0.042314
Phase -> Air -0.063658
O -> Agit -0.107236
OD -> Technique -0.108455
Supp -> pH -0.117168
Gversion -> O -0.140630
Anti -> O -0.151755
Gtype -> Technique -0.152014
Supp -> Phase -0.214979
OD -> Supp -0.232643
O -> OD -0.260286
Supp -> Anti -0.275132
Gtype -> Phase -0.278437
Technique -> O -0.314521
Phase -> Technique -0.315599
OD -> OD 6.390430
Agit -> Agit 6.117830
Temp -> Temp 5.690422
Anti -> Anti 5.526528
Med -> Med 5.389776
Gtype -> Gtype 5.136395
Air -> Air 4.861639
Gversion -> Gversion 4.681583
Technique -> Technique 4.547400
O -> O 4.328164
Supp -> Supp 4.275170
Phase -> Phase 3.947478
O -> Supp 2.168179
Gtype -> Supp 2.126815
pH -> pH 1.951624
O -> Technique 1.752428
O -> Gtype 1.686100
Air -> O 1.391236
Substrain -> Gtype 0.941140
O -> Anti 0.799854
Med -> O 0.671251
O -> Temp 0.557904
O -> Gversion 0.509095
Technique -> Air 0.285589
Gtype -> pH 0.187722
Temp -> O 0.127072
Supp -> O 0.081093
O -> OD 0.056972
Gtype -> Air 0.021236
O -> Med 0.002225
OD -> Phase 0.001636
OD -> Med -0.056726
Technique -> O -0.084720
Gtype -> Anti -0.290184
Gtype -> O -0.349078
Gtype -> OD -0.351477
OD -> O -0.547705
O -> Air -0.672320
Supp -> Med -0.757781
Substrain -> O -0.945716
Phase -> OD -0.974380
Agit -> O -1.057441
Med -> Supp -1.117202
Top unlikely transitions:
Phase -> O -0.002114
Vess -> O -0.020913
O -> Phase -0.027016
Anti -> Gtype -0.034769
Gversion -> Air -0.042314
Phase -> Air -0.063658
O -> Agit -0.107236
OD -> Technique -0.108455
Supp -> pH -0.117168
Gversion -> O -0.140630
Anti -> O -0.151755
Gtype -> Technique -0.152014
Supp -> Phase -0.214979
OD -> Supp -0.232643
O -> OD -0.260286
Supp -> Anti -0.275132
Gtype -> Phase -0.278437
Technique -> O -0.314521
Phase -> Technique -0.315599
Supp -> O -0.331781
Med -> Air -0.373175
Supp -> Temp -0.406898
Gtype -> O -0.442607
Temp -> Med -0.464337
Gtype -> Gversion -0.493751
Supp -> Gversion -0.560400
Anti -> OD -0.563611
Supp -> Technique -0.605347
Gtype -> Med -0.614663
Supp -> OD -0.660842
Air -> Supp -0.707856
OD -> Air -0.738038
OD -> Gtype -0.750328
Supp -> Gtype -0.775491
Supp -> Air -0.783032
Gtype -> Anti -0.848608
Air -> Med -0.863324
OD -> Med -0.930579
Agit -> O -0.969044
Air -> OD -0.995424
Technique -> pH -1.068524
OD -> O -1.148371
O -> Air -1.151845
Technique -> OD -1.233856
Gtype -> OD -1.268038
Technique -> Gtype -1.279158
Substrain -> O -1.352003
Supp -> Med -1.440706
Med -> Supp -1.997092
Phase -> OD -2.488972
OD -> OD 6.390430
Agit -> Agit 6.117830
Temp -> Temp 5.690422
Anti -> Anti 5.526528
Med -> Med 5.389776
Gtype -> Gtype 5.136395
Air -> Air 4.861639
Gversion -> Gversion 4.681583
Technique -> Technique 4.547400
O -> O 4.328164
Supp -> Supp 4.275170
Phase -> Phase 3.947478
O -> Supp 2.168179
Gtype -> Supp 2.126815
pH -> pH 1.951624
O -> Technique 1.752428
O -> Gtype 1.686100
Air -> O 1.391236
Substrain -> Gtype 0.941140
O -> Anti 0.799854
Med -> O 0.671251
O -> Temp 0.557904
O -> Gversion 0.509095
Technique -> Air 0.285589
Gtype -> pH 0.187722
Temp -> O 0.127072
Supp -> O 0.081093
O -> OD 0.056972
Gtype -> Air 0.021236
O -> Med 0.002225
OD -> Phase 0.001636
OD -> Med -0.056726
Technique -> O -0.084720
Gtype -> Anti -0.290184
Gtype -> O -0.349078
Gtype -> OD -0.351477
OD -> O -0.547705
O -> Air -0.672320
Supp -> Med -0.757781
Substrain -> O -0.945716
Phase -> OD -0.974380
Agit -> O -1.057441
Med -> Supp -1.117202
Top positive:
8.290919 O b'lemma:_'
7.385787 Phase b'lemma:stationary'
7.051234 O b'lemma:1'
6.894708 Supp b'lemma:Iron'
6.675567 Air b'lemma:anaerobic'
6.403841 Air b'lemma:aerobic'
6.381259 Technique b'lemma:ChIP-exo'
6.295199 Strain b'lemma:k-12'
6.076363 O b'lemma:rpob'
6.004917 O b'lemma:2'
5.997376 Technique b'lemma:chipseq'
5.756531 Supp b'lemma:pq'
5.480849 O b'lemma:3'
5.419549 Air b'-1:lemma:ChIP-Seq'
5.377608 O b'-1:lemma:tag'
5.236921 Gversion b'lemma:asm584v2'
5.220500 Supp b'lemma:nitrate'
5.194599 Gtype b'lemma:\xce\xb4cra'
5.105810 O b'lemma:rep1'
5.072402 Phase b'lemma:mid-log'
5.067722 O b'postag:IN'
5.062697 Med b'lemma:MOPS'
5.031333 Supp b'lemma:nh4cl'
5.013490 Gtype b'lemma:arca8myc'
5.000342 Gtype b'lemma:flag-tag'
5.000342 Gtype b'-1:lemma:c-terminal'
4.890613 O b'lemma:rep2'
4.886114 Substrain b'lemma:mg1655'
4.864909 Supp b'lemma:glucose'
4.809146 Supp b'+1:lemma:\xc2\xb5m'
4.725613 Air b'lemma:Aerobic'
4.660445 O b'lemma:rep3'
4.614931 Med b'lemma:LB'
4.549528 O b'lemma:Cra'
4.411392 Gtype b'lemma:wt'
4.409856 Technique b'lemma:rna-seq'
4.384311 Gtype b'-1:lemma:\xe2\x88\x86'
4.354696 O b'lemma:b'
4.328794 Supp b'lemma:acetate'
4.303499 Gtype b'lemma:delta-arca'
4.292242 O b'lemma:Custom'
4.271514 O b'-1:lemma:ChIP-exo'
4.249183 Gtype b'lemma:fnr8myc'
4.166692 O b'postag::'
4.162283 Supp b'lemma:no3'
4.142997 Technique b'lemma:chip-seq'
4.139547 O b'lemma:\xcf\x8332'
4.132690 Supp b'-1:lemma:Cra'
4.123280 Supp b'lemma:Fe'
4.117229 Anti b'lemma:none'
4.089970 O b'-1:lemma:Aerobic'
4.070800 O b'lemma:a'
4.053427 Technique b'lemma:rnaseq'
3.997780 O b'lemma:.'
3.997780 O b'postag:.'
3.955278 OD b'lemma:od450'
3.952430 Med b'lemma:lb'
3.926643 Anti b'lemma:seqa'
3.901600 O b'+1:postag:RB'
3.860379 Supp b'lemma:fructose'
3.843887 O b'+1:lemma:od600'
3.818270 Gversion b'lemma:nc'
3.774402 Gtype b'lemma:type'
3.769802 Gtype b'lemma:delta-fnr'
3.749008 Med b'+1:lemma:0.4'
3.723936 Gtype b'+1:lemma:type'
3.716300 Gtype b'lemma:\xe2\x88\x86'
3.702464 Air b'postag:RB'
3.701643 Supp b'lemma:rifampicin'
3.698023 Gversion b'lemma:chip-seq'
3.685933 O b'lemma:-'
3.684595 O b'-1:lemma:0.3-0.35'
3.676777 Supp b'lemma:dpd'
3.644945 OD b'lemma:od600'
3.635765 Technique b'lemma:ChIP-Seq'
3.623886 O b'lemma:CEL'
3.599273 Supp b'+1:lemma:1'
3.576564 OD b'+1:lemma:stationary'
3.566248 Gtype b'lemma:\xce\xb4fur'
3.461638 O b'-1:lemma:anaerobic'
3.459278 Gtype b'lemma:nsrr'
3.356330 pH b'lemma:ph5'
3.356330 pH b'+1:lemma:.5'
3.352106 O b'-1:lemma:glucose'
3.340294 Supp b'+1:lemma:Deficient'
3.338469 Supp b'lemma:arginine'
3.337805 Gtype b'+1:lemma:with'
3.333928 Strain b'+1:lemma:substr'
3.322235 Anti b'lemma:anti-myc'
3.308233 Gtype b'lemma:wild-type'
3.291619 O b'lemma:with'
3.274998 Vess b'lemma:flask'
3.274998 Vess b'-1:lemma:warm'
3.203208 Supp b'+1:lemma:2'
3.169852 Med b'lemma:m63'
3.132500 Gtype b'lemma:\xce\xb4soxs'
3.105860 Med b'+1:lemma:2.0'
3.077793 Gtype b'lemma:WT'
3.074708 O b'lemma:oxyr'
3.065934 Anti b'+1:lemma:antibody'
3.065570 O b'lemma:s'
3.051751 O b'-1:lemma:type'
3.050447 O b'+1:lemma:o.d.'
3.033846 Technique b'-1:lemma:IP'
3.021636 O b'lemma:chip-arca'
3.007962 Gtype b'lemma:\xce\xb4ompr'
2.993470 O b'-1:lemma:stpa'
2.985907 O b'-1:lemma:lb'
2.982505 O b'lemma:chip'
2.979425 O b'lemma:for'
2.977744 O b'lemma:affyexp'
2.974504 Gversion b'lemma:u00096'
2.974504 Gversion b'+1:lemma:.2'
2.951628 Supp b'lemma:nacl'
2.929411 Supp b'+1:lemma:hour'
2.918651 Med b'-1:lemma:ml'
2.914880 Gversion b'lemma:.2'
2.914880 Gversion b'-1:lemma:u00096'
2.913751 O b'lemma:or'
2.911773 O b'postag:VBN'
2.882260 O b'+1:lemma:anti-fur'
2.876894 O b'+1:lemma:chip-seq'
2.868995 Gtype b'-1:lemma:ptac'
2.866722 Temp b'lemma:\xc2\xb0c'
2.863424 Supp b'+1:lemma:_'
2.862778 O b'lemma:ompr'
2.834787 Air b'lemma:Anaerobic'
2.827994 Gversion b'-1:lemma:nc'
2.824064 Temp b'-1:lemma:43'
2.820717 O b'lemma:argr'
2.820412 Gversion b'lemma:000913'
2.749427 Anti b'lemma:anti-rpos'
2.734729 Gtype b'+1:lemma:flagtag'
2.732480 Supp b'-1:lemma:+'
2.727515 O b'lemma:Lrp'
2.719436 Phase b'+1:lemma:for'
2.711551 Temp b'lemma:43'
2.711404 Gtype b'lemma:deltaseqa'
2.711404 Gtype b'-1:lemma:old'
2.703630 Gtype b'lemma:pk4854'
2.700766 O b'+1:lemma:pq'
2.675879 Air b'lemma:anaerobically'
2.664358 Gtype b'+1:lemma:pq'
2.656000 Technique b'-1:lemma:input'
2.651505 Temp b'-1:lemma:37'
2.648470 O b'lemma:2-3'
2.620313 Temp b'lemma:37'
2.617008 Substrain b'+1:lemma:phtpg'
2.612535 Technique b'-1:lemma:chip-exo'
2.596752 Med b'+1:lemma:minimal'
2.596648 O b'-1:lemma:dpd'
2.596120 O b'lemma:at'
2.593521 O b'postag:SYM'
2.572579 Gtype b'-1:lemma:rpob'
2.572348 O b'postag:CC'
2.562481 O b'lemma:purr'
2.559444 Gtype b'lemma:ptac'
2.547961 O b'postag:DT'
2.528953 Temp b'-1:lemma:sample'
2.519081 Gtype b'+1:lemma:ph5'
2.510093 O b'lemma:soxs'
2.510093 O b'lemma:soxr'
2.489436 pH b'lemma:.5'
2.489436 pH b'-1:lemma:ph5'
2.486692 O b'+1:lemma:sparging'
2.468346 Air b'lemma:anerobically'
2.466200 Gtype b'lemma:\xce\xb4oxyr'
2.460573 O b'-1:lemma:l1'
2.435676 Supp b'lemma:iptg'
2.396322 Air b'-1:lemma:-'
2.381121 Technique b'+1:lemma:chip-exo'
2.375332 Med b'postag:NNP'
2.369739 Supp b'lemma:Leu'
2.367468 Temp b'-1:lemma:\xcf\x8332'
2.358408 O b'lemma:Fur'
2.318420 Supp b'lemma:Adenine'
2.308664 Gtype b'+1:lemma:aerobic'
2.284972 pH b'+1:postag:CD'
2.278223 O b'-1:lemma:0.3'
2.275175 O b'+1:lemma:mid-log'
2.272071 Med b'lemma:L'
2.272071 Med b'+1:lemma:broth'
2.271694 Gversion b'+1:lemma:000913'
2.263241 Temp b'+1:lemma:\xc2\xb0c'
2.251200 Gtype b'lemma:\xce\xb4soxr'
2.250951 Med b'-1:lemma:LB'
2.232437 Phase b'lemma:phase'
2.225558 O b'-1:lemma:\xc2\xb0c'
2.210922 O b'lemma:pt7'
2.195220 Med b'lemma:glucose'
2.189252 Technique b'postag:NNP'
2.171773 O b'lemma:chip-fnr'
2.161995 Gtype b'lemma:dfnr'
2.158766 O b'lemma:genotype/variation'
2.150201 O b'+1:lemma:43'
2.145901 Supp b'-1:lemma:\xc2\xb5m'
2.141092 Supp b'lemma:leucine'
2.114711 Gtype b'-1:lemma:nsrr'
2.112477 O b'lemma:culture'
2.110383 Supp b'+1:lemma:and'
9.784769 O b'lemma:_'
8.777655 Air b'lemma:anaerobic'
7.930641 Air b'lemma:aerobic'
7.220796 Technique b'lemma:ChIP-exo'
7.196554 O b'lemma:1'
7.103993 Phase b'lemma:stationary'
6.998968 O b'lemma:rpob'
6.988146 Supp b'lemma:Iron'
6.971195 Supp b'lemma:nitrate'
6.730326 Med b'lemma:MOPS'
6.729792 Air b'-1:lemma:ChIP-Seq'
6.615444 Gtype b'lemma:type'
6.497802 O b'-1:lemma:ChIP-exo'
6.115603 Strain b'lemma:k-12'
6.006143 Phase b'lemma:mid-log'
5.813042 Substrain b'lemma:mg1655'
5.750692 Supp b'lemma:pq'
5.692854 O b'postag::'
5.640080 Gversion b'lemma:asm584v2'
5.442313 Gtype b'-1:lemma:\xe2\x88\x86'
5.421944 Gversion b'lemma:nc'
5.369011 O b'lemma:2'
5.323172 O b'lemma:3'
5.227211 O b'lemma:Custom'
5.221194 Supp b'lemma:nh4cl'
5.036519 Technique b'lemma:chipseq'
5.002570 O b'lemma:b'
4.911066 Temp b'-1:lemma:sample'
4.803502 Gversion b'-1:lemma:nc'
4.759594 Gtype b'lemma:wt'
4.756971 Air b'lemma:Aerobic'
4.733958 Supp b'+1:lemma:\xc2\xb5m'
4.696241 OD b'lemma:od600'
4.618934 O b'lemma:\xcf\x8332'
4.610324 Gtype b'+1:lemma:type'
4.544628 Gtype b'lemma:\xce\xb4cra'
4.517060 O b'lemma:a'
4.407754 OD b'lemma:od450'
4.400043 O b'postag:IN'
4.361805 Supp b'lemma:no3'
4.357088 O b'-1:lemma:tag'
4.352412 Gtype b'lemma:delta-fnr'
4.311823 O b'lemma:Cra'
4.167960 Gtype b'lemma:flag-tag'
4.167960 Gtype b'-1:lemma:c-terminal'
4.162564 Med b'lemma:LB'
4.113496 Strain b'+1:lemma:substr'
4.107297 Anti b'+1:lemma:antibody'
4.060899 Technique b'lemma:ChIP-Seq'
4.009046 O b'lemma:rep1'
3.995454 Supp b'lemma:rifampicin'
3.963685 Technique b'lemma:rna-seq'
3.933835 Supp b'lemma:glucose'
3.917748 O b'lemma:.'
3.917748 O b'postag:.'
3.845505 Supp b'lemma:dpd'
3.808636 O b'lemma:rep2'
3.774698 Gtype b'lemma:wild-type'
3.760833 Med b'lemma:lb'
3.747355 Technique b'-1:lemma:IP'
3.703487 Air b'postag:RB'
3.662819 O b'lemma:rep3'
3.662186 Supp b'lemma:Fe'
3.579211 Temp b'-1:lemma:\xcf\x8332'
3.504088 Technique b'lemma:chip-seq'
3.459881 Vess b'lemma:flask'
3.459881 Vess b'-1:lemma:warm'
3.395894 Supp b'lemma:acetate'
3.371382 O b'+1:lemma:od600'
3.355281 Supp b'lemma:arginine'
3.288615 Anti b'lemma:seqa'
3.267673 Gtype b'lemma:arca8myc'
3.257108 Gtype b'-1:lemma:rpob'
3.214124 Med b'+1:lemma:0.4'
3.198215 O b'lemma:chip'
3.191605 OD b'+1:lemma:stationary'
3.129303 pH b'lemma:ph5'
3.129303 pH b'+1:lemma:.5'
3.116874 Supp b'-1:lemma:Cra'
3.111015 O b'+1:lemma:chip-seq'
3.100779 Gtype b'+1:lemma:with'
3.096274 Technique b'+1:lemma:chip-exo'
3.080007 O b'-1:lemma:0.3-0.35'
3.076638 Technique b'lemma:rnaseq'
2.996028 Gtype b'+1:lemma:ph5'
2.989922 Anti b'lemma:none'
2.975187 O b'-1:lemma:Aerobic'
2.962110 Anti b'lemma:anti-rpos'
2.927775 Supp b'+1:lemma:1'
2.897627 Gtype b'lemma:delta-arca'
2.894293 Supp b'+1:lemma:2'
2.870010 Gtype b'lemma:nsrr'
2.836891 O b'lemma:escherichia'
2.823759 O b'+1:lemma:pq'
2.729622 Gtype b'+1:lemma:pq'
2.721450 Supp b'lemma:fructose'
2.715488 Supp b'lemma:iptg'
2.707351 Gtype b'lemma:\xce\xb4ompr'
2.706414 Gtype b'lemma:fnr8myc'
2.705613 O b'-1:lemma:0.3'
2.696678 O b'-1:lemma:type'
2.677637 O b'-1:lemma:anaerobic'
2.617637 Technique b'-1:lemma:chip-exo'
2.601501 O b'lemma:with'
2.598938 O b'postag:CC'
2.589617 Gversion b'lemma:chip-seq'
2.564844 Gtype b'lemma:\xce\xb4fur'
2.529911 Temp b'-1:lemma:37'
2.512630 Temp b'-1:lemma:43'
2.501323 O b'-1:lemma:glucose'
2.465702 Supp b'-1:lemma:+'
2.437465 Gversion b'lemma:u00096'
2.437465 Gversion b'+1:lemma:.2'
2.390733 O b'lemma:-'
2.390656 O b'lemma:oxyr'
2.389452 Gtype b'lemma:WT'
2.388101 O b'+1:postag:RB'
2.371844 Gtype b'lemma:\xe2\x88\x86'
2.368954 Gversion b'lemma:000913'
2.357589 pH b'lemma:.5'
2.357589 pH b'-1:lemma:ph5'
2.347080 Med b'lemma:m63'
2.341653 Med b'+1:lemma:minimal'
2.312104 Temp b'lemma:43'
2.303920 Supp b'lemma:Leu'
2.303021 Anti b'lemma:anti-myc'
2.298956 Gtype b'lemma:pk4854'
2.289285 Med b'lemma:glucose'
2.270819 O b'+1:postag:NNP'
2.250795 Air b'lemma:anaerobically'
2.249574 Gtype b'postag:-RRB-'
2.245776 Gversion b'lemma:.2'
2.245776 Gversion b'-1:lemma:u00096'
2.239995 Air b'-1:lemma:co2'
2.227457 Supp b'lemma:20'
2.212330 Supp b'+1:lemma:hour'
2.212247 Temp b'-1:lemma:30'
2.173944 Supp b'lemma:nacl'
2.172282 O b'+1:lemma:sparging'
2.129033 O b'lemma:s'
2.126416 Phase b'-1:lemma:mid-log'
2.125863 Supp b'+1:lemma:_'
2.114093 Med b'+1:lemma:2.0'
2.111768 Med b'-1:lemma:glucose'
2.073983 Gtype b'+1:lemma:flagtag'
2.071701 O b'-1:lemma:lb'
2.052281 Med b'-1:lemma:ml'
2.050869 Gtype b'-1:lemma:nsrr'
1.973985 O b'postag:VBN'
1.966483 Med b'lemma:L'
1.966483 Med b'+1:lemma:broth'
1.943849 Med b'lemma:broth'
1.943849 Med b'-1:lemma:L'
1.943198 Supp b'-1:lemma:with'
1.933549 Supp b'lemma:Adenine'
1.928306 O b'lemma:CEL'
1.904039 Supp b'-1:lemma:\xc2\xb5m'
1.854835 Med b'lemma:media'
1.849121 O b'lemma:at'
1.846853 Phase b'-1:lemma:until'
1.845040 OD b'lemma:phase'
1.843752 Supp b'+1:lemma:Deficient'
1.834795 Gtype b'+1:lemma:_'
1.832489 O b'-1:lemma:\xc2\xb0c'
1.818739 O b'lemma:chip-arca'
1.813945 OD b'lemma:0.3'
1.805051 O b'+1:lemma:o.d.'
1.797440 Temp b'lemma:37'
1.792631 Vess b'-1:postag:VBN'
1.776920 Technique b'-1:lemma:_'
1.773247 OD b'+1:lemma:phase'
1.762789 Temp b'lemma:\xc2\xb0c'
1.761249 Technique b'+1:lemma:rna-seq'
1.758774 Gtype b'-1:postag::'
1.752571 O b'lemma:or'
1.747526 O b'-1:lemma:l1'
1.747292 Supp b'lemma:of'
1.740326 Temp b'+1:lemma:\xc2\xb0c'
1.701975 O b'lemma:ompr'
1.696253 O b'lemma:c-terminal'
1.696253 O b'+1:lemma:flag-tag'
1.690400 Med b'+1:lemma:supplement'
1.689524 pH b'+1:postag:CD'
1.687584 O b'+1:lemma:nacl'
1.685346 O b'+1:lemma:acetate'
1.674079 O b'-1:lemma:dpd'
1.668207 Gtype b'-1:lemma:_'
1.667206 Temp b'+1:lemma:in'
1.666468 Supp b'lemma:methanol'
1.660722 Air b'-1:lemma:-'
1.655979 Gtype b'-1:lemma:vector'
1.642097 O b'lemma:culture'
1.641394 Med b'-1:lemma:LB'
1.639030 Phase b'+1:lemma:for'
1.635194 OD b'-1:lemma:about'
1.632144 Gtype b'lemma:\xce\xb4soxs'
1.622571 O b'-1:lemma:media'
1.574984 Gversion b'postag:CD'
1.574818 O b'lemma:soxs'
1.574818 O b'lemma:soxr'
Top negative:
-0.004206 Gtype b'-1:lemma:,'
-0.004206 Gtype b'-1:postag:,'
-0.004363 O b'+1:lemma:dissolve'
-0.005226 Air b'-1:lemma:anaerobically'
-0.006081 Med b'postag:-LRB-'
-0.007482 O b'+1:lemma:25'
-0.007505 Air b'+1:postag:-LRB-'
-0.010695 O b'+1:lemma:delta'
-0.010729 Gtype b'lemma:control'
-0.015920 OD b'-1:postag:DT'
-0.016476 Supp b'+1:lemma:glucose'
-0.020393 O b'+1:lemma:o2'
-0.020701 Air b'-1:lemma:-rrb-'
-0.027434 O b'-1:postag:DT'
-0.030363 Air b'postag:CD'
-0.031961 O b'postag:RB'
-0.035995 O b'lemma:aerobically'
-0.040364 O b'lemma:n2'
-0.040535 Med b'-1:postag:CD'
-0.041176 Air b'-1:postag:-RRB-'
-0.042452 OD b'+1:lemma:0.4'
-0.044876 O b'-1:lemma:the'
-0.046558 O b'-1:lemma:25'
-0.047871 O b'+1:lemma:95'
-0.048967 O b'-1:postag:IN'
-0.050524 O b'+1:lemma:strain'
-0.053326 Phase b'+1:postag:NN'
-0.060668 O b'-1:lemma:e.'
-0.070033 O b'lemma:e.'
-0.070538 O b'+1:lemma:0.4'
-0.071511 O b'+1:lemma:grow'
-0.072393 Gtype b'+1:lemma:cra'
-0.076483 Med b'postag:CD'
-0.079707 O b'+1:lemma:or'
-0.080785 O b'+1:lemma:5'
-0.081991 OD b'+1:postag:CD'
-0.097802 O b'lemma:glucose'
-0.099284 O b'+1:lemma:b'
-0.100727 Supp b'-1:lemma:and'
-0.107163 Supp b'-1:postag:NN'
-0.121273 O b'lemma:o2'
-0.123375 Anti b'+1:postag:JJ'
-0.128472 Supp b'-1:postag:VBG'
-0.137982 O b'lemma:nacl'
-0.138385 O b'-1:lemma:g/l'
-0.140738 Med b'+1:lemma:media'
-0.143230 O b'+1:lemma:.'
-0.143230 O b'+1:postag:.'
-0.147429 O b'-1:lemma:-lrb-'
-0.150859 O b'+1:lemma:mm'
-0.150867 Gtype b'postag:CD'
-0.155869 O b'-1:lemma:mm'
-0.157092 O b'-1:lemma:of'
-0.160183 O b'+1:postag:IN'
-0.161439 Gtype b'-1:postag:CD'
-0.183365 Gtype b'-1:postag:DT'
-0.184394 Supp b'+1:postag:IN'
-0.185747 O b'+1:lemma:-rrb-'
-0.188736 O b'-1:lemma:20'
-0.189296 O b'-1:postag:-LRB-'
-0.194391 O b'-1:lemma:o2'
-0.196331 O b'lemma:grow'
-0.197265 O b'lemma:m63'
-0.202228 Supp b'lemma:and'
-0.208828 Gtype b'lemma:_'
-0.213147 O b'lemma:co2'
-0.216510 O b'+1:lemma:Aerobic'
-0.219766 O b'-1:lemma:um'
-0.219766 O b'+1:lemma:paraquat'
-0.222760 O b'-1:lemma:n2'
-0.223418 Med b'-1:postag:NN'
-0.226489 O b'-1:lemma:minimal'
-0.229253 O b'-1:postag:VBN'
-0.229413 OD b'+1:lemma:mid-log'
-0.235205 Technique b'-1:lemma::'
-0.245927 O b'+1:lemma:cell'
-0.259152 O b'+1:lemma:shake'
-0.259231 O b'-1:lemma:with'
-0.260969 O b'lemma:lb'
-0.262122 O b'lemma:\xc2\xb0c'
-0.262570 Med b'+1:postag:NNS'
-0.267584 O b'+1:lemma:minimal'
-0.268702 O b'-1:lemma:fresh'
-0.274046 Supp b'-1:postag:NNP'
-0.283215 Temp b'postag:JJ'
-0.289216 O b'+1:postag:-RRB-'
-0.298829 Med b'+1:postag:NN'
-0.300030 O b'lemma:k-12'
-0.303893 Supp b'+1:postag:VBN'
-0.304837 O b'+1:lemma:until'
-0.305487 O b'-1:lemma:mid-log'
-0.314457 O b'lemma:30'
-0.318478 O b'-1:lemma:\xe2\x88\x86'
-0.318630 OD b'postag:JJ'
-0.320224 Gtype b'+1:lemma:\xe2\x88\x86'
-0.328379 O b'lemma:mg1655'
-0.332214 O b'-1:lemma:30'
-0.336273 O b'+1:lemma:phase'
-0.343858 O b'-1:lemma:0.1'
-0.353210 O b'-1:lemma:1'
-0.363425 O b'lemma:minimal'
-0.367846 O b'-1:lemma:from'
-0.393937 Gversion b'+1:postag:NN'
-0.407622 Air b'-1:lemma:or'
-0.419752 Phase b'-1:lemma:at'
-0.419908 Med b'+1:postag:IN'
-0.434159 OD b'+1:postag:NN'
-0.434388 Temp b'-1:lemma:\xc2\xb0c'
-0.437451 OD b'+1:lemma:and'
-0.450338 O b'-1:lemma:rifampicin'
-0.450644 O b'+1:lemma:%'
-0.460508 O b'+1:lemma:_'
-0.468703 O b'-1:lemma:od600'
-0.471110 O b'+1:lemma:c'
-0.473012 OD b'+1:postag:CC'
-0.473111 O b'+1:lemma:rep1'
-0.476279 O b'lemma:purify'
-0.486329 O b'-1:lemma:iptg'
-0.490766 Gtype b'-1:postag:SYM'
-0.492855 O b'+1:lemma:\xc2\xb0c'
-0.520331 Supp b'+1:lemma:rifampicin'
-0.521486 Gtype b'lemma:delta'
-0.544638 O b'lemma:phase'
-0.549770 Supp b'postag:CC'
-0.574118 Technique b'-1:postag::'
-0.588060 O b'lemma:\xe2\x88\x86'
-0.589911 O b'lemma:dissolve'
-0.600471 O b'-1:lemma:until'
-0.605867 OD b'lemma:-lrb-'
-0.606846 O b'-1:lemma:grow'
-0.615232 O b'+1:postag:NNS'
-0.621806 O b'-1:lemma:cra'
-0.628236 O b'+1:lemma:300'
-0.629162 pH b'postag:NN'
-0.647995 O b'+1:lemma:arginine'
-0.663009 O b'lemma:150'
-0.663009 O b'+1:lemma:mg/ml'
-0.668956 O b'lemma:media'
-0.687046 OD b'postag:-LRB-'
-0.688477 Anti b'+1:lemma:anti-fur'
-0.696641 Phase b'-1:postag:JJ'
-0.720714 O b'lemma:od600'
-0.740400 O b'+1:lemma:0.3'
-0.753503 O b'-1:postag:VBG'
-0.798903 O b'lemma:anaerobically'
-0.798945 O b'-1:lemma:0.2'
-0.800846 Med b'-1:postag:IN'
-0.802642 O b'lemma:dpd'
-0.829848 O b'+1:postag:VBG'
-0.837375 O b'lemma:20'
-0.843836 Temp b'+1:lemma:to'
-0.843836 Temp b'+1:postag:TO'
-0.861567 O b'lemma:anaerobic'
-0.895410 O b'-1:lemma:co2'
-0.935654 Supp b'+1:lemma:acetate'
-0.962115 O b'+1:lemma:fecl2'
-0.965287 O b'-1:lemma:ml'
-0.992440 Temp b'postag:NN'
-1.012409 Air b'-1:postag:JJ'
-1.037489 O b'lemma:0.3'
-1.038206 O b'lemma:fecl2'
-1.045928 O b'-1:lemma:~'
-1.050208 O b'lemma:0.1'
-1.059403 O b'postag:VBP'
-1.082188 O b'-1:postag::'
-1.107761 O b'lemma:mid-log'
-1.113185 O b'lemma:\xce\xb4fur'
-1.123078 O b'lemma:0.2'
-1.128103 O b'-1:lemma:sample'
-1.194487 Supp b'-1:lemma:%'
-1.213453 Air b'postag:NN'
-1.229252 O b'lemma:of'
-1.235299 O b'+1:lemma:supplement'
-1.238904 O b'lemma:37'
-1.267382 O b'lemma:2h'
-1.267382 O b'-1:lemma:additional'
-1.275201 O b'-1:lemma:dissolve'
-1.275201 O b'+1:lemma:methanol'
-1.291651 O b'+1:lemma:in'
-1.453841 O b'+1:lemma:at'
-1.495880 Air b'+1:postag:JJ'
-1.522603 Anti b'postag:NNP'
-1.573726 O b'+1:lemma:g/l'
-1.603806 O b'-1:lemma:ompr'
-1.605609 Phase b'postag:JJ'
-1.643331 O b'-1:lemma:rpob'
-1.700527 O b'-1:lemma:37'
-1.724176 O b'-1:lemma:IP'
-1.756223 O b'-1:lemma:nsrr'
-1.790376 O b'+1:lemma:+'
-1.794994 O b'lemma:methanol'
-1.802577 Supp b'postag:JJ'
-1.803599 O b'lemma:wt'
-1.870737 O b'lemma:rifampicin'
-2.105365 O b'-1:lemma:2'
-2.201462 O b'+1:lemma:2'
-2.218990 O b'+1:lemma:hour'
-2.783349 O b'+1:lemma:1'
-3.830507 O b'-1:lemma:_'
-4.238490 O b'-1:lemma::'
0.012428 O b'lemma:build'
0.011706 OD b'-1:postag:JJ'
0.010758 O b'-1:lemma:m63'
0.010555 Temp b'+1:lemma:rep1'
0.009338 O b'-1:lemma:\xce\xbcm'
0.009111 OD b'lemma:of'
0.008729 O b'lemma:~'
0.008132 Gtype b'lemma:cra-8myc-tagged'
0.008132 Gtype b'lemma:fur-8myc'
0.007873 Air b'-1:lemma:95'
0.005830 OD b'+1:postag:-RRB-'
0.005750 Air b'lemma:-lrb-'
0.005529 Phase b'-1:postag::'
0.005242 Gtype b'+1:postag:CD'
0.004042 Substrain b'isUpper'
0.003852 O b'-1:lemma:5'
0.003021 O b'+1:lemma:use'
0.003019 Air b'postag:CC'
0.002663 Air b'postag:-LRB-'
0.002334 O b'+1:lemma:ml'
0.001862 O b'-1:lemma:pq'
0.000956 O b'lemma:short'
0.000945 O b'+1:postag:SYM'
0.000941 Med b'-1:postag::'
0.000813 O b'+1:lemma:mm'
0.000791 Supp b'lemma:\xc2\xb5l'
0.000791 Supp b'+1:lemma:cm20'
0.000762 O b'-1:lemma:k-12'
0.000330 Supp b'+1:postag:RB'
0.000321 O b'+1:lemma:rnase'
0.000279 OD b'postag:CC'
0.000211 Gtype b'+1:lemma:-lcb-'
0.000154 Med b'postag:NN'
0.000123 Supp b'-1:lemma:1mm'
0.000066 O b'-1:lemma:respiratory'
0.000047 O b'postag:VB'
0.000031 O b'+1:postag:JJ'
0.000022 O b'+1:postag:FW'
0.000021 Phase b'postag:VBG'
0.000014 Temp b'-1:postag:NNS'
0.000012 O b'-1:lemma:genotype/variation'
0.000011 Phase b'lemma:grow'
0.000009 O b'+1:lemma:genbank'
0.000009 O b'postag:FW'
0.000006 Gtype b'lemma:knock-out'
0.000005 O b'lemma:ip'
0.000005 Gtype b'+1:lemma:strain'
0.000001 O b'+1:lemma:ph5'
0.000000 Phase b'-1:lemma::'
-0.000002 O b'-1:lemma:from'
-0.000009 O b'-1:lemma:rifampicin'
-0.000018 O b'+1:lemma:95'
-0.000109 O b'-1:lemma:um'
-0.000109 O b'+1:lemma:paraquat'
-0.000363 Agit b'-1:postag:NN'
-0.000429 O b'+1:lemma:+'
-0.000494 O b'-1:lemma:iptg'
-0.000617 Supp b'postag:CD'
-0.000722 O b'lemma:150'
-0.000722 O b'+1:lemma:mg/ml'
-0.000846 O b'lemma:grow'
-0.001402 Air b'-1:lemma:or'
-0.001659 O b'-1:lemma:to'
-0.001659 O b'-1:postag:TO'
-0.001932 Gtype b'+1:lemma:-lrb-'
-0.002534 O b'+1:lemma:until'
-0.004418 Phase b'-1:postag:NN'
-0.004820 O b'+1:lemma:rep1'
-0.005823 Gtype b'-1:postag:NNP'
-0.006241 O b'+1:lemma:300'
-0.006734 Air b'lemma:,'
-0.006734 Air b'postag:,'
-0.008040 Air b'-1:lemma:25'
-0.010122 O b'+1:lemma:-rrb-'
-0.010159 O b'-1:lemma:-lrb-'
-0.012456 Supp b'-1:postag:NN'
-0.013973 OD b'postag:JJ'
-0.014420 OD b'isUpper'
-0.015511 OD b'+1:postag:CD'
-0.022697 Air b'+1:postag:-RRB-'
-0.022913 O b'-1:lemma:30'
-0.023313 OD b'+1:postag:-LRB-'
-0.023317 Air b'-1:postag:RB'
-0.024110 O b'-1:lemma:,'
-0.024110 O b'-1:postag:,'
-0.024675 O b'+1:lemma:hour'
-0.025573 O b'-1:lemma:of'
-0.028769 Air b'-1:postag:-LRB-'
-0.030732 Anti b'+1:postag:JJ'
-0.030900 Air b'-1:lemma:and'
-0.032775 Med b'postag:CD'
-0.033408 O b'-1:postag:JJ'
-0.041591 Air b'lemma:95'
-0.044656 Air b'-1:lemma:-lrb-'
-0.060308 O b'-1:lemma:o2'
-0.063061 O b'-1:lemma:rpob'
-0.066181 O b'-1:postag:VBN'
-0.069187 Med b'-1:postag:CD'
-0.069620 O b'lemma:and'
-0.080450 Gtype b'-1:postag:CD'
-0.085466 O b'+1:lemma:c'
-0.087314 O b'+1:lemma:5'
-0.091477 O b'+1:lemma:shake'
-0.095092 Med b'+1:postag:IN'
-0.102952 Air b'+1:lemma:-lrb-'
-0.103900 Supp b'-1:postag:NNP'
-0.104806 Air b'-1:postag:CC'
-0.130716 Phase b'-1:postag:JJ'
-0.144760 O b'lemma:20'
-0.147668 O b'+1:lemma:phase'
-0.151840 Supp b'+1:lemma:rifampicin'
-0.155431 O b'lemma:medium'
-0.157846 Agit b'isUpper'
-0.162132 O b'-1:lemma:ml'
-0.163703 Air b'+1:postag:-LRB-'
-0.168213 Agit b'postag:NN'
-0.197124 Temp b'postag:JJ'
-0.199293 Med b'-1:postag:IN'
-0.201861 O b'lemma:fecl2'
-0.233445 Air b'isLower'
-0.243970 O b'-1:lemma:the'
-0.256444 Air b'-1:postag:JJ'
-0.259109 O b'-1:lemma:~'
-0.278225 O b'+1:lemma:%'
-0.280267 Temp b'+1:lemma:to'
-0.280267 Temp b'+1:postag:TO'
-0.288621 Supp b'+1:postag:VBN'
-0.292707 O b'+1:lemma:cell'
-0.315187 O b'lemma:od600'
-0.355514 Phase b'-1:lemma:at'
-0.357298 O b'lemma:0.1'
-0.357570 O b'lemma:glucose'
-0.360899 Temp b'isLower'
-0.411019 O b'lemma:anaerobically'
-0.420592 O b'lemma:dissolve'
-0.443294 O b'lemma:0.2'
-0.451505 Technique b'isNumber'
-0.453164 pH b'postag:NN'
-0.453934 O b'-1:lemma:37'
-0.477659 Med b'+1:postag:NN'
-0.482028 Supp b'isUpper'
-0.486122 Supp b'+1:lemma:acetate'
-0.490659 O b'+1:postag:IN'
-0.492086 O b'-1:lemma:cra'
-0.499001 O b'+1:lemma:fecl2'
-0.542612 O b'-1:lemma:od600'
-0.556265 Supp b'-1:lemma:%'
-0.559133 O b'-1:postag:IN'
-0.563772 O b'-1:postag:-LRB-'
-0.590111 Technique b'-1:postag::'
-0.595480 O b'+1:postag:NNS'
-0.600550 O b'postag:RB'
-0.603193 O b'+1:postag:-RRB-'
-0.608705 OD b'+1:postag:NN'
-0.619170 O b'+1:lemma:.'
-0.619170 O b'+1:postag:.'
-0.631410 Temp b'postag:NN'
-0.680972 OD b'lemma:-lrb-'
-0.692074 O b'lemma:phase'
-0.696523 O b'+1:lemma:g/l'
-0.703554 Med b'-1:postag:NN'
-0.722638 O b'-1:lemma:co2'
-0.737448 O b'lemma:37'
-0.793378 O b'-1:lemma:IP'
-0.881901 O b'-1:lemma:grow'
-0.936753 O b'lemma:2h'
-0.936753 O b'-1:lemma:additional'
-0.951203 O b'-1:lemma:ompr'
-0.961075 OD b'isNumber'
-0.975747 O b'lemma:media'
-0.999574 O b'lemma:mid-log'
-1.013924 O b'-1:lemma:dissolve'
-1.013924 O b'+1:lemma:methanol'
-1.038456 O b'+1:postag:VBG'
-1.044424 Gtype b'isLower'
-1.054187 Anti b'postag:NNP'
-1.055980 Air b'+1:postag:JJ'
-1.097851 O b'-1:postag::'
-1.150472 Gtype b'isUpper'
-1.157093 O b'-1:postag:VBG'
-1.186007 O b'lemma:wt'
-1.252971 O b'+1:lemma:supplement'
-1.282305 Gversion b'isLower'
-1.308302 Technique b'isLower'
-1.325280 O b'+1:lemma:in'
-1.418383 O b'-1:lemma:nsrr'
-1.424917 O b'+1:lemma:at'
-1.469077 O b'lemma:methanol'
-1.485871 OD b'postag:-LRB-'
-1.502986 Air b'postag:NN'
-1.512421 O b'lemma:of'
-1.560223 Phase b'postag:JJ'
-1.560628 O b'lemma:rifampicin'
-1.895357 Supp b'postag:JJ'
-1.938119 O b'+1:lemma:2'
-2.020790 O b'-1:lemma:2'
-2.056482 Gtype b'isNumber'
-2.518371 O b'+1:lemma:1'
-3.915561 O b'-1:lemma::'
-4.466114 O b'-1:lemma:_'
......
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.28812013544306553, 'c2': 0.007295583222860682}
best CV score:0.7989041592425109
model size: 0.06M
best params:{'c1': 0.3717925853055416, 'c2': 0.017924580629424793}
best CV score:0.8125475599052483
model size: 0.07M
Flat F1: 0.7893461428977414
Flat F1: 0.8015576085711513
precision recall f1-score support
OD 1.000 0.405 0.577 37
OD 0.789 0.405 0.536 37
pH 1.000 1.000 1.000 12
Technique 0.952 0.909 0.930 22
Med 1.000 0.842 0.914 57
Technique 1.000 0.909 0.952 22
Med 0.891 0.860 0.875 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.895 0.944 19
Air 0.780 0.742 0.760 62
Anti 0.500 0.444 0.471 9
Air 0.783 0.758 0.770 62
Anti 0.857 0.667 0.750 9
Strain 1.000 1.000 1.000 1
Gtype 0.854 0.774 0.812 106
Gtype 0.897 0.821 0.857 106
Substrain 0.000 0.000 0.000 1
Supp 0.802 0.684 0.738 136
Supp 0.857 0.662 0.747 136
Gversion 0.000 0.000 0.000 0
avg / total 0.863 0.742 0.789 480
avg / total 0.868 0.754 0.802 480
Top likely transitions:
Agit -> Agit 6.356818
OD -> OD 6.348289
Temp -> Temp 5.553063
Med -> Med 5.370053
Anti -> Anti 5.276075
Air -> Air 5.018155
Gtype -> Gtype 4.515516
Gversion -> Gversion 4.398480
Phase -> Phase 4.359659
O -> O 4.293965
Technique -> Technique 4.237543
Supp -> Supp 4.146423
O -> Supp 1.964836
Gtype -> Supp 1.866470
pH -> pH 1.685265
Air -> O 1.614236
Substrain -> Gtype 1.463550
O -> Technique 1.388918
O -> Gtype 1.222957
O -> Temp 0.798237
Med -> O 0.601567
O -> Anti 0.587178
Technique -> Air 0.378127
O -> Gversion 0.328551
OD -> Phase 0.308573
Temp -> O 0.289779
Supp -> O 0.253243
O -> Med 0.178828
Phase -> O 0.132350
Gtype -> pH 0.097473
O -> Phase 0.003637
Gtype -> Air 0.001121
Supp -> Air -0.008182
Technique -> Gtype -0.085945
Gtype -> Anti -0.165395
Gtype -> O -0.277440
OD -> O -0.365628
Agit -> O -0.521571
Gtype -> OD -0.554390
O -> Air -0.784770
Supp -> Med -0.806802
Substrain -> O -0.835873
Med -> Supp -0.906570
Phase -> OD -0.993184
Agit -> Agit 6.913143
OD -> OD 6.546357
Temp -> Temp 5.712726
Med -> Med 5.305596
Anti -> Anti 5.023718
Supp -> Supp 4.631165
Phase -> Phase 4.500208
Gtype -> Gtype 4.293158
Air -> Air 4.246276
Gversion -> Gversion 4.168987
O -> O 3.925497
Technique -> Technique 3.566379
pH -> pH 2.052884
O -> Supp 1.936178
Gtype -> Supp 1.326152
Air -> O 1.051292
O -> Technique 0.918460
O -> Gtype 0.855955
O -> Anti 0.549728
Med -> O 0.455808
Phase -> O 0.391302
O -> Temp 0.389367
OD -> Phase 0.349412
Supp -> O 0.327410
Substrain -> Gtype 0.326440
Temp -> O 0.267368
O -> Med 0.077179
O -> Phase 0.028994
O -> Gversion 0.026775
Technique -> pH -0.006596
Air -> Temp -0.006647
Phase -> OD -0.020087
Gtype -> Anti -0.153729
Supp -> Gtype -0.163416
Gtype -> OD -0.192090
Supp -> Med -0.235685
OD -> O -0.243341
Med -> Supp -0.274565
Agit -> O -0.322550
Gtype -> O -0.369110
OD -> Air -0.568717
O -> Air -0.731642
Technique -> O -0.757868
Substrain -> O -0.822866
Top unlikely transitions:
Agit -> Agit 6.356818
OD -> OD 6.348289
Temp -> Temp 5.553063
Med -> Med 5.370053
Anti -> Anti 5.276075
Air -> Air 5.018155
Gtype -> Gtype 4.515516
Gversion -> Gversion 4.398480
Phase -> Phase 4.359659
O -> O 4.293965
Technique -> Technique 4.237543
Supp -> Supp 4.146423
O -> Supp 1.964836
Gtype -> Supp 1.866470
pH -> pH 1.685265
Air -> O 1.614236
Substrain -> Gtype 1.463550
O -> Technique 1.388918
O -> Gtype 1.222957
O -> Temp 0.798237
Med -> O 0.601567
O -> Anti 0.587178
Technique -> Air 0.378127
O -> Gversion 0.328551
OD -> Phase 0.308573
Temp -> O 0.289779
Supp -> O 0.253243
O -> Med 0.178828
Phase -> O 0.132350
Gtype -> pH 0.097473
O -> Phase 0.003637
Gtype -> Air 0.001121
Supp -> Air -0.008182
Technique -> Gtype -0.085945
Gtype -> Anti -0.165395
Gtype -> O -0.277440
OD -> O -0.365628
Agit -> O -0.521571
Gtype -> OD -0.554390
O -> Air -0.784770
Supp -> Med -0.806802
Substrain -> O -0.835873
Med -> Supp -0.906570
Phase -> OD -0.993184
Agit -> Agit 6.913143
OD -> OD 6.546357
Temp -> Temp 5.712726
Med -> Med 5.305596
Anti -> Anti 5.023718
Supp -> Supp 4.631165
Phase -> Phase 4.500208
Gtype -> Gtype 4.293158
Air -> Air 4.246276
Gversion -> Gversion 4.168987
O -> O 3.925497
Technique -> Technique 3.566379
pH -> pH 2.052884
O -> Supp 1.936178
Gtype -> Supp 1.326152
Air -> O 1.051292
O -> Technique 0.918460
O -> Gtype 0.855955
O -> Anti 0.549728
Med -> O 0.455808
Phase -> O 0.391302
O -> Temp 0.389367
OD -> Phase 0.349412
Supp -> O 0.327410
Substrain -> Gtype 0.326440
Temp -> O 0.267368
O -> Med 0.077179
O -> Phase 0.028994
O -> Gversion 0.026775
Technique -> pH -0.006596
Air -> Temp -0.006647
Phase -> OD -0.020087
Gtype -> Anti -0.153729
Supp -> Gtype -0.163416
Gtype -> OD -0.192090
Supp -> Med -0.235685
OD -> O -0.243341
Med -> Supp -0.274565
Agit -> O -0.322550
Gtype -> O -0.369110
OD -> Air -0.568717
O -> Air -0.731642
Technique -> O -0.757868
Substrain -> O -0.822866
Top positive:
8.456899 Supp b'lemma:Iron'
7.968467 O b'lemma:_'
7.452197 Air b'lemma:anaerobic'
7.437960 Air b'lemma:aerobic'
7.396388 Technique b'lemma:ChIP-exo'
7.187671 O b'lemma:1'
6.882632 Phase b'lemma:stationary'
6.605608 Supp b'lemma:nitrate'
6.530209 Strain b'lemma:k-12'
6.203118 Air b'-1:lemma:ChIP-Seq'
6.007441 Phase b'lemma:mid-log'
5.856483 O b'lemma:rpob'
5.727633 O b'lemma:2'
5.691995 O b'lemma:3'
5.621467 Technique b'lemma:chipseq'
5.604648 Substrain b'lemma:mg1655'
5.596923 Technique b'lemma:ChIP-Seq'
5.568237 Gtype b'lemma:type'
5.509620 Med b'lemma:MOPS'
5.475086 Gversion b'lemma:asm584v2'
5.234945 O b'lemma:\xcf\x8332'
5.062729 O b'postag:IN'
5.021516 Supp b'lemma:pq'
4.929591 Air b'lemma:Aerobic'
4.874521 O b'lemma:Custom'
4.858511 Gversion b'lemma:nc'
4.830173 Med b'lemma:LB'
4.792027 Gtype b'lemma:\xce\xb4cra'
4.771925 OD b'lemma:od600'
4.722214 O b'lemma:rep1'
4.615430 O b'postag::'
4.604643 Supp b'+1:lemma:\xc2\xb5m'
4.516978 O b'lemma:b'
4.505623 Gtype b'lemma:flag-tag'
4.505623 Gtype b'-1:lemma:c-terminal'
4.503645 Med b'lemma:lb'
4.444381 Supp b'lemma:nh4cl'
4.432940 O b'-1:lemma:tag'
4.401594 O b'lemma:rep2'
4.365296 Gtype b'+1:lemma:type'
4.331532 Gtype b'-1:lemma:\xe2\x88\x86'
4.318893 O b'lemma:rep3'
4.280628 O b'-1:lemma:ChIP-exo'
4.273779 O b'lemma:a'
4.191200 OD b'lemma:od450'
4.187860 Gtype b'lemma:wt'
4.184958 Technique b'lemma:rna-seq'
4.089199 Supp b'lemma:glucose'
4.068712 Temp b'-1:lemma:sample'
4.066149 Gtype b'lemma:arca8myc'
3.877291 O b'lemma:Cra'
3.835115 Gtype b'lemma:nsrr'
3.739614 Supp b'lemma:Fe'
3.722246 Technique b'lemma:chip-seq'
3.715540 O b'+1:lemma:od600'
3.678000 Gtype b'lemma:delta-arca'
3.610668 Gtype b'lemma:\xe2\x88\x86'
3.517468 Med b'+1:lemma:0.4'
3.508191 O b'lemma:.'
3.508191 O b'postag:.'
3.483906 Gtype b'lemma:fnr8myc'
3.468892 Supp b'lemma:acetate'
3.438457 Vess b'lemma:flask'
3.438457 Vess b'-1:lemma:warm'
3.400184 Supp b'lemma:rifampicin'
3.396565 Technique b'lemma:rnaseq'
3.379201 Anti b'lemma:none'
3.369352 O b'-1:lemma:Aerobic'
3.366768 O b'-1:lemma:type'
3.310195 Supp b'lemma:no3'
3.306542 Gtype b'lemma:\xce\xb4fur'
3.289509 O b'-1:lemma:0.3-0.35'
3.240918 Gtype b'lemma:delta-fnr'
3.228917 Supp b'lemma:fructose'
3.199686 Supp b'lemma:dpd'
3.182132 O b'lemma:-'
3.174434 Gversion b'-1:lemma:nc'
3.160676 OD b'+1:lemma:stationary'
3.140034 Supp b'lemma:arginine'
3.107677 O b'postag:VBN'
3.075194 Technique b'-1:lemma:IP'
3.054797 Anti b'+1:lemma:antibody'
2.967185 Supp b'+1:lemma:1'
2.948061 pH b'lemma:ph5'
2.948061 pH b'+1:lemma:.5'
2.919290 Gtype b'-1:lemma:rpob'
2.909319 Anti b'lemma:seqa'
2.876363 O b'lemma:chip'
2.856949 Med b'+1:lemma:minimal'
2.846997 Gtype b'+1:lemma:ph5'
2.846043 Gversion b'lemma:u00096'
2.846043 Gversion b'+1:lemma:.2'
2.842541 Supp b'lemma:20'
2.813149 Gversion b'lemma:chip-seq'
2.799253 Temp b'-1:lemma:\xcf\x8332'
2.787282 O b'-1:lemma:glucose'
2.767972 Anti b'lemma:anti-rpos'
2.763663 Gtype b'lemma:\xce\xb4ompr'
2.762526 O b'postag:DT'
2.753494 O b'postag:CC'
2.734024 Supp b'+1:lemma:2'
2.713273 O b'lemma:CEL'
2.711953 Supp b'-1:lemma:+'
2.708255 Gtype b'+1:lemma:with'
2.662841 Air b'postag:RB'
2.655147 O b'+1:postag:RB'
2.622484 Temp b'-1:lemma:43'
2.621064 Anti b'lemma:anti-myc'
2.585376 O b'lemma:with'
2.579506 Gtype b'+1:lemma:pq'
2.574119 Med b'lemma:m63'
2.560671 Gtype b'-1:lemma:ptac'
2.530970 Supp b'lemma:iptg'
2.522165 Gversion b'lemma:000913'
2.522038 O b'-1:lemma:0.3'
2.518142 O b'lemma:or'
2.510254 pH b'lemma:.5'
2.510254 pH b'-1:lemma:ph5'
2.499838 Gtype b'lemma:wild-type'
2.496012 O b'-1:lemma:anaerobic'
2.493145 O b'+1:postag:NNP'
2.432959 O b'+1:lemma:o.d.'
2.423786 Supp b'lemma:nacl'
2.374439 Gversion b'lemma:.2'
2.374439 Gversion b'-1:lemma:u00096'
2.371897 Supp b'-1:lemma:Cra'
2.333418 Technique b'+1:lemma:chip-exo'
2.330714 Technique b'-1:lemma:chip-exo'
2.318227 Gtype b'+1:lemma:flagtag'
2.299023 Supp b'+1:lemma:_'
2.291540 Supp b'-1:lemma:\xc2\xb5m'
2.270555 Air b'-1:lemma:-'
2.258400 O b'postag:VBG'
2.241112 O b'-1:lemma:l1'
2.239653 Temp b'lemma:\xc2\xb0c'
2.239203 O b'-1:lemma:lb'
2.216105 Med b'lemma:media'
2.215247 Med b'-1:lemma:glucose'
2.198544 O b'lemma:s'
2.181192 Med b'+1:lemma:2.0'
2.180737 Supp b'-1:lemma:with'
2.151013 O b'-1:lemma:\xc2\xb0c'
2.122011 O b'lemma:culture'
2.119623 Gtype b'lemma:\xce\xb4soxs'
2.118038 O b'+1:lemma:pq'
2.107784 Strain b'+1:lemma:substr'
2.084102 Temp b'-1:lemma:37'
2.034197 Med b'lemma:L'
2.034197 Med b'+1:lemma:broth'
2.033322 OD b'-1:lemma:~'
2.031873 Temp b'lemma:37'
2.021465 Air b'lemma:anaerobically'
2.013276 O b'lemma:oxyr'
1.993546 pH b'+1:postag:CD'
1.990912 Temp b'lemma:43'
1.970179 Gtype b'lemma:pk4854'
1.965724 O b'lemma:escherichia'
1.928351 O b'lemma:affyexp'
1.918099 Gtype b'-1:lemma:nsrr'
1.912439 Gversion b'postag:CD'
1.912210 Gtype b'+1:lemma:_'
1.903180 Temp b'+1:lemma:\xc2\xb0c'
1.901831 O b'-1:lemma:media'
1.893202 Supp b'lemma:Leu'
1.888140 O b'+1:lemma:chip-seq'
1.885088 Supp b'lemma:methanol'
1.864512 Med b'+1:lemma:supplement'
1.843743 Gtype b'-1:postag:VBG'
1.840860 Med b'-1:lemma:ml'
1.833228 O b'lemma:genotype/variation'
1.830405 Air b'-1:lemma:co2'
1.824009 OD b'lemma:0.3'
1.823612 O b'-1:lemma:stpa'
1.820300 O b'+1:lemma:sparging'
1.820114 Gtype b'lemma:deltaseqa'
1.820114 Gtype b'-1:lemma:old'
1.808084 O b'lemma:at'
1.804795 Temp b'+1:lemma:and'
1.793786 Gtype b'lemma:ptac'
1.792476 Temp b'lemma:30'
1.780844 Supp b'+1:lemma:hour'
1.749460 Supp b'lemma:of'
1.723530 O b'lemma:condition'
1.717109 Phase b'-1:lemma:mid-log'
1.711480 Med b'+1:lemma:g/l'
1.709245 Gtype b'-1:lemma:_'
1.702188 Gtype b'-1:lemma:phtpg'
1.695199 O b'-1:lemma:dpd'
1.690508 Supp b'lemma:0.2'
1.688329 Air b'-1:postag:CD'
1.682363 Technique b'-1:lemma:_'
1.681577 Phase b'+1:lemma:for'
1.675654 Med b'postag:NNP'
1.654545 O b'lemma:Lrp'
1.636356 Gtype b'+1:postag::'
1.629183 Technique b'-1:lemma:1'
1.628579 Technique b'-1:lemma:input'
1.626463 Med b'lemma:glucose'
1.615682 Temp b'-1:lemma:30'
1.596658 Supp b'lemma:Adenine'
7.111444 Technique b'lemma[:2]:Ch'
4.825937 O b'lemma[:2]:re'
4.279457 Air b'lemma:anaerobic'
3.725935 O b'lemma[:2]:ge'
3.543228 O b'lemma:1'
3.543228 O b'lemma[:2]:1'
3.524472 OD b'lemma[:2]:od'
3.478950 Phase b'lemma:stationary'
3.469718 Gtype b'-1:lemma:\xe2\x88\x86'
3.448630 Gtype b'lemma:arca8myc'
3.428352 Air b'-1:lemma:ChIP-Seq'
3.363763 Air b'lemma:aerobic'
3.207046 O b'lemma:rpob'
3.019693 Supp b'lemma:Iron'
3.019693 Supp b'lemma[:2]:Ir'
3.010875 O b'-1:lemma:ChIP-exo'
2.921711 Supp b'+1:lemma:\xc2\xb5m'
2.911305 Gtype b'lemma[:1]:\xce\xb4'
2.889155 O b'-1:lemma:tag'
2.855933 O b'lemma:with'
2.855646 Med b'lemma[:1]:L'
2.846749 Technique b'lemma:chipseq'
2.827870 O b'lemma:2'
2.827870 O b'lemma[:2]:2'
2.817912 Air b'lemma[:2]:ae'
2.797895 Substrain b'lemma:mg1655'
2.792078 Phase b'lemma:mid-log'
2.745493 Supp b'+1:lemma:1'
2.729132 Technique b'lemma[:2]:rn'
2.682269 O b'lemma:3'
2.682269 O b'lemma[:2]:3'
2.657675 Gtype b'lemma:type'
2.657675 Gtype b'lemma[:2]:ty'
2.623761 Med b'+1:lemma:0.4'
2.580684 Gtype b'lemma[:2]:cr'
2.579976 O b'lemma:_'
2.579976 O b'lemma[:1]:_'
2.579976 O b'lemma[:2]:_'
2.569904 O b'+1:lemma:od600'
2.544048 Gtype b'lemma[:2]:de'
2.507607 Temp b'-1:lemma:sample'
2.491621 Supp b'lemma:nitrate'
2.491621 Supp b'lemma[:2]:ni'
2.487340 Gtype b'lemma:flag-tag'
2.487340 Gtype b'-1:lemma:c-terminal'
2.476917 Supp b'lemma:arginine'
2.470339 Anti b'+1:lemma:antibody'
2.468809 Gtype b'lemma[:2]:fl'
2.457061 Air b'lemma[:2]:an'
2.401035 Gversion b'lemma:nc'
2.401035 Gversion b'lemma[:2]:nc'
2.380072 O b'-1:lemma:0.3-0.35'
2.346761 O b'+1:lemma:pq'
2.337210 Supp b'+1:lemma:2'
2.311094 Gversion b'-1:lemma:nc'
2.292513 Gtype b'+1:lemma::'
2.281017 Med b'lemma:MOPS'
2.281017 Med b'lemma[:1]:M'
2.281017 Med b'lemma[:2]:MO'
2.204715 Substrain b'lemma[:2]:mg'
2.199859 O b'lemma:0.4'
2.194544 Gversion b'lemma[:2]:00'
2.169851 Temp b'-1:lemma:\xcf\x8332'
2.168672 Gtype b'lemma:fnr8myc'
2.159299 Air b'-1:lemma:co2'
2.156668 Strain b'lemma:k-12'
2.156668 Strain b'lemma[:2]:k-'
2.155314 O b'-1:lemma:Aerobic'
2.138255 Supp b'-1:lemma:Cra'
2.135365 Anti b'lemma[:2]:an'
2.117472 pH b'lemma:ph5'
2.117472 pH b'+1:lemma:.5'
2.108610 Temp b'lemma[:1]:3'
2.107391 Air b'lemma[:1]:A'
2.102650 Supp b'lemma:pq'
2.102650 Supp b'lemma[:2]:pq'
2.096866 Air b'-1:lemma:-'
2.086323 Supp b'lemma[:2]:gl'
2.074272 O b'-1:lemma:anaerobic'
2.064241 Gtype b'lemma:nsrr'
2.064241 Gtype b'lemma[:2]:ns'
2.029654 O b'lemma:b'
2.029654 O b'lemma[:2]:b'
2.016572 Gtype b'lemma[:1]:W'
1.998951 Technique b'lemma[:2]:ch'
1.998131 O b'lemma:a'
1.998131 O b'lemma[:2]:a'
1.968766 Gtype b'-1:lemma:rpob'
1.962195 Gtype b'hGreek'
1.961034 Med b'lemma:lb'
1.961034 Med b'lemma[:2]:lb'
1.938806 Gtype b'lemma[:2]:ar'
1.930507 OD b'+1:lemma:stationary'
1.923810 Gversion b'lemma:chip-seq'
1.891990 O b'-1:lemma:0.3'
1.889150 Strain b'+1:lemma:substr'
1.888844 Technique b'lemma[:1]:C'
1.884878 Gtype b'+1:lemma:flagtag'
1.882512 O b'postag::'
1.882512 O b'postag[:1]::'
1.882512 O b'postag[:2]::'
1.856991 O b'+1:postag:RB'
1.851608 O b'postag:IN'
1.851608 O b'postag[:1]:I'
1.851608 O b'postag[:2]:IN'
1.840138 Supp b'-1:lemma:with'
1.839774 Supp b'lemma[:1]:\xc2\xb5'
1.822500 Gtype b'+1:lemma:type'
1.816568 O b'lemma[:1]:C'
1.815184 Gversion b'lemma:asm584v2'
1.805652 Gversion b'lemma[:2]:as'
1.792629 O b'+1:postag:NNP'
1.791305 Supp b'lemma:fructose'
1.786544 O b'-1:lemma:type'
1.762437 Supp b'+1:lemma:_'
1.759820 O b'-1:lemma:lb'
1.756744 O b'-1:lemma:glucose'
1.754105 Vess b'lemma:flask'
1.754105 Vess b'-1:lemma:warm'
1.750186 O b'lemma:Custom'
1.750186 O b'lemma[:2]:Cu'
1.745341 Strain b'lemma[:1]:k'
1.739577 Vess b'lemma[:2]:fl'
1.726669 Supp b'lemma:rifampicin'
1.707436 Supp b'lemma[:2]:ri'
1.707207 Gtype b'+1:lemma:with'
1.696113 O b'lemma[:1]:-'
1.692259 Air b'lemma[:1]:a'
1.639949 Air b'lemma:Aerobic'
1.639949 Air b'lemma[:2]:Ae'
1.635409 O b'postag:CC'
1.635409 O b'postag[:2]:CC'
1.628056 Med b'+1:lemma:g/l'
1.615358 Technique b'symb'
1.610565 Supp b'lemma[:1]:1'
1.597091 pH b'+1:postag:CD'
1.589795 O b'lemma:\xcf\x8332'
1.589795 O b'lemma[:1]:\xcf\x83'
1.589795 O b'lemma[:2]:\xcf\x833'
1.563036 O b'-1:lemma:l1'
1.532125 Supp b'lemma:acetate'
1.523450 Supp b'lemma[:1]:I'
1.498488 O b'+1:lemma:nacl'
1.484546 Supp b'lemma:no3'
1.474134 Gtype b'-1:lemma:_'
1.462775 Technique b'-1:lemma:input'
1.457922 O b'+1:lemma:ph5'
1.445969 Gtype b'-1:postag:VBG'
1.435822 Gtype b'+1:lemma:_'
1.434655 Supp b'lemma:Fe'
1.434655 Supp b'lemma[:2]:Fe'
1.433511 Gtype b'-1:lemma:vector'
1.429069 Supp b'-1:postag:CD'
1.428528 Gtype b'lemma[:1]:w'
1.424222 pH b'lemma:.5'
1.424222 pH b'-1:lemma:ph5'
1.424222 pH b'lemma[:2]:.5'
1.422747 Med b'+1:lemma:2.0'
1.408132 Supp b'+1:lemma:hour'
1.397778 O b'lemma:.'
1.397778 O b'postag:.'
1.397778 O b'postag[:1]:.'
1.397778 O b'postag[:2]:.'
1.397778 O b'lemma[:2]:.'
1.381316 Gtype b'lemma:wt'
1.381316 Gtype b'lemma[:2]:wt'
1.377815 Temp b'lemma:43'
1.377815 Temp b'lemma[:2]:43'
1.377716 Air b'+1:postag:IN'
1.372036 Med b'+1:postag:-LRB-'
1.371743 Med b'+1:lemma:-lrb-'
1.357313 Anti b'lemma:none'
1.356053 Temp b'-1:lemma:43'
1.355054 Supp b'lemma[:2]:fr'
1.352442 Gversion b'+1:lemma:000913'
1.348258 O b'-1:lemma:\xc2\xb0c'
1.339531 Supp b'-1:postag:SYM'
1.337456 O b'lemma:delta'
1.335121 Supp b'lemma[:2]:ac'
1.330202 O b'+1:lemma:mid-log'
1.317551 Supp b'-1:postag:CC'
1.312876 OD b'lemma:od600'
1.304321 O b'lemma[:1]:s'
1.301244 Technique b'+1:lemma:chip-exo'
1.288165 Supp b'lemma[:1]:2'
1.287921 Phase b'+1:lemma:-lrb-'
1.287384 Temp b'-1:lemma:37'
1.287206 Supp b'lemma:nh4cl'
1.287206 Supp b'lemma[:2]:nh'
1.285698 Supp b'lemma[:2]:0.'
1.283844 Supp b'lemma[:2]:fe'
1.280443 Med b'+1:lemma:supplement'
1.280143 Gtype b'lemma[:1]:t'
1.278668 Phase b'+1:postag:-LRB-'
1.258754 Technique b'-1:lemma:1'
1.258397 Med b'+1:lemma:minimal'
1.256238 Med b'lemma[:1]:m'
1.247668 OD b'lemma[:1]:o'
1.247204 Gversion b'lemma:u00096'
1.247204 Gversion b'+1:lemma:.2'
Top negative:
0.017267 O b'-1:lemma:phase'
0.015360 O b'-1:lemma:Fur'
0.015015 Gtype b'lemma:-rcb-'
0.014734 Air b'lemma:-lrb-'
0.013480 Phase b'+1:lemma:aerobically'
0.013397 O b'-1:lemma:be'
0.012964 O b'lemma:fresh'
0.012612 Temp b'+1:postag:-RRB-'
0.011601 O b'lemma:2-3'
0.010954 OD b'postag:CC'
0.009883 Med b'+1:postag:VBG'
0.008416 Med b'-1:postag:NNP'
0.007746 Phase b'+1:postag:RB'
0.007283 O b'lemma:acetate'
0.006890 Temp b'-1:postag:NNS'
0.005794 O b'-1:postag:VBD'
0.005770 O b'+1:lemma:n2'
0.005411 Gversion b'-1:postag::'
0.005130 Gtype b'lemma:-lcb-'
0.003653 Med b'-1:lemma:-rrb-'
0.003433 O b'-1:lemma:m63'
0.003399 OD b'postag:CD'
0.003303 Anti b'+1:postag:-LRB-'
0.003264 Gtype b'lemma:cra'
0.003037 Phase b'-1:postag:IN'
0.002641 O b'+1:lemma:ChIP-Seq'
0.001833 O b'-1:lemma:with'
0.001345 O b'-1:postag:VBZ'
0.001191 OD b'-1:lemma:at'
0.001140 Supp b'+1:lemma:of'
0.001083 Med b'-1:postag::'
0.000969 O b'+1:lemma:anerobically'
0.000925 O b'+1:lemma:genbank'
0.000915 O b'-1:lemma:total'
0.000846 O b'postag:VBZ'
0.000778 Air b'+1:lemma:culture'
0.000629 O b'lemma:express'
0.000629 O b'+1:lemma:nsrr'
0.000580 Air b'postag:-RRB-'
0.000523 Supp b'+1:lemma:dissolve'
0.000475 O b'lemma:70'
0.000346 Supp b'-1:postag:VBN'
0.000255 O b'+1:lemma:anaerobically'
0.000233 O b'+1:postag:-LRB-'
0.000229 Air b'lemma:95'
0.000124 Agit b'lemma:bath'
0.000124 Agit b'-1:lemma:water'
0.000123 Agit b'+1:lemma:shake'
0.000098 O b'+1:lemma:_'
0.000070 Gtype b'+1:lemma:control'
0.000049 Anti b'lemma:tag'
0.000044 O b'lemma:glucose'
0.000043 Agit b'+1:lemma:at'
0.000042 Agit b'-1:postag:DT'
0.000033 Air b'-1:lemma:95'
0.000027 Temp b'+1:postag:VB'
0.000027 O b'+1:lemma:wt'
0.000025 O b'lemma:~'
0.000024 Agit b'postag:IN'
0.000018 OD b'-1:lemma:mg1655'
0.000012 OD b'lemma:\xce\xb4soxr'
0.000009 Supp b'lemma:paraquat'
0.000003 Vess b'+1:postag:IN'
0.000001 Med b'+1:lemma:with'
-0.000003 Supp b'+1:postag:VBN'
-0.000004 O b'-1:lemma:sample'
-0.000016 O b'lemma:150'
-0.000016 O b'+1:lemma:mg/ml'
-0.000020 O b'+1:lemma:shake'
-0.000023 OD b'+1:postag:-LRB-'
-0.000033 O b'lemma:anaerobic'
-0.000042 O b'-1:lemma:at'
-0.000051 O b'lemma:e.'
-0.000122 O b'-1:lemma:0.1'
-0.000150 O b'-1:lemma:e.'
-0.000237 Gtype b'+1:postag:NNS'
-0.000353 O b'-1:lemma:rifampicin'
-0.000482 Gtype b'+1:lemma:-lrb-'
-0.000998 O b'-1:lemma:ml'
-0.002220 Gtype b'postag:CD'
-0.002782 Gtype b'-1:postag:NN'
-0.002824 Med b'postag:CD'
-0.003203 Air b'postag:-LRB-'
-0.005019 O b'+1:lemma:phase'
-0.008101 Supp b'-1:postag:NN'
-0.008157 Air b'+1:lemma:-lrb-'
-0.009984 Air b'lemma:,'
-0.009984 Air b'postag:,'
-0.009987 Gtype b'-1:postag:CD'
-0.011620 O b'lemma:30'
-0.011986 Supp b'+1:lemma:-rrb-'
-0.012348 Phase b'+1:postag:NN'
-0.012465 Supp b'+1:postag:-RRB-'
-0.016199 O b'+1:lemma:c'
-0.017044 Air b'+1:postag:-RRB-'
-0.018057 Med b'-1:postag:IN'
-0.018532 OD b'+1:postag:CD'
-0.018715 O b'-1:lemma:1'
-0.028572 O b'+1:lemma:arginine'
-0.032917 Anti b'+1:postag:JJ'
-0.033839 Phase b'-1:postag:NN'
-0.035292 O b'-1:lemma:5'
-0.035894 O b'lemma:co2'
-0.037511 O b'-1:lemma:30'
-0.050917 Air b'-1:postag:VBN'
-0.051574 Air b'postag:CD'
-0.052755 Air b'+1:lemma:-rrb-'
-0.053416 Air b'-1:postag:RB'
-0.054843 Air b'-1:lemma:or'
-0.056713 OD b'postag:JJ'
-0.066384 O b'+1:lemma:5'
-0.075993 Air b'-1:lemma:and'
-0.077374 O b'-1:lemma:~'
-0.079056 Air b'-1:lemma:-lrb-'
-0.080674 Supp b'postag:CC'
-0.081179 O b'-1:lemma:,'
-0.081179 O b'-1:postag:,'
-0.091063 Air b'-1:postag:-LRB-'
-0.104880 O b'-1:lemma:-lrb-'
-0.116778 Gversion b'+1:postag:NN'
-0.117338 Med b'+1:postag:IN'
-0.156891 O b'-1:postag:VBN'
-0.158460 O b'+1:lemma:300'
-0.159376 Phase b'-1:lemma:at'
-0.163043 O b'+1:postag:NNS'
-0.185937 O b'-1:lemma:cra'
-0.198845 pH b'postag:NN'
-0.202021 Med b'-1:postag:NN'
-0.206164 O b'-1:postag:IN'
-0.210478 O b'-1:lemma:from'
-0.224002 O b'+1:lemma:hour'
-0.228689 O b'+1:lemma:-rrb-'
-0.230127 Temp b'postag:JJ'
-0.232439 O b'+1:lemma:.'
-0.232439 O b'+1:postag:.'
-0.261795 O b'lemma:0.3'
-0.276668 O b'+1:lemma:%'
-0.283202 O b'+1:postag:IN'
-0.291477 O b'lemma:dissolve'
-0.294314 O b'-1:lemma:of'
-0.332798 O b'-1:postag:-LRB-'
-0.348211 Temp b'postag:NN'
-0.361228 O b'lemma:od600'
-0.373795 O b'lemma:phase'
-0.395276 Med b'+1:postag:NN'
-0.405822 O b'+1:lemma:+'
-0.406990 Supp b'-1:lemma:%'
-0.409533 Temp b'+1:lemma:to'
-0.409533 Temp b'+1:postag:TO'
-0.419386 O b'lemma:anaerobically'
-0.421572 O b'+1:postag:-RRB-'
-0.460490 Air b'-1:postag:JJ'
-0.467245 Technique b'-1:postag::'
-0.476757 Supp b'+1:lemma:rifampicin'
-0.502746 O b'lemma:media'
-0.503360 O b'-1:lemma:od600'
-0.524986 OD b'+1:postag:NN'
-0.543280 O b'-1:lemma:rpob'
-0.557386 O b'-1:lemma:grow'
-0.570906 O b'lemma:fecl2'
-0.574577 O b'+1:lemma:fecl2'
-0.632496 O b'+1:lemma:cell'
-0.640758 O b'+1:lemma:0.3'
-0.696627 O b'-1:lemma:IP'
-0.710065 O b'-1:postag::'
-0.734704 O b'+1:postag:VBG'
-0.735189 OD b'lemma:-lrb-'
-0.753554 O b'lemma:0.1'
-0.763727 O b'lemma:0.2'
-0.785113 O b'-1:lemma:37'
-0.803671 O b'-1:lemma:dissolve'
-0.803671 O b'+1:lemma:methanol'
-0.833476 Supp b'+1:lemma:acetate'
-0.838362 O b'-1:lemma:ompr'
-0.851164 O b'lemma:37'
-0.866382 O b'lemma:2h'
-0.866382 O b'-1:lemma:additional'
-0.882690 O b'-1:postag:VBG'
-0.885831 O b'+1:lemma:g/l'
-0.888919 Phase b'postag:JJ'
-0.905015 O b'lemma:of'
-0.906507 Anti b'postag:NNP'
-1.026494 O b'lemma:mid-log'
-1.028079 O b'lemma:wt'
-1.060908 O b'+1:lemma:supplement'
-1.075926 O b'-1:lemma:co2'
-1.341090 O b'-1:lemma:nsrr'
-1.359406 O b'+1:lemma:at'
-1.375702 Air b'+1:postag:JJ'
-1.442763 O b'lemma:rifampicin'
-1.637602 O b'lemma:methanol'
-1.645866 Air b'postag:NN'
-1.720675 Supp b'postag:JJ'
-1.885525 OD b'postag:-LRB-'
-1.959132 O b'+1:lemma:in'
-2.128110 O b'+1:lemma:2'
-2.307682 O b'-1:lemma:2'
-2.374565 O b'+1:lemma:1'
-4.058703 O b'-1:lemma:_'
-4.145888 O b'-1:lemma::'
-0.000006 O b'lemma[:1]:f'
-0.000014 Temp b'postag:NN'
-0.000014 O b'lemma[:1]:4'
-0.000077 O b'-1:postag:JJ'
-0.000104 O b'lemma:\xe2\x88\x86'
-0.000104 O b'lemma[:1]:\xe2\x88\x86'
-0.000104 O b'lemma[:2]:\xe2\x88\x86'
-0.000117 O b'-1:lemma:to'
-0.000117 O b'-1:postag:TO'
-0.000139 Gtype b'lemma[:1]:-'
-0.000165 O b'-1:lemma:rifampicin'
-0.000244 Air b'postag:-RRB-'
-0.000244 Air b'postag[:2]:-R'
-0.000244 Air b'lemma[:2]:-r'
-0.000251 O b'+1:lemma:n2'
-0.000490 O b'-1:lemma:\xe2\x88\x86'
-0.000570 OD b'+1:postag:NNS'
-0.001255 Supp b'postag[:1]:N'
-0.001255 Supp b'postag[:2]:NN'
-0.001277 O b'lemma[:2]:an'
-0.001620 Supp b'+1:postag:IN'
-0.001834 O b'-1:lemma:mid-log'
-0.004139 Air b'lemma[:2]:25'
-0.004380 O b'postag:VBP'
-0.004418 O b'+1:lemma:phase'
-0.004475 Gtype b'+1:lemma:-rrb-'
-0.004892 O b'lemma:phase'
-0.005013 Anti b'postag[:1]:N'
-0.005013 Anti b'postag[:2]:NN'
-0.005037 O b'lemma[:2]:ph'
-0.005405 Air b'lemma:-lrb-'
-0.005662 O b'-1:lemma:of'
-0.006882 O b'lemma:media'
-0.007168 Gtype b'lemma[:1]:g'
-0.007303 Air b'postag:-LRB-'
-0.007303 Air b'postag[:2]:-L'
-0.007303 Air b'lemma[:2]:-l'
-0.007834 Air b'+1:lemma:and'
-0.008160 Air b'lemma:25'
-0.008761 OD b'postag[:1]:C'
-0.010588 OD b'postag:CD'
-0.010588 OD b'postag[:2]:CD'
-0.012329 Phase b'-1:lemma:at'
-0.013171 Med b'postag[:1]:C'
-0.013817 Air b'+1:lemma:until'
-0.016734 OD b'postag[:1]:N'
-0.016734 OD b'postag[:2]:NN'
-0.018208 Air b'lemma[:1]:n'
-0.022588 Supp b'hUpper'
-0.022588 Supp b'hLower'
-0.023822 Air b'postag[:1]:C'
-0.024287 O b'symb'
-0.025967 Med b'lemma[:1]:c'
-0.026538 Air b'-1:postag:-LRB-'
-0.031765 Technique b'postag[:1]:N'
-0.031765 Technique b'postag[:2]:NN'
-0.032068 Supp b'lemma[:2]:mi'
-0.037401 Air b'lemma[:1]:o'
-0.040028 Med b'postag:NN'
-0.043803 Air b'+1:lemma:-lrb-'
-0.044062 OD b'+1:postag:CD'
-0.044602 Supp b'-1:lemma:%'
-0.044731 Air b'+1:postag:-LRB-'
-0.046035 OD b'postag:JJ'
-0.046795 Air b'-1:lemma:-lrb-'
-0.048808 OD b'postag[:1]:J'
-0.048808 OD b'postag[:2]:JJ'
-0.049349 O b'+1:lemma:rep1'
-0.050801 Supp b'postag:CD'
-0.050801 Supp b'postag[:2]:CD'
-0.056455 O b'+1:lemma:0.3'
-0.057472 O b'-1:lemma:from'
-0.066677 O b'lemma:dissolve'
-0.071601 Supp b'lemma[:1]:o'
-0.072755 O b'lemma[:1]:k'
-0.073873 O b'lemma:150'
-0.073873 O b'+1:lemma:mg/ml'
-0.073873 O b'lemma[:2]:15'
-0.076685 O b'-1:lemma:ml'
-0.076846 O b'lemma[:2]:gl'
-0.077209 O b'-1:lemma:od600'
-0.083778 O b'+1:lemma:300'
-0.087471 Air b'symb'
-0.091928 Supp b'+1:postag:VBN'
-0.092333 Air b'postag:CC'
-0.092333 Air b'postag[:2]:CC'
-0.092993 O b'+1:lemma:%'
-0.100219 Supp b'+1:lemma:rifampicin'
-0.100582 O b'lemma:0.1'
-0.102695 O b'-1:lemma:-lrb-'
-0.109000 Air b'-1:lemma:or'
-0.111199 Supp b'lemma[:2]:an'
-0.112020 Air b'-1:postag:CC'
-0.113367 O b'+1:lemma:shake'
-0.119111 Anti b'+1:lemma:anti-fur'
-0.124927 O b'+1:lemma:+'
-0.125975 O b'-1:postag:VBN'
-0.128619 O b'-1:lemma:ompr'
-0.137106 Gtype b'-1:lemma:,'
-0.137106 Gtype b'-1:postag:,'
-0.145475 Gtype b'lemma[:1]:n'
-0.150071 O b'lemma[:1]:d'
-0.151088 Anti b'symb'
-0.158504 Air b'+1:postag:JJ'
-0.162749 O b'-1:lemma:37'
-0.168152 O b'-1:lemma:grow'
-0.177645 Technique b'-1:lemma::'
-0.186245 O b'-1:lemma:IP'
-0.188141 Temp b'+1:lemma:to'
-0.188141 Temp b'+1:postag:TO'
-0.189069 O b'-1:lemma:rna'
-0.190006 O b'+1:lemma:-rrb-'
-0.192143 O b'lemma[:2]:30'
-0.219680 O b'lemma:co2'
-0.231361 Agit b'symb'
-0.256617 O b'lemma:of'
-0.256617 O b'lemma[:2]:of'
-0.259140 O b'lemma:37'
-0.259140 O b'lemma[:2]:37'
-0.267489 O b'lemma[:2]:od'
-0.270561 Med b'+1:postag:NN'
-0.273391 O b'+1:lemma:fecl2'
-0.274839 O b'+1:postag:IN'
-0.277041 Technique b'postag:NN'
-0.281854 O b'+1:lemma:\xc2\xb0c'
-0.292441 O b'lemma:20'
-0.295792 Med b'-1:postag:CD'
-0.308709 Supp b'postag[:1]:C'
-0.308783 O b'lemma[:1]:p'
-0.311181 O b'lemma:wt'
-0.311181 O b'lemma[:2]:wt'
-0.318567 Med b'+1:postag:IN'
-0.318793 O b'lemma:2h'
-0.318793 O b'-1:lemma:additional'
-0.318793 O b'lemma[:2]:2h'
-0.330370 O b'+1:postag:-RRB-'
-0.332499 Air b'postag[:1]:N'
-0.332499 Air b'postag[:2]:NN'
-0.334391 Med b'-1:postag:NN'
-0.338586 Temp b'hGreek'
-0.351814 O b'lemma[:2]:me'
-0.363828 O b'lemma[:1]:L'
-0.365790 Gtype b'lemma:delta'
-0.396021 O b'+1:lemma:.'
-0.396021 O b'+1:postag:.'
-0.405253 OD b'+1:postag:NN'
-0.409588 O b'lemma[:2]:ri'
-0.436123 O b'lemma[:2]:0.'
-0.437523 O b'-1:postag:IN'
-0.461538 O b'-1:postag:-LRB-'
-0.480537 O b'-1:lemma:cra'
-0.524678 Technique b'-1:postag::'
-0.534816 Supp b'postag:JJ'
-0.541445 O b'-1:lemma:sample'
-0.544159 Med b'symb'
-0.553976 Anti b'postag:NNP'
-0.557482 O b'+1:lemma:hour'
-0.572719 Gtype b'lemma[:2]:rp'
-0.577168 Air b'postag:NN'
-0.603309 Supp b'postag[:1]:J'
-0.603309 Supp b'postag[:2]:JJ'
-0.608253 Air b'-1:postag:JJ'
-0.609440 O b'lemma[:1]:A'
-0.611762 Agit b'hUpper'
-0.611762 Agit b'hLower'
-0.616867 Supp b'lemma[:1]:c'
-0.662379 O b'-1:lemma:the'
-0.665646 O b'+1:postag:VBG'
-0.667220 O b'+1:postag:NNS'
-0.672166 O b'lemma:methanol'
-0.688760 O b'+1:lemma:cell'
-0.696400 Gtype b'lemma[:1]:m'
-0.709438 O b'-1:lemma:rpob'
-0.746988 O b'+1:lemma:supplement'
-0.748227 O b'-1:lemma:nsrr'
-0.750862 Gtype b'lemma[:1]:c'
-0.762647 O b'lemma:mid-log'
-0.764019 O b'+1:lemma:g/l'
-0.820923 O b'-1:lemma:dissolve'
-0.820923 O b'+1:lemma:methanol'
-0.849761 Phase b'hUpper'
-0.849761 Phase b'hLower'
-0.878961 O b'lemma:rifampicin'
-0.991808 O b'-1:lemma:co2'
-1.038541 O b'lemma[:1]:0'
-1.156169 O b'+1:lemma:at'
-1.157980 Gtype b'lemma[:1]:a'
-1.204180 Supp b'symb'
-1.233540 O b'lemma[:1]:\xce\xb4'
-1.266754 Supp b'hGreek'
-1.301358 O b'-1:postag:VBG'
-1.514277 O b'-1:postag::'
-1.655597 OD b'postag[:1]:-'
-1.753063 O b'+1:lemma:in'
-1.852806 OD b'lemma[:1]:-'
-1.885226 O b'-1:lemma:2'
-1.959854 O b'+1:lemma:2'
-2.144976 O b'+1:lemma:1'
-3.787456 O b'-1:lemma::'
-4.714231 O b'-1:lemma:_'
......
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.279361962019874, 'c2': 0.0038200106679588276}
best CV score:0.8186573824050531
model size: 0.07M
Flat F1: 0.8128691445699846
precision recall f1-score support
OD 0.789 0.405 0.536 37
pH 1.000 1.000 1.000 12
Technique 1.000 0.909 0.952 22
Med 0.897 0.912 0.904 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.947 0.973 19
Air 0.780 0.742 0.760 62
Anti 1.000 0.889 0.941 9
Strain 1.000 1.000 1.000 1
Gtype 0.918 0.849 0.882 106
Substrain 0.000 0.000 0.000 1
Supp 0.835 0.669 0.743 136
Gversion 0.000 0.000 0.000 0
avg / total 0.869 0.773 0.813 480
Top likely transitions:
Agit -> Agit 7.239488
OD -> OD 6.986110
Temp -> Temp 6.018161
Anti -> Anti 5.460406
Med -> Med 5.405632
Supp -> Supp 4.891085
Air -> Air 4.827197
Phase -> Phase 4.808148
Gversion -> Gversion 4.563407
Gtype -> Gtype 4.416717
O -> O 3.914205
Technique -> Technique 3.585291
pH -> pH 2.066900
O -> Supp 2.030835
Gtype -> Supp 1.504335
Air -> O 1.080882
O -> Technique 0.833471
O -> Gtype 0.713793
O -> Anti 0.531693
OD -> Phase 0.408195
Substrain -> Gtype 0.381038
O -> Gversion 0.245512
O -> Temp 0.216347
Med -> O 0.140439
Supp -> O 0.136031
Phase -> O 0.111016
O -> Phase 0.102578
O -> Med 0.027873
Technique -> Air 0.004864
Temp -> O 0.002877
Phase -> Air 0.002070
O -> OD -0.000053
Air -> Temp -0.001109
Technique -> pH -0.003137
Anti -> O -0.004004
OD -> Air -0.082107
Supp -> Med -0.222493
Gtype -> Anti -0.266509
Phase -> OD -0.268963
OD -> O -0.365524
Gtype -> O -0.470283
Supp -> Gtype -0.575625
Agit -> O -0.740344
O -> Air -0.754198
Med -> Supp -0.916394
Technique -> O -0.944892
Substrain -> O -1.056452
Top unlikely transitions:
Agit -> Agit 7.239488
OD -> OD 6.986110
Temp -> Temp 6.018161
Anti -> Anti 5.460406
Med -> Med 5.405632
Supp -> Supp 4.891085
Air -> Air 4.827197
Phase -> Phase 4.808148
Gversion -> Gversion 4.563407
Gtype -> Gtype 4.416717
O -> O 3.914205
Technique -> Technique 3.585291
pH -> pH 2.066900
O -> Supp 2.030835
Gtype -> Supp 1.504335
Air -> O 1.080882
O -> Technique 0.833471
O -> Gtype 0.713793
O -> Anti 0.531693
OD -> Phase 0.408195
Substrain -> Gtype 0.381038
O -> Gversion 0.245512
O -> Temp 0.216347
Med -> O 0.140439
Supp -> O 0.136031
Phase -> O 0.111016
O -> Phase 0.102578
O -> Med 0.027873
Technique -> Air 0.004864
Temp -> O 0.002877
Phase -> Air 0.002070
O -> OD -0.000053
Air -> Temp -0.001109
Technique -> pH -0.003137
Anti -> O -0.004004
OD -> Air -0.082107
Supp -> Med -0.222493
Gtype -> Anti -0.266509
Phase -> OD -0.268963
OD -> O -0.365524
Gtype -> O -0.470283
Supp -> Gtype -0.575625
Agit -> O -0.740344
O -> Air -0.754198
Med -> Supp -0.916394
Technique -> O -0.944892
Substrain -> O -1.056452
Top positive:
8.966672 Technique b'lemma[:2]:Ch'
6.588612 Phase b'lemma:stationary'
5.718268 Air b'lemma:anaerobic'
5.159572 O b'lemma[:2]:re'
4.823035 O b'-1:lemma:tag'
4.717845 Air b'lemma:aerobic'
4.658070 Phase b'lemma:mid-log'
4.421877 OD b'lemma[:2]:od'
4.420602 Gtype b'lemma:arca8myc'
4.062533 O b'lemma:1'
4.062533 O b'lemma[:2]:1'
3.912148 Gtype b'-1:lemma:\xe2\x88\x86'
3.888418 Air b'-1:lemma:ChIP-Seq'
3.848911 O b'lemma:rpob'
3.769611 O b'lemma[:2]:ge'
3.714984 Strain b'+1:lemma:substr'
3.670004 Gtype b'lemma[:2]:fl'
3.560689 O b'lemma:with'
3.436525 O b'-1:lemma:ChIP-exo'
3.429177 Supp b'lemma:arginine'
3.425608 Technique b'lemma[:2]:rn'
3.371645 Med b'+1:lemma:0.4'
3.328846 Supp b'lemma:Iron'
3.328846 Supp b'lemma[:2]:Ir'
3.321795 Supp b'+1:lemma:1'
3.310404 Supp b'+1:lemma:\xc2\xb5m'
3.308999 Temp b'-1:lemma:sample'
3.277763 Technique b'lemma:chipseq'
3.240649 Gversion b'-1:lemma:nc'
3.124383 Gtype b'lemma[:1]:\xce\xb4'
3.090861 O b'-1:lemma:Aerobic'
3.008868 O b'lemma:3'
3.008868 O b'lemma[:2]:3'
3.007173 O b'+1:lemma:pq'
3.000180 O b'+1:lemma:od600'
3.000100 Gtype b'lemma[:2]:cr'
2.948508 OD b'+1:lemma:stationary'
2.947897 O b'-1:lemma:0.3-0.35'
2.947877 O b'lemma:2'
2.947877 O b'lemma[:2]:2'
2.932527 Gtype b'lemma:fnr8myc'
2.885967 Supp b'lemma:fructose'
2.838346 Temp b'lemma[:1]:3'
2.804560 Supp b'+1:lemma:2'
2.762138 Med b'lemma:MOPS'
2.762138 Med b'lemma[:1]:M'
2.762138 Med b'lemma[:2]:MO'
2.737960 O b'-1:lemma:anaerobic'
2.712644 Gtype b'lemma[:2]:de'
2.710120 Anti b'+1:lemma:antibody'
2.704453 Supp b'lemma[:2]:0.'
2.695502 O b'-1:lemma:0.3'
2.674794 O b'lemma:_'
2.674794 O b'lemma[:1]:_'
2.674794 O b'lemma[:2]:_'
2.661858 Supp b'-1:lemma:Cra'
2.648028 Anti b'lemma[:2]:an'
2.616030 Supp b'lemma:nitrate'
2.616030 Supp b'lemma[:2]:ni'
2.599686 Technique b'-1:lemma:input'
2.597924 Med b'lemma[:1]:L'
2.576426 Gtype b'-1:lemma:rpob'
2.565057 Gtype b'lemma:type'
2.565057 Gtype b'lemma[:2]:ty'
2.560359 pH b'lemma:ph5'
2.560359 pH b'+1:lemma:.5'
2.509084 O b'lemma:delta'
2.478623 Gtype b'lemma[:1]:W'
2.469353 O b'+1:postag:RB'
2.432106 Gtype b'lemma:nsrr'
2.432106 Gtype b'lemma[:2]:ns'
2.399084 Temp b'-1:lemma:\xcf\x8332'
2.385698 Gversion b'lemma:nc'
2.385698 Gversion b'lemma[:2]:nc'
2.368284 Supp b'lemma:rifampicin'
2.366613 Gtype b'lemma:flag-tag'
2.366613 Gtype b'-1:lemma:c-terminal'
2.365159 O b'+1:lemma:sparging'
2.361737 Gversion b'lemma[:2]:00'
2.353117 Substrain b'lemma:mg1655'
2.347459 O b'-1:lemma:lb'
2.343081 Supp b'lemma[:2]:ri'
2.304781 O b'lemma:b'
2.304781 O b'lemma[:2]:b'
2.284446 Gversion b'lemma:chip-seq'
2.229948 Supp b'lemma:pq'
2.229948 Supp b'lemma[:2]:pq'
2.222205 Strain b'lemma:k-12'
2.222205 Strain b'lemma[:2]:k-'
2.167335 Supp b'lemma[:1]:I'
2.161918 Gtype b'+1:lemma:flagtag'
2.159386 Gversion b'lemma:asm584v2'
2.144731 Gversion b'lemma[:2]:as'
2.113656 Supp b'+1:lemma:_'
2.112060 Supp b'lemma:acetate'
2.090761 O b'lemma[:2]:fo'
2.078514 O b'-1:lemma:glucose'
2.068162 Air b'lemma[:2]:an'
2.062479 Air b'lemma[:2]:ae'
2.059001 Strain b'lemma[:1]:k'
2.056638 Technique b'+1:lemma:chip-exo'
2.052703 O b'-1:lemma:type'
2.051285 O b'lemma:\xcf\x8332'
2.051285 O b'lemma[:1]:\xcf\x83'
2.051285 O b'lemma[:2]:\xcf\x833'
2.050334 Vess b'lemma:flask'
2.050334 Vess b'-1:lemma:warm'
2.032344 Substrain b'lemma[:2]:mg'
2.030892 Vess b'lemma[:2]:fl'
2.027838 Air b'-1:lemma:-'
2.024791 Air b'lemma[:1]:A'
2.015955 Technique b'lemma[:2]:ch'
2.002652 O b'lemma:a'
2.002652 O b'lemma[:2]:a'
1.996430 Substrain b'+1:lemma:phtpg'
1.981067 Supp b'lemma[:1]:1'
1.954710 pH b'+1:postag:CD'
1.953189 Gtype b'lemma[:2]:ar'
1.939301 Gtype b'hGreek'
1.934603 Gtype b'-1:lemma:_'
1.932040 Med b'+1:lemma:2.0'
1.930878 O b'lemma:0.4'
1.909748 Supp b'-1:lemma:+'
1.867334 O b'+1:postag:NNP'
1.854658 Supp b'+1:lemma:hour'
1.852643 Supp b'lemma[:2]:gl'
1.850156 Supp b'-1:lemma:with'
1.841046 O b'postag:IN'
1.841046 O b'postag[:1]:I'
1.841046 O b'postag[:2]:IN'
1.840736 Air b'lemma:Aerobic'
1.840736 Air b'lemma[:2]:Ae'
1.839093 O b'lemma[:1]:C'
1.831912 Gtype b'+1:lemma::'
1.810536 Med b'lemma:lb'
1.810536 Med b'lemma[:2]:lb'
1.802382 Gtype b'-1:lemma:vector'
1.794761 Supp b'lemma[:1]:\xc2\xb5'
1.793907 O b'lemma:Custom'
1.793907 O b'lemma[:2]:Cu'
1.710377 Anti b'lemma:none'
1.695245 Air b'lemma[:1]:a'
1.679966 Gtype b'+1:lemma:with'
1.678353 O b'postag::'
1.678353 O b'postag[:1]::'
1.678353 O b'postag[:2]::'
1.672503 O b'-1:lemma:l1'
1.660511 O b'+1:lemma:nacl'
1.634575 Gtype b'+1:lemma:type'
1.633916 Air b'-1:lemma:co2'
1.633212 Temp b'lemma:43'
1.633212 Temp b'lemma[:2]:43'
1.630422 Technique b'+1:lemma:rna-seq'
1.627467 Supp b'lemma[:1]:2'
1.617176 Med b'+1:lemma:g/l'
1.591078 Temp b'-1:lemma:43'
1.584703 Phase b'lemma:exponentially'
1.580088 Gtype b'lemma[:1]:w'
1.569142 Technique b'symb'
1.544136 Med b'+1:lemma:minimal'
1.543828 Gversion b'lemma:.2'
1.543828 Gversion b'-1:lemma:u00096'
1.543828 Gversion b'lemma[:2]:.2'
1.539233 Technique b'-1:lemma:1'
1.535225 Gtype b'-1:lemma:Combined'
1.530825 O b'lemma[:1]:-'
1.529855 Gtype b'lemma:wt'
1.529855 Gtype b'lemma[:2]:wt'
1.526054 Med b'lemma:broth'
1.526054 Med b'-1:lemma:L'
1.526054 Med b'lemma[:2]:br'
1.523299 O b'lemma:chip'
1.508452 Supp b'lemma:Fe'
1.508452 Supp b'lemma[:2]:Fe'
1.503882 O b'+1:lemma:mid-log'
1.496251 Anti b'-1:lemma::'
1.486906 Supp b'lemma[:2]:fe'
1.470644 Anti b'lemma:anti-rpos'
1.462451 Supp b'lemma:dpd'
1.462451 Supp b'lemma[:2]:dp'
1.460661 Med b'+1:lemma:-lrb-'
1.458027 O b'lemma[:2]:in'
1.451098 pH b'lemma:.5'
1.451098 pH b'-1:lemma:ph5'
1.451098 pH b'lemma[:2]:.5'
1.446735 Med b'+1:postag:-LRB-'
1.442566 O b'+1:lemma:ph5'
1.438411 Supp b'lemma:no3'
1.436805 Supp b'lemma:iptg'
1.433263 O b'lemma:.'
1.433263 O b'postag:.'
1.433263 O b'postag[:1]:.'
1.433263 O b'postag[:2]:.'
1.433263 O b'lemma[:2]:.'
1.423900 O b'-1:lemma:\xc2\xb0c'
1.418739 Supp b'lemma:0.1'
1.401196 O b'lemma:purr'
1.384007 Med b'+1:lemma:contain'
1.375436 Supp b'lemma:nh4cl'
1.375436 Supp b'lemma[:2]:nh'
Top negative:
-0.001541 O b'+1:lemma:mm'
-0.001854 Gtype b'postag[:1]:V'
-0.001854 Gtype b'postag[:2]:VB'
-0.001951 Med b'-1:postag:IN'
-0.002248 Air b'lemma:-rrb-'
-0.002552 O b'+1:lemma:phase'
-0.002974 O b'lemma[:2]:an'
-0.003066 OD b'postag[:1]:N'
-0.003066 OD b'postag[:2]:NN'
-0.003120 O b'lemma[:2]:de'
-0.004645 Supp b'lemma:2'
-0.004645 Supp b'lemma[:2]:2'
-0.004667 Med b'+1:postag:NNS'
-0.005354 O b'-1:lemma:from'
-0.006386 Temp b'postag:NN'
-0.006593 Air b'-1:postag:-LRB-'
-0.007131 Supp b'postag:NNS'
-0.007895 O b'-1:lemma:mid-log'
-0.011115 O b'+1:lemma:delta'
-0.011562 Agit b'-1:postag:NN'
-0.011701 Air b'-1:lemma:-lrb-'
-0.012537 Technique b'postag[:1]:N'
-0.012537 Technique b'postag[:2]:NN'
-0.013175 OD b'+1:postag:CC'
-0.013422 O b'-1:lemma:o2'
-0.014314 Air b'-1:lemma:aerobically'
-0.014690 OD b'+1:lemma:of'
-0.019165 Air b'lemma:and'
-0.019727 Air b'-1:lemma:and'
-0.020299 Gtype b'lemma[:1]:g'
-0.020563 O b'-1:lemma:mm'
-0.020740 O b'+1:lemma:shake'
-0.024009 Supp b'-1:lemma:for'
-0.028824 Phase b'-1:postag:NN'
-0.029809 Supp b'lemma[:1]:t'
-0.031578 Gtype b'lemma[:1]:,'
-0.032015 Gtype b'lemma:,'
-0.032015 Gtype b'postag:,'
-0.032015 Gtype b'postag[:1]:,'
-0.032015 Gtype b'postag[:2]:,'
-0.032015 Gtype b'lemma[:2]:,'
-0.032915 Gversion b'+1:postag:NN'
-0.035323 Air b'lemma[:1]:o'
-0.039237 O b'-1:postag:JJ'
-0.040153 Supp b'+1:postag:IN'
-0.043438 Supp b'hUpper'
-0.043438 Supp b'hLower'
-0.046431 O b'lemma[:1]:d'
-0.048385 O b'+1:lemma:co2'
-0.051633 Supp b'+1:lemma:rifampicin'
-0.053267 O b'+1:lemma:c'
-0.060706 O b'+1:lemma:until'
-0.062235 pH b'postag[:1]:N'
-0.062235 pH b'postag[:2]:NN'
-0.063097 O b'lemma[:2]:30'
-0.065359 Air b'-1:postag:RB'
-0.065508 O b'lemma:phase'
-0.071547 Agit b'postag[:1]:N'
-0.071547 Agit b'postag[:2]:NN'
-0.071659 O b'+1:lemma:or'
-0.072012 O b'+1:lemma:%'
-0.072345 Gtype b'-1:postag:NN'
-0.075128 Gtype b'-1:lemma:,'
-0.075128 Gtype b'-1:postag:,'
-0.076044 Supp b'-1:postag:NNP'
-0.076147 O b'-1:lemma:of'
-0.082454 O b'-1:lemma:IP'
-0.085284 Supp b'lemma[:1]:o'
-0.086193 O b'lemma[:2]:ce'
-0.091551 O b'lemma[:2]:fe'
-0.091759 O b'+1:lemma:+'
-0.095917 O b'lemma:co2'
-0.101416 O b'lemma:anaerobically'
-0.101520 Temp b'hGreek'
-0.111323 O b'lemma:37'
-0.111323 O b'lemma[:2]:37'
-0.114466 O b'-1:lemma:od600'
-0.114596 OD b'postag:CD'
-0.114596 OD b'postag[:2]:CD'
-0.117991 Air b'+1:postag:-LRB-'
-0.119139 O b'lemma[:2]:mg'
-0.122079 Air b'+1:lemma:-lrb-'
-0.123263 O b'-1:lemma:rna'
-0.128253 O b'-1:postag:VBN'
-0.135604 O b'+1:lemma:\xc2\xb0c'
-0.137855 Air b'symb'
-0.144842 Supp b'postag:CD'
-0.144842 Supp b'postag[:2]:CD'
-0.147096 Gtype b'+1:lemma:-rrb-'
-0.154114 Med b'postag:NN'
-0.155465 Phase b'postag:JJ'
-0.156939 Med b'+1:postag:IN'
-0.159442 O b'-1:lemma:rpob'
-0.159504 Air b'postag:CC'
-0.159504 Air b'postag[:2]:CC'
-0.165569 O b'lemma:anaerobic'
-0.169530 Air b'+1:postag:JJ'
-0.175033 Anti b'symb'
-0.207569 Technique b'-1:lemma::'
-0.211170 O b'-1:lemma:the'
-0.212648 Med b'postag[:1]:C'
-0.215967 O b'-1:lemma:grow'
-0.217662 Med b'+1:postag:NN'
-0.222008 Technique b'postag:NN'
-0.224207 O b'+1:lemma:-rrb-'
-0.227966 O b'lemma[:2]:od'
-0.234046 O b'-1:lemma:-lrb-'
-0.242892 Anti b'+1:lemma:anti-fur'
-0.243109 O b'lemma[:2]:me'
-0.257081 O b'lemma:of'
-0.257081 O b'lemma[:2]:of'
-0.276390 Phase b'-1:postag:JJ'
-0.293682 O b'lemma:wt'
-0.293682 O b'lemma[:2]:wt'
-0.295413 O b'+1:postag:IN'
-0.297541 OD b'+1:postag:CD'
-0.307394 O b'lemma[:2]:ae'
-0.307787 O b'-1:lemma:ml'
-0.308022 O b'lemma[:1]:p'
-0.312845 O b'-1:lemma:37'
-0.316240 Temp b'+1:lemma:to'
-0.316240 Temp b'+1:postag:TO'
-0.318530 Phase b'-1:lemma:at'
-0.325023 Agit b'symb'
-0.330260 O b'lemma:2h'
-0.330260 O b'-1:lemma:additional'
-0.330260 O b'lemma[:2]:2h'
-0.331312 Air b'postag[:1]:N'
-0.331312 Air b'postag[:2]:NN'
-0.335232 O b'postag:VBP'
-0.345145 Phase b'postag[:1]:J'
-0.345145 Phase b'postag[:2]:JJ'
-0.346773 O b'lemma[:2]:0.'
-0.347618 Air b'-1:postag:CC'
-0.356296 O b'-1:postag:-LRB-'
-0.358625 O b'+1:lemma:fecl2'
-0.364284 O b'+1:postag:-RRB-'
-0.380241 Med b'-1:postag:CD'
-0.399176 O b'+1:postag:VBG'
-0.399486 O b'lemma[:2]:gl'
-0.403156 O b'lemma:20'
-0.442379 O b'+1:lemma:cell'
-0.447923 Technique b'-1:postag::'
-0.457780 Med b'-1:postag:NN'
-0.460270 Supp b'+1:postag:VBN'
-0.472546 O b'lemma[:1]:L'
-0.491295 O b'-1:postag:IN'
-0.492050 O b'lemma[:2]:ri'
-0.496617 Supp b'postag[:1]:C'
-0.506785 O b'-1:lemma:ompr'
-0.527743 Supp b'postag:JJ'
-0.527772 Agit b'hUpper'
-0.527772 Agit b'hLower'
-0.536034 Air b'postag:NN'
-0.546321 Supp b'postag[:1]:J'
-0.546321 Supp b'postag[:2]:JJ'
-0.559301 Air b'-1:lemma:or'
-0.562023 Gtype b'lemma:delta'
-0.583547 O b'+1:lemma:.'
-0.583547 O b'+1:postag:.'
-0.587969 O b'lemma:mid-log'
-0.616736 O b'-1:lemma:cra'
-0.626025 Supp b'lemma[:1]:c'
-0.634232 Med b'symb'
-0.636392 Supp b'lemma[:2]:an'
-0.643020 O b'-1:lemma:nsrr'
-0.651532 O b'+1:postag:NNS'
-0.679804 Gtype b'lemma[:1]:m'
-0.686303 O b'lemma[:1]:0'
-0.688904 O b'+1:lemma:supplement'
-0.736464 Supp b'-1:lemma:%'
-0.766132 O b'+1:lemma:hour'
-0.767111 O b'lemma:rifampicin'
-0.796135 O b'+1:lemma:g/l'
-0.812830 O b'-1:lemma:co2'
-0.838937 Gtype b'lemma[:1]:c'
-0.841550 O b'-1:lemma:dissolve'
-0.841550 O b'+1:lemma:methanol'
-0.856382 O b'lemma:methanol'
-0.892060 Phase b'hUpper'
-0.892060 Phase b'hLower'
-0.975475 O b'+1:lemma:at'
-0.989308 O b'lemma[:1]:A'
-1.004723 Anti b'postag:NNP'
-1.018629 OD b'+1:postag:NN'
-1.026001 Air b'-1:postag:JJ'
-1.155732 O b'-1:postag:VBG'
-1.224739 Gtype b'lemma[:1]:a'
-1.278104 O b'-1:postag::'
-1.599751 Supp b'hGreek'
-1.606260 Supp b'symb'
-1.617602 O b'lemma[:1]:\xce\xb4'
-1.739815 OD b'postag[:1]:-'
-1.843942 O b'+1:lemma:in'
-1.945645 O b'+1:lemma:2'
-1.964299 OD b'lemma[:1]:-'
-2.043167 O b'-1:lemma:2'
-2.316510 O b'+1:lemma:1'
-4.221572 O b'-1:lemma::'
-4.721306 O b'-1:lemma:_'
********** TRAINING AND TESTING REPORT **********
Training file: training-data-set-70_v4.txt
best params:{'c1': 0.03056779653153922, 'c2': 0.04972818685122124}
best CV score:0.7979170694802522
model size: 0.10M
best params:{'c1': 0.27193776724339846, 'c2': 0.057295268767110843}
best CV score:0.8163630580002407
model size: 0.08M
Flat F1: 0.7933473757323906
Flat F1: 0.8109731224696033
precision recall f1-score support
OD 1.000 0.405 0.577 37
OD 0.789 0.405 0.536 37
pH 1.000 1.000 1.000 12
Technique 0.952 0.909 0.930 22
Med 0.891 0.860 0.875 57
Technique 1.000 0.909 0.952 22
Med 0.897 0.912 0.904 57
Temp 0.818 1.000 0.900 18
Vess 0.000 0.000 0.000 0
Agit 0.000 0.000 0.000 0
Phase 1.000 0.947 0.973 19
Air 0.754 0.742 0.748 62
Anti 1.000 0.667 0.800 9
Phase 1.000 0.895 0.944 19
Air 0.807 0.742 0.773 62
Anti 0.800 0.889 0.842 9
Strain 1.000 1.000 1.000 1
Gtype 0.862 0.764 0.810 106
Gtype 0.896 0.811 0.851 106
Substrain 0.000 0.000 0.000 1
Supp 0.865 0.662 0.750 136
Supp 0.835 0.706 0.765 136
Gversion 0.000 0.000 0.000 0
avg / total 0.876 0.742 0.793 480
avg / total 0.864 0.773 0.811 480
Top likely transitions:
OD -> OD 5.500349
Temp -> Temp 4.915043
Agit -> Agit 4.909226
Air -> Air 4.785921
Med -> Med 4.785670
Anti -> Anti 4.760878
O -> O 4.531217
Gversion -> Gversion 4.225381
Phase -> Phase 3.928282
Gtype -> Gtype 3.900260
Supp -> Supp 3.589674
Technique -> Technique 2.798353
pH -> pH 2.196128
O -> Supp 1.783329
Substrain -> Gtype 1.742663
Gtype -> Supp 1.431329
Air -> O 1.367539
O -> Gtype 1.348906
O -> Technique 1.109884
Technique -> Air 1.076025
O -> Temp 0.929238
Gtype -> pH 0.717732
O -> Anti 0.700988
Med -> O 0.588191
Gtype -> Air 0.487796
O -> Strain 0.399055
O -> Gversion 0.366108
O -> pH 0.354024
O -> Vess 0.200749
Phase -> O 0.164004
OD -> Phase 0.128366
O -> Med 0.084648
Supp -> O 0.064532
O -> Phase 0.054268
Temp -> O 0.034554
O -> OD 0.002316
pH -> Gversion -0.000024
O -> Substrain -0.000046
Agit -> OD -0.000091
Technique -> Phase -0.002460
Phase -> Air -0.004039
Med -> OD -0.010012
Gversion -> pH -0.019017
Air -> Anti -0.028855
Gtype -> Strain -0.034925
Air -> Gversion -0.046350
Gtype -> Agit -0.051780
pH -> Temp -0.055396
Anti -> pH -0.065064
Substrain -> Supp -0.073862
OD -> OD 6.289427
Agit -> Agit 6.267353
Temp -> Temp 5.783774
Air -> Air 5.351944
Med -> Med 5.160137
Anti -> Anti 4.729843
Gversion -> Gversion 4.256435
Gtype -> Gtype 4.229740
Supp -> Supp 4.114596
Phase -> Phase 4.079539
Technique -> Technique 3.363448
O -> O 3.125273
pH -> pH 2.487113
O -> Supp 1.331978
Air -> O 1.197935
Substrain -> Gtype 0.867656
O -> Technique 0.848943
Gtype -> Supp 0.842999
O -> Gtype 0.806504
Med -> O 0.277505
OD -> Phase 0.274387
Technique -> Air 0.254899
Gtype -> Air 0.194030
O -> Anti 0.155845
Temp -> O 0.076714
O -> Temp 0.055684
O -> Gversion 0.011422
Phase -> Technique -0.000422
O -> Med -0.114582
Supp -> Technique -0.122463
Phase -> OD -0.142889
Supp -> O -0.146822
O -> Phase -0.168062
O -> OD -0.179767
OD -> Gtype -0.206495
Supp -> Gtype -0.284656
Gtype -> Med -0.297248
Gtype -> OD -0.310283
Technique -> OD -0.344965
OD -> Air -0.364197
Anti -> O -0.368065
Technique -> pH -0.470302
Gversion -> O -0.499305
Supp -> Med -0.541780
Gtype -> Anti -0.621750
OD -> O -0.828115
O -> Air -0.867377
Med -> Supp -0.872960
Gtype -> O -0.956730
Substrain -> O -1.072085
Top unlikely transitions:
OD -> Anti -0.306626
Technique -> Med -0.317775
Technique -> O -0.337656
Technique -> Gversion -0.339632
Anti -> Supp -0.346709
Gversion -> Gtype -0.359654
OD -> Temp -0.364068
Anti -> Gtype -0.374696
Air -> Temp -0.398364
Gversion -> Technique -0.424722
Gversion -> Supp -0.427358
Gtype -> Phase -0.440633
OD -> Technique -0.441830
Gversion -> Air -0.472797
Med -> Air -0.491373
OD -> Supp -0.502001
Anti -> OD -0.541429
Supp -> pH -0.552035
Temp -> Med -0.559365
O -> Air -0.562556
Supp -> Temp -0.563090
Gtype -> Technique -0.587403
Phase -> Technique -0.587965
Supp -> Phase -0.590123
Air -> Supp -0.631042
Air -> Med -0.640889
OD -> Med -0.665368
Technique -> Supp -0.671196
Gtype -> Gversion -0.722812
Supp -> Anti -0.732707
Supp -> OD -0.751148
Air -> OD -0.751415
OD -> Gtype -0.801738
Agit -> O -0.827165
Supp -> Technique -0.836650
Supp -> Gversion -0.836877
Gtype -> Med -0.875397
Supp -> Air -0.884655
Gtype -> Anti -0.943614
Supp -> Gtype -0.974424
OD -> O -1.010665
OD -> Air -1.028154
Substrain -> O -1.046580
Gtype -> OD -1.131529
Technique -> Gtype -1.214725
Technique -> pH -1.220888
Technique -> OD -1.238019
Supp -> Med -1.342545
Med -> Supp -1.444556
Phase -> OD -1.784428
Temp -> Temp 5.783774
Air -> Air 5.351944
Med -> Med 5.160137
Anti -> Anti 4.729843
Gversion -> Gversion 4.256435
Gtype -> Gtype 4.229740
Supp -> Supp 4.114596
Phase -> Phase 4.079539
Technique -> Technique 3.363448
O -> O 3.125273
pH -> pH 2.487113
O -> Supp 1.331978
Air -> O 1.197935
Substrain -> Gtype 0.867656
O -> Technique 0.848943
Gtype -> Supp 0.842999
O -> Gtype 0.806504
Med -> O 0.277505
OD -> Phase 0.274387
Technique -> Air 0.254899
Gtype -> Air 0.194030
O -> Anti 0.155845
Temp -> O 0.076714
O -> Temp 0.055684
O -> Gversion 0.011422
Phase -> Technique -0.000422
O -> Med -0.114582
Supp -> Technique -0.122463
Phase -> OD -0.142889
Supp -> O -0.146822
O -> Phase -0.168062
O -> OD -0.179767
OD -> Gtype -0.206495
Supp -> Gtype -0.284656
Gtype -> Med -0.297248
Gtype -> OD -0.310283
Technique -> OD -0.344965
OD -> Air -0.364197
Anti -> O -0.368065
Technique -> pH -0.470302
Gversion -> O -0.499305
Supp -> Med -0.541780
Gtype -> Anti -0.621750
OD -> O -0.828115
O -> Air -0.867377
Med -> Supp -0.872960
Gtype -> O -0.956730
Substrain -> O -1.072085
Agit -> O -1.092872
Technique -> O -1.136884
Top positive:
6.692463 O b'lemma:_'
5.657865 O b'lemma:1'
4.942948 Phase b'lemma:stationary'
4.925287 O b'lemma:2'
4.843804 Air b'lemma:anaerobic'
4.814975 Strain b'lemma:k-12'
4.647361 Technique b'lemma:ChIP-exo'
4.622048 Supp b'lemma:Iron'
4.599836 Technique b'lemma:chipseq'
4.422488 Air b'lemma:aerobic'
4.412579 O b'lemma:rpob'
4.377913 O b'postag:IN'
4.349481 Supp b'lemma:pq'
4.294520 O b'lemma:3'
4.161278 Supp b'lemma:nh4cl'
4.073955 Supp b'lemma:glucose'
3.969533 O b'lemma:rep1'
3.919806 Gtype b'lemma:arca8myc'
3.916893 Gtype b'lemma:flag-tag'
3.916893 Gtype b'-1:lemma:c-terminal'
3.877994 Gtype b'lemma:\xce\xb4cra'
3.870087 Phase b'lemma:mid-log'
3.844857 Air b'-1:lemma:ChIP-Seq'
3.795026 O b'lemma:rep2'
3.756394 Gtype b'lemma:wt'
3.756244 Gversion b'lemma:asm584v2'
3.735954 Substrain b'lemma:mg1655'
3.630823 Gtype b'-1:lemma:\xe2\x88\x86'
3.587007 Supp b'lemma:nitrate'
3.584699 Supp b'+1:lemma:\xc2\xb5m'
3.571404 O b'lemma:Cra'
3.546169 Supp b'lemma:acetate'
3.518531 O b'lemma:b'
3.492146 O b'postag::'
3.490669 O b'lemma:rep3'
3.441030 O b'lemma:a'
3.439329 O b'-1:lemma:tag'
3.376019 Supp b'lemma:no3'
3.358527 Gtype b'lemma:delta-arca'
3.341462 Med b'lemma:LB'
3.335616 Air b'lemma:Aerobic'
3.304114 OD b'lemma:od600'
3.286213 Supp b'lemma:Fe'
3.283134 Supp b'lemma:dpd'
3.262389 O b'lemma:.'
3.262389 O b'postag:.'
3.262118 Gtype b'lemma:fnr8myc'
3.241225 Technique b'lemma:rna-seq'
3.161606 Med b'lemma:lb'
3.100373 Technique b'lemma:chip-seq'
3.056207 O b'lemma:\xcf\x8332'
3.050606 O b'-1:lemma:Aerobic'
3.038793 Med b'lemma:MOPS'
3.034791 Anti b'lemma:none'
3.020225 O b'postag:VBN'
2.971269 O b'-1:lemma:ChIP-exo'
2.958452 Anti b'lemma:seqa'
2.958367 O b'lemma:CEL'
2.941302 OD b'lemma:od450'
2.935356 O b'+1:lemma:od600'
2.927938 Gtype b'lemma:\xe2\x88\x86'
2.911881 Supp b'+1:lemma:1'
2.911524 Supp b'lemma:fructose'
2.871399 Technique b'lemma:rnaseq'
2.859600 O b'+1:postag:RB'
2.839822 Gtype b'lemma:delta-fnr'
2.810955 O b'lemma:Custom'
2.809182 Supp b'lemma:rifampicin'
2.808831 O b'lemma:-'
2.789937 Gtype b'lemma:type'
2.788256 Supp b'+1:lemma:Deficient'
2.770982 Gtype b'+1:lemma:type'
2.748917 Supp b'+1:lemma:2'
2.743490 Gversion b'lemma:nc'
2.738725 Med b'+1:lemma:0.4'
2.720595 pH b'lemma:ph5'
2.720595 pH b'+1:lemma:.5'
2.676119 Supp b'-1:lemma:Cra'
2.658000 Gtype b'lemma:\xce\xb4fur'
2.652362 Gtype b'+1:lemma:with'
2.618562 Gversion b'lemma:chip-seq'
2.610176 Air b'postag:RB'
2.594937 Gtype b'lemma:nsrr'
2.583087 Technique b'lemma:ChIP-Seq'
2.578250 Vess b'lemma:flask'
2.578250 Vess b'-1:lemma:warm'
2.563672 O b'lemma:affyexp'
2.551761 O b'-1:lemma:glucose'
2.545085 O b'lemma:chip-arca'
2.505127 Supp b'+1:lemma:_'
2.499915 O b'-1:lemma:anaerobic'
2.495203 Supp b'lemma:arginine'
2.492742 O b'lemma:s'
2.486425 Gversion b'lemma:000913'
2.464249 O b'-1:lemma:0.3-0.35'
2.449997 O b'lemma:oxyr'
2.448215 Gversion b'lemma:.2'
2.448215 Gversion b'-1:lemma:u00096'
2.435265 Anti b'lemma:anti-myc'
2.432726 Gtype b'lemma:wild-type'
2.423727 Temp b'lemma:\xc2\xb0c'
2.395174 Technique b'-1:lemma:IP'
2.393484 O b'-1:lemma:stpa'
2.388764 Gversion b'lemma:u00096'
2.388764 Gversion b'+1:lemma:.2'
2.368933 Phase b'-1:lemma:mid-log'
2.366886 Gtype b'lemma:WT'
2.348028 O b'lemma:with'
2.344016 O b'lemma:or'
2.343871 O b'+1:lemma:anti-fur'
2.313839 Gtype b'lemma:\xce\xb4soxs'
2.310686 Strain b'+1:lemma:substr'
2.303744 O b'-1:lemma:lb'
2.288133 O b'lemma:argr'
2.284029 Gtype b'+1:lemma:pq'
2.277137 O b'+1:lemma:pq'
2.253710 O b'lemma:ompr'
2.244848 Gtype b'-1:lemma:ptac'
2.214837 Med b'lemma:m63'
2.208372 Air b'lemma:anaerobically'
2.207760 Gversion b'-1:lemma:nc'
2.185269 Air b'lemma:Anaerobic'
2.177809 Supp b'lemma:nacl'
2.172428 Gtype b'+1:lemma:flagtag'
2.169963 Med b'+1:lemma:2.0'
2.169550 O b'postag:SYM'
2.165014 O b'lemma:purr'
2.160892 pH b'+1:postag:CD'
2.150124 Temp b'-1:lemma:37'
2.150116 O b'lemma:chip'
2.133824 O b'+1:lemma:mid-log'
2.130811 Gtype b'lemma:\xce\xb4ompr'
2.113515 Air b'-1:lemma:-'
2.112847 Gtype b'lemma:ptac'
2.087871 O b'lemma:Lrp'
2.073270 Gtype b'-1:lemma:_'
2.071479 Technique b'-1:lemma:chip-exo'
2.052465 O b'-1:lemma:type'
2.046273 O b'+1:lemma:o.d.'
2.034128 Technique b'postag:NNP'
2.032694 OD b'+1:lemma:stationary'
2.029532 Gtype b'lemma:deltaseqa'
2.029532 Gtype b'-1:lemma:old'
2.029028 Technique b'-1:lemma:input'
2.028724 Temp b'+1:lemma:\xc2\xb0c'
2.028052 Med b'postag:NNP'
2.019887 O b'+1:lemma:chip-seq'
2.016529 Vess b'-1:postag:VBN'
2.014709 Anti b'+1:lemma:antibody'
2.004528 Supp b'+1:lemma:hour'
1.986808 Gtype b'+1:lemma:ph5'
1.982154 Temp b'-1:lemma:43'
1.979758 Gtype b'+1:lemma:aerobic'
1.979385 Supp b'lemma:Leu'
1.977544 Med b'+1:lemma:minimal'
1.972140 Substrain b'+1:lemma:phtpg'
1.966671 O b'lemma:Fur'
1.952996 Technique b'-1:lemma:_'
1.947488 Supp b'lemma:iptg'
1.947369 O b'+1:lemma:43'
1.947148 Temp b'lemma:43'
1.946657 Supp b'-1:lemma:\xc2\xb5m'
1.946349 Med b'+1:lemma:+'
1.946188 Phase b'lemma:phase'
1.940761 Gtype b'lemma:pk4854'
1.924723 O b'lemma:genotype/variation'
1.911694 Gtype b'+1:lemma:_'
1.910805 Temp b'-1:lemma:\xcf\x8332'
1.907106 Supp b'lemma:Adenine'
1.906722 Technique b'+1:lemma:chip-exo'
1.906375 Anti b'lemma:anti-rpos'
1.904230 Air b'+1:lemma:at'
1.903056 Gversion b'+1:lemma:000913'
1.901487 Med b'lemma:glucose'
1.889441 O b'lemma:chip-fnr'
1.887601 Gtype b'-1:lemma:nsrr'
1.878766 O b'postag:DT'
1.873733 pH b'lemma:.5'
1.873733 pH b'-1:lemma:ph5'
1.865998 O b'lemma:culture'
1.855758 O b'lemma:for'
1.853813 Gtype b'-1:lemma:rpob'
1.853644 O b'lemma:soxs'
1.853644 O b'lemma:soxr'
1.846904 Gtype b'-1:lemma::'
1.845474 Temp b'-1:lemma:sample'
1.841250 Air b'lemma:anerobically'
1.838140 Air b'-1:postag:CD'
1.831417 Med b'-1:lemma:ml'
1.825450 Phase b'+1:lemma:for'
1.820952 O b'-1:lemma:0.3'
1.816339 Air b'-1:postag::'
1.812600 O b'postag:CC'
1.810282 Supp b'+1:lemma:respiratory'
1.805085 Supp b'lemma:methanol'
1.803745 Supp b'lemma:20'
1.782276 Med b'lemma:L'
1.782276 Med b'+1:lemma:broth'
1.779488 O b'lemma:pt7'
1.771701 OD b'-1:lemma:~'
4.371447 Technique b'lemma[:2]:Ch'
3.412737 O b'lemma[:2]:re'
3.346233 Air b'lemma:anaerobic'
3.006455 O b'lemma:1'
3.006455 O b'lemma[:2]:1'
2.974851 Gtype b'lemma[:1]:\xce\xb4'
2.912775 Gtype b'lemma:arca8myc'
2.849140 Supp b'+1:lemma:\xc2\xb5m'
2.828513 Phase b'lemma:mid-log'
2.792393 O b'lemma:_'
2.792393 O b'lemma[:1]:_'
2.792393 O b'lemma[:2]:_'
2.775899 Gtype b'-1:lemma:\xe2\x88\x86'
2.625937 Air b'-1:lemma:ChIP-Seq'
2.548311 Phase b'lemma:stationary'
2.540916 Supp b'+1:lemma:1'
2.487761 Supp b'+1:lemma:2'
2.442931 Air b'lemma:aerobic'
2.440190 O b'lemma[:2]:ge'
2.435018 Gtype b'lemma[:2]:fl'
2.424212 O b'-1:lemma:tag'
2.408234 Supp b'lemma:Iron'
2.408234 Supp b'lemma[:2]:Ir'
2.348537 Technique b'lemma[:1]:C'
2.317292 O b'lemma:2'
2.317292 O b'lemma[:2]:2'
2.308110 OD b'lemma[:2]:od'
2.302326 Gtype b'lemma:type'
2.302326 Gtype b'lemma[:2]:ty'
2.269875 Supp b'lemma:nitrate'
2.269875 Supp b'lemma[:2]:ni'
2.232923 O b'-1:lemma:ChIP-exo'
2.212341 Air b'lemma[:2]:an'
2.211030 Air b'lemma[:2]:ae'
2.210563 Med b'+1:lemma:0.4'
2.190483 O b'lemma:3'
2.190483 O b'lemma[:2]:3'
2.182751 O b'+1:lemma:pq'
2.164071 Anti b'lemma[:2]:an'
2.150488 O b'lemma:rpob'
2.116867 Gtype b'lemma:flag-tag'
2.116867 Gtype b'-1:lemma:c-terminal'
2.113845 Technique b'lemma:chipseq'
2.106619 O b'+1:lemma:od600'
2.103057 Anti b'+1:lemma:antibody'
2.102593 O b'lemma:with'
2.082800 O b'+1:postag:RB'
2.080780 Supp b'lemma:pq'
2.080780 Supp b'lemma[:2]:pq'
2.074963 Technique b'lemma[:2]:rn'
2.067178 Gtype b'lemma[:2]:cr'
2.064575 Med b'lemma[:1]:L'
2.061976 Supp b'lemma:arginine'
2.026279 Supp b'-1:lemma:Cra'
2.019223 Supp b'lemma:fructose'
1.992770 Gversion b'lemma:nc'
1.992770 Gversion b'lemma[:2]:nc'
1.980198 O b'lemma:0.4'
1.979285 Gtype b'lemma[:2]:de'
1.970609 O b'isLower'
1.937619 Strain b'lemma:k-12'
1.937619 Strain b'lemma[:2]:k-'
1.931122 O b'-1:lemma:0.3-0.35'
1.881593 Supp b'-1:lemma:with'
1.875598 Gtype b'lemma:nsrr'
1.875598 Gtype b'lemma[:2]:ns'
1.852069 Technique b'lemma[:2]:ch'
1.836687 pH b'lemma:ph5'
1.836687 pH b'+1:lemma:.5'
1.832664 Gtype b'lemma[:2]:ar'
1.831556 Air b'lemma[:1]:A'
1.826833 Temp b'lemma[:1]:3'
1.823899 Substrain b'lemma:mg1655'
1.820738 Gversion b'-1:lemma:nc'
1.820497 O b'postag::'
1.820497 O b'postag[:1]::'
1.820497 O b'postag[:2]::'
1.813703 O b'-1:lemma:Aerobic'
1.796031 Gtype b'lemma[:1]:w'
1.792963 O b'postag:IN'
1.792963 O b'postag[:1]:I'
1.792963 O b'postag[:2]:IN'
1.783756 Gtype b'lemma:wt'
1.783756 Gtype b'lemma[:2]:wt'
1.779970 Gtype b'lemma[:1]:W'
1.766922 Air b'lemma:Aerobic'
1.766922 Air b'lemma[:2]:Ae'
1.762347 Strain b'lemma[:1]:k'
1.759570 Technique b'symb'
1.750706 Gversion b'lemma[:2]:00'
1.749953 Gtype b'-1:lemma:_'
1.737043 Substrain b'lemma[:2]:mg'
1.733603 O b'-1:lemma:anaerobic'
1.709162 Gversion b'lemma:chip-seq'
1.701695 Temp b'-1:lemma:sample'
1.688968 Gtype b'+1:lemma:with'
1.684459 O b'-1:lemma:lb'
1.661522 Supp b'-1:postag:CC'
1.650389 O b'lemma:b'
1.650389 O b'lemma[:2]:b'
1.646363 O b'-1:lemma:0.3'
1.639941 Gtype b'+1:lemma:type'
1.637375 Air b'-1:lemma:co2'
1.636378 Med b'lemma:lb'
1.636378 Med b'lemma[:2]:lb'
1.622025 Vess b'lemma[:2]:fl'
1.617013 O b'-1:lemma:glucose'
1.592815 Med b'isUpper'
1.589934 Supp b'lemma:rifampicin'
1.589786 O b'lemma:a'
1.589786 O b'lemma[:2]:a'
1.586603 O b'+1:lemma:nacl'
1.583003 Supp b'lemma[:1]:I'
1.580604 Supp b'lemma[:2]:gl'
1.576478 Supp b'lemma[:2]:ri'
1.566704 Vess b'lemma:flask'
1.566704 Vess b'-1:lemma:warm'
1.563672 O b'-1:lemma:l1'
1.557695 Med b'lemma:MOPS'
1.557695 Med b'lemma[:1]:M'
1.557695 Med b'lemma[:2]:MO'
1.555428 O b'+1:postag:NNP'
1.545733 Gtype b'hGreek'
1.540517 Supp b'+1:lemma:_'
1.532630 Strain b'+1:lemma:substr'
1.524978 Phase b'-1:lemma:mid-log'
1.523410 O b'lemma:Custom'
1.523410 O b'lemma[:2]:Cu'
1.506527 Supp b'lemma[:2]:0.'
1.493748 Med b'+1:lemma:2.0'
1.489084 Gtype b'-1:lemma:rpob'
1.468114 Technique b'lemma:ChIP-exo'
1.462941 Vess b'-1:postag:VBN'
1.460306 Supp b'-1:postag:CD'
1.447232 Gversion b'lemma:asm584v2'
1.442845 Gversion b'lemma[:2]:as'
1.436821 Supp b'lemma[:1]:n'
1.435640 Temp b'lemma:43'
1.435640 Temp b'lemma[:2]:43'
1.430453 Gtype b'lemma:fnr8myc'
1.423051 Temp b'-1:lemma:43'
1.422224 O b'+1:lemma:ph5'
1.419624 Supp b'lemma:acetate'
1.403936 Med b'lemma[:1]:m'
1.397641 O b'lemma:Cra'
1.397641 O b'lemma[:2]:Cr'
1.395977 Temp b'-1:lemma:\xcf\x8332'
1.392367 O b'lemma:.'
1.392367 O b'postag:.'
1.392367 O b'postag[:1]:.'
1.392367 O b'postag[:2]:.'
1.392367 O b'lemma[:2]:.'
1.391334 Gtype b'+1:lemma:flagtag'
1.377069 OD b'+1:lemma:stationary'
1.376467 Supp b'lemma[:1]:1'
1.373778 Gtype b'-1:postag:VBG'
1.369190 pH b'+1:postag:CD'
1.364150 Phase b'-1:lemma:until'
1.356359 Air b'+1:postag:IN'
1.353508 Air b'lemma[:1]:a'
1.350471 Supp b'lemma:no3'
1.347435 Med b'lemma:broth'
1.347435 Med b'-1:lemma:L'
1.347435 Med b'lemma[:2]:br'
1.340636 Gtype b'symb'
1.337653 Supp b'lemma[:1]:2'
1.337468 OD b'lemma[:1]:o'
1.332813 O b'+1:lemma:anti-fur'
1.329231 Gtype b'+1:lemma::'
1.323371 Temp b'+1:lemma:\xc2\xb0c'
1.316239 O b'-1:lemma:media'
1.308580 Anti b'-1:lemma::'
1.308448 Technique b'-1:lemma:input'
1.305697 Gtype b'lemma[:1]:f'
1.304733 O b'lemma[:1]:r'
1.298211 Gversion b'+1:lemma:000913'
1.282839 Supp b'lemma:methanol'
1.281363 Air b'-1:postag:CD'
1.280599 Supp b'lemma:Fe'
1.280599 Supp b'lemma[:2]:Fe'
1.280195 O b'lemma[:1]:C'
1.274450 O b'-1:lemma:type'
1.274241 Supp b'lemma:dpd'
1.274241 Supp b'lemma[:2]:dp'
1.264726 Phase b'lemma[:2]:st'
1.261615 Med b'+1:lemma:-lrb-'
1.258563 Phase b'lemma[:2]:mi'
1.256496 Supp b'lemma:of'
1.256496 Supp b'lemma[:2]:of'
1.254569 Substrain b'+1:lemma:phtpg'
1.254075 Technique b'-1:lemma:_'
1.245791 Med b'+1:postag:-LRB-'
1.240716 Technique b'lemma[:1]:c'
1.237704 Anti b'lemma:none'
1.235216 Supp b'lemma[:2]:ac'
1.234140 Gtype b'-1:lemma:nsrr'
1.233335 O b'lemma:\xcf\x8332'
1.233335 O b'lemma[:1]:\xcf\x83'
1.233335 O b'lemma[:2]:\xcf\x833'
1.229676 Air b'-1:lemma:-'
Top negative:
-0.098597 OD b'+1:lemma:in'
-0.100809 O b'+1:lemma:pahse'
-0.103942 Gtype b'-1:lemma:,'
-0.103942 Gtype b'-1:postag:,'
-0.109064 Supp b'+1:postag:IN'
-0.116184 O b'-1:lemma:the'
-0.120961 Phase b'-1:postag:NN'
-0.125524 Air b'-1:postag:CC'
-0.130098 O b'+1:lemma:sample'
-0.133275 Med b'lemma:-lrb-'
-0.133905 OD b'+1:lemma:0.4'
-0.137686 O b'-1:lemma:minimal'
-0.138574 Air b'-1:postag:-RRB-'
-0.140110 Air b'-1:lemma:-rrb-'
-0.141778 Med b'postag:-LRB-'
-0.148667 Med b'-1:postag:NN'
-0.152662 O b'-1:postag:IN'
-0.152746 O b'lemma:medium'
-0.153545 O b'lemma:n2'
-0.154206 Air b'postag:CC'
-0.163582 O b'-1:postag:VBN'
-0.164052 O b'-1:lemma:n2'
-0.167774 Gtype b'+1:lemma:cra'
-0.171535 O b'-1:lemma:with'
-0.177101 Gtype b'+1:lemma:-lrb-'
-0.181072 Gtype b'postag:CD'
-0.190005 O b'lemma:pahse'
-0.191122 Gtype b'+1:lemma:a'
-0.193246 O b'+1:lemma:_'
-0.200535 OD b'+1:lemma:mid-log'
-0.201151 O b'lemma:co2'
-0.203533 O b'-1:lemma:-lrb-'
-0.203756 O b'+1:lemma:phase'
-0.207632 O b'-1:lemma:e.'
-0.208480 O b'-1:lemma:purify'
-0.211803 O b'lemma:grow'
-0.213447 O b'+1:lemma:delta'
-0.215349 Air b'postag:CD'
-0.217993 O b'+1:lemma:-rrb-'
-0.219170 Supp b'lemma:and'
-0.221278 O b'lemma:10'
-0.224277 O b'+1:lemma:.'
-0.224277 O b'+1:postag:.'
-0.226140 O b'-1:lemma:fresh'
-0.227840 O b'+1:lemma:mg1655'
-0.233692 O b'-1:postag:VBP'
-0.243094 O b'+1:lemma:-lcb-'
-0.244688 O b'lemma:30'
-0.248768 Med b'-1:postag:CD'
-0.248953 O b'lemma:8'
-0.252377 O b'+1:lemma:%'
-0.257481 O b'lemma:minimal'
-0.257830 Technique b'-1:lemma::'
-0.259100 Gversion b'+1:postag:NN'
-0.259164 O b'-1:postag:-LRB-'
-0.259192 Med b'+1:postag:NN'
-0.265097 O b'+1:lemma:strain'
-0.270448 O b'-1:lemma:mm'
-0.271962 O b'+1:lemma:0.4'
-0.272630 O b'-1:lemma:chip-exo'
-0.277009 OD b'+1:postag:CD'
-0.278470 O b'+1:lemma:minimal'
-0.286163 O b'+1:lemma:antibody'
-0.294848 Gtype b'-1:postag:CD'
-0.294973 O b'+1:lemma:from'
-0.303885 O b'-1:lemma:grow'
-0.306933 O b'lemma:e.'
-0.309307 Air b'-1:lemma:or'
-0.312327 O b'postag:RB'
-0.312620 OD b'+1:postag:CC'
-0.316727 Anti b'+1:postag:JJ'
-0.319089 O b'-1:lemma:mid-log'
-0.321702 O b'-1:lemma:um'
-0.321702 O b'+1:lemma:paraquat'
-0.322815 O b'-1:lemma:0.1'
-0.325506 Supp b'+1:postag:VBN'
-0.327089 Med b'+1:postag:NNS'
-0.329088 Supp b'-1:lemma:%'
-0.335665 Med b'postag:CD'
-0.345089 O b'+1:lemma:shake'
-0.346024 O b'lemma:nacl'
-0.346568 Med b'-1:postag:IN'
-0.349877 O b'-1:lemma:iptg'
-0.351934 Supp b'-1:postag:VBG'
-0.361114 Phase b'-1:lemma:at'
-0.363308 Gtype b'+1:lemma:b'
-0.369166 O b'+1:lemma:b'
-0.370353 O b'+1:postag:IN'
-0.375482 O b'+1:lemma:rep1'
-0.382649 OD b'postag:JJ'
-0.389625 O b'-1:lemma:rifampicin'
-0.390229 O b'-1:lemma:20'
-0.392434 O b'+1:lemma:300'
-0.392765 O b'-1:lemma:od600'
-0.396162 O b'lemma:\xc2\xb0c'
-0.397112 Temp b'postag:JJ'
-0.398067 O b'+1:postag:-RRB-'
-0.412750 O b'-1:lemma:affinity'
-0.416189 O b'+1:lemma:dissolve'
-0.417913 O b'+1:lemma:cell'
-0.426120 O b'-1:lemma:from'
-0.472958 O b'-1:lemma:30'
-0.483340 Technique b'-1:postag::'
-0.483753 Temp b'+1:lemma:to'
-0.483753 Temp b'+1:postag:TO'
-0.484495 O b'+1:lemma:c'
-0.487031 Supp b'+1:lemma:glucose'
-0.495206 Gtype b'lemma:_'
-0.505255 Supp b'postag:CC'
-0.505610 O b'-1:lemma:cra'
-0.512805 O b'lemma:dissolve'
-0.519407 O b'lemma:glucose'
-0.530802 O b'+1:lemma:Aerobic'
-0.536055 O b'lemma:mg1655'
-0.538193 O b'+1:lemma:arginine'
-0.540056 O b'lemma:dpd'
-0.543308 O b'+1:lemma:until'
-0.553627 pH b'postag:NN'
-0.557904 O b'-1:lemma:until'
-0.560304 OD b'+1:postag:NN'
-0.577595 O b'-1:lemma:g/l'
-0.579159 OD b'+1:lemma:and'
-0.595749 O b'lemma:phase'
-0.611587 Gtype b'+1:lemma:\xe2\x88\x86'
-0.614217 Gtype b'-1:postag:SYM'
-0.624715 O b'lemma:purify'
-0.636366 O b'lemma:150'
-0.636366 O b'+1:lemma:mg/ml'
-0.638397 Gtype b'-1:postag:DT'
-0.657927 O b'lemma:m63'
-0.664969 Gtype b'lemma:delta'
-0.666049 OD b'lemma:-lrb-'
-0.682691 Supp b'+1:lemma:rifampicin'
-0.692119 Temp b'-1:lemma:\xc2\xb0c'
-0.706829 O b'lemma:lb'
-0.708511 Med b'+1:postag:IN'
-0.711784 O b'-1:lemma:~'
-0.714372 O b'+1:lemma:0.3'
-0.716136 O b'+1:postag:NNS'
-0.736106 O b'+1:lemma:\xc2\xb0c'
-0.738116 Phase b'postag:JJ'
-0.744781 O b'-1:lemma:1'
-0.764657 OD b'postag:-LRB-'
-0.767869 Temp b'postag:NN'
-0.772655 O b'lemma:of'
-0.774528 O b'-1:lemma:\xe2\x88\x86'
-0.806745 O b'+1:lemma:fecl2'
-0.808726 O b'lemma:anaerobically'
-0.817926 O b'-1:lemma:0.2'
-0.828109 O b'lemma:media'
-0.860850 Phase b'-1:postag:JJ'
-0.869705 Air b'-1:postag:JJ'
-0.869779 Anti b'+1:lemma:anti-fur'
-0.913352 O b'lemma:0.3'
-0.926265 O b'lemma:20'
-0.966551 O b'+1:lemma:in'
-0.967999 O b'-1:lemma:co2'
-0.983473 O b'lemma:\xe2\x88\x86'
-1.005883 O b'lemma:0.1'
-1.012563 O b'+1:lemma:supplement'
-1.015961 O b'lemma:2h'
-1.015961 O b'-1:lemma:additional'
-1.030442 O b'lemma:fecl2'
-1.035342 Supp b'+1:lemma:acetate'
-1.055745 O b'+1:lemma:g/l'
-1.058371 O b'+1:lemma:at'
-1.065986 O b'+1:postag:VBG'
-1.108278 O b'lemma:anaerobic'
-1.137604 O b'-1:lemma:ompr'
-1.149433 O b'-1:postag:VBG'
-1.157369 O b'-1:lemma:dissolve'
-1.157369 O b'+1:lemma:methanol'
-1.161744 O b'lemma:0.2'
-1.176749 O b'lemma:mid-log'
-1.210434 O b'lemma:\xce\xb4fur'
-1.224092 O b'-1:lemma:sample'
-1.241862 O b'-1:lemma:ml'
-1.249714 O b'lemma:37'
-1.287855 O b'postag:VBP'
-1.290513 O b'lemma:od600'
-1.322257 O b'lemma:k-12'
-1.332061 O b'-1:lemma:rpob'
-1.387093 Supp b'postag:JJ'
-1.418093 O b'-1:postag::'
-1.520563 Anti b'postag:NNP'
-1.552213 O b'-1:lemma:37'
-1.582655 O b'lemma:methanol'
-1.634214 Air b'+1:postag:JJ'
-1.656961 O b'-1:lemma:2'
-1.660038 O b'-1:lemma:nsrr'
-1.778068 O b'-1:lemma:IP'
-1.782125 O b'lemma:rifampicin'
-1.784846 Air b'postag:NN'
-1.792093 O b'+1:lemma:hour'
-1.833447 O b'+1:lemma:+'
-1.873023 O b'lemma:wt'
-1.948439 O b'+1:lemma:2'
-2.447797 O b'+1:lemma:1'
-2.955767 O b'-1:lemma:_'
-3.288596 O b'-1:lemma::'
-0.051463 Temp b'postag:JJ'
-0.054116 Air b'postag[:1]:C'
-0.059372 Phase b'postag[:1]:J'
-0.059372 Phase b'postag[:2]:JJ'
-0.059941 Temp b'postag:NN'
-0.060299 Air b'lemma[:1]:n'
-0.060598 Temp b'isLower'
-0.062297 O b'+1:lemma:or'
-0.065185 Supp b'+1:postag:VBN'
-0.065466 Air b'lemma:and'
-0.066813 Gtype b'-1:postag:NN'
-0.068526 O b'lemma[:2]:ce'
-0.071041 O b'-1:postag:JJ'
-0.071759 OD b'lemma:-lrb-'
-0.074300 OD b'lemma[:1]:t'
-0.074669 Supp b'postag:CD'
-0.074669 Supp b'postag[:2]:CD'
-0.078783 O b'lemma[:2]:30'
-0.079591 OD b'postag:-LRB-'
-0.079591 OD b'postag[:2]:-L'
-0.079591 OD b'lemma[:2]:-l'
-0.080662 O b'lemma[:2]:an'
-0.083375 O b'-1:postag:-RRB-'
-0.083466 O b'lemma:150'
-0.083466 O b'+1:lemma:mg/ml'
-0.083466 O b'lemma[:2]:15'
-0.084358 O b'lemma:glucose'
-0.089803 Supp b'lemma[:1]:o'
-0.090889 Gtype b'lemma[:1]:r'
-0.094789 OD b'+1:postag:CD'
-0.096046 O b'lemma:co2'
-0.096854 Supp b'lemma:2'
-0.096854 Supp b'lemma[:2]:2'
-0.107550 OD b'+1:lemma:of'
-0.110054 OD b'postag:JJ'
-0.111139 O b'-1:lemma:rna'
-0.113070 Air b'postag:CC'
-0.113070 Air b'postag[:2]:CC'
-0.116092 OD b'postag[:1]:J'
-0.116092 OD b'postag[:2]:JJ'
-0.116551 O b'-1:lemma:\xe2\x88\x86'
-0.119208 O b'-1:lemma:of'
-0.120060 O b'+1:lemma:arginine'
-0.120674 pH b'isLower'
-0.122477 O b'+1:lemma:300'
-0.123572 Phase b'postag:JJ'
-0.126294 O b'-1:lemma:iptg'
-0.129027 Gtype b'-1:lemma:,'
-0.129027 Gtype b'-1:postag:,'
-0.130686 Med b'postag[:1]:C'
-0.131309 Supp b'+1:lemma:rifampicin'
-0.137449 O b'-1:lemma:o2'
-0.138824 O b'-1:lemma:ml'
-0.142350 O b'lemma[:2]:20'
-0.147695 Air b'-1:lemma:anaerobically'
-0.147731 pH b'postag[:1]:N'
-0.147731 pH b'postag[:2]:NN'
-0.150331 Supp b'hUpper'
-0.150331 Supp b'hLower'
-0.151031 Gtype b'-1:postag:SYM'
-0.152040 O b'+1:lemma:rep1'
-0.154569 O b'+1:lemma:-rrb-'
-0.155464 O b'lemma:dissolve'
-0.163005 O b'lemma[:1]:k'
-0.166515 Anti b'+1:lemma:anti-fur'
-0.166530 O b'-1:postag:VBN'
-0.168761 Vess b'hUpper'
-0.168761 Vess b'hLower'
-0.172221 O b'lemma:od600'
-0.173580 O b'+1:lemma:0.3'
-0.174879 O b'+1:lemma:c'
-0.176207 O b'-1:lemma:grow'
-0.180767 Supp b'isUpper'
-0.182914 O b'lemma:phase'
-0.183166 Air b'isUpper'
-0.186591 O b'-1:lemma:-lrb-'
-0.187451 O b'-1:lemma:od600'
-0.193271 O b'+1:lemma:phase'
-0.200473 Air b'+1:postag:-LRB-'
-0.200591 Gtype b'postag[:1]:V'
-0.200591 Gtype b'postag[:2]:VB'
-0.202895 O b'lemma[:2]:ae'
-0.203770 O b'lemma[:1]:d'
-0.213212 Air b'-1:postag:CC'
-0.216984 Technique b'isUpper'
-0.218975 O b'+1:lemma:antibody'
-0.219469 OD b'postag:CD'
-0.219469 OD b'postag[:2]:CD'
-0.220367 Air b'+1:lemma:-lrb-'
-0.229132 O b'lemma[:1]:I'
-0.237062 Med b'+1:postag:NN'
-0.244233 O b'+1:lemma:.'
-0.244233 O b'+1:postag:.'
-0.253501 O b'lemma[:1]:p'
-0.255478 O b'+1:postag:IN'
-0.268269 Air b'+1:postag:JJ'
-0.270663 Supp b'lemma[:2]:an'
-0.277051 O b'+1:lemma:\xc2\xb0c'
-0.289474 Phase b'-1:postag:JJ'
-0.290989 O b'-1:lemma:ompr'
-0.299880 OD b'isNumber'
-0.300487 O b'lemma:of'
-0.300487 O b'lemma[:2]:of'
-0.301898 O b'lemma:wt'
-0.301898 O b'lemma[:2]:wt'
-0.302943 O b'lemma[:2]:0.'
-0.307135 O b'-1:postag:IN'
-0.308105 O b'+1:lemma:fecl2'
-0.311660 Technique b'-1:lemma::'
-0.327682 O b'lemma:37'
-0.327682 O b'lemma[:2]:37'
-0.327793 Supp b'postag[:1]:C'
-0.335851 Phase b'-1:lemma:at'
-0.337349 Supp b'-1:lemma:%'
-0.337470 Med b'-1:postag:CD'
-0.339976 Air b'-1:lemma:or'
-0.355481 O b'-1:postag:-LRB-'
-0.358486 O b'lemma:anaerobically'
-0.362559 Technique b'postag:NN'
-0.363246 Air b'symb'
-0.369284 Temp b'+1:lemma:to'
-0.369284 Temp b'+1:postag:TO'
-0.371266 O b'+1:postag:-RRB-'
-0.373089 O b'lemma[:2]:od'
-0.392668 Gtype b'lemma[:1]:g'
-0.401430 O b'lemma[:1]:L'
-0.407738 OD b'+1:postag:NN'
-0.416254 Agit b'symb'
-0.418662 O b'-1:lemma:co2'
-0.425645 Med b'+1:postag:IN'
-0.435796 Agit b'hUpper'
-0.435796 Agit b'hLower'
-0.441773 O b'lemma:2h'
-0.441773 O b'-1:lemma:additional'
-0.441773 O b'lemma[:2]:2h'
-0.446576 Air b'postag[:1]:N'
-0.446576 Air b'postag[:2]:NN'
-0.451999 O b'lemma:20'
-0.454739 Technique b'isLower'
-0.455345 Air b'isLower'
-0.459952 Med b'-1:postag:NN'
-0.491723 O b'lemma[:2]:me'
-0.493797 Supp b'postag:JJ'
-0.504237 O b'-1:lemma:37'
-0.511772 Supp b'postag[:1]:J'
-0.511772 Supp b'postag[:2]:JJ'
-0.518180 Temp b'hGreek'
-0.530228 O b'-1:lemma:from'
-0.537664 Technique b'-1:postag::'
-0.540107 O b'+1:lemma:cell'
-0.544422 Gtype b'lemma[:1]:m'
-0.545010 O b'-1:lemma:cra'
-0.547384 O b'lemma[:1]:0'
-0.555352 O b'lemma[:1]:A'
-0.579802 Gtype b'lemma[:1]:c'
-0.584906 Air b'postag:NN'
-0.624005 O b'-1:lemma:IP'
-0.630245 O b'-1:lemma:the'
-0.631759 O b'+1:lemma:supplement'
-0.642073 Med b'symb'
-0.648245 O b'lemma[:2]:gl'
-0.651355 O b'-1:lemma:sample'
-0.664904 Gtype b'lemma:delta'
-0.696355 O b'+1:postag:NNS'
-0.717210 Anti b'postag:NNP'
-0.724215 Supp b'lemma[:1]:c'
-0.728404 Air b'-1:postag:JJ'
-0.738219 O b'+1:lemma:+'
-0.750040 Gversion b'isLower'
-0.776375 O b'+1:lemma:g/l'
-0.778177 O b'-1:lemma:dissolve'
-0.778177 O b'+1:lemma:methanol'
-0.796433 O b'+1:lemma:hour'
-0.798962 Gtype b'isNumber'
-0.864076 O b'lemma[:2]:ri'
-0.864983 O b'-1:lemma:nsrr'
-0.897796 Gtype b'isUpper'
-0.915145 Phase b'hUpper'
-0.915145 Phase b'hLower'
-0.971040 O b'lemma:mid-log'
-0.973820 O b'lemma:rifampicin'
-0.985135 O b'lemma[:1]:\xce\xb4'
-0.989912 Supp b'symb'
-1.024646 O b'-1:lemma:rpob'
-1.027096 O b'lemma:methanol'
-1.040232 O b'+1:postag:VBG'
-1.074775 Gtype b'lemma[:2]:rp'
-1.135014 O b'+1:lemma:at'
-1.242720 O b'-1:postag:VBG'
-1.254198 O b'+1:lemma:in'
-1.381811 Gtype b'lemma[:1]:a'
-1.431865 Supp b'hGreek'
-1.551257 O b'-1:postag::'
-1.707232 O b'-1:lemma:2'
-1.771113 OD b'postag[:1]:-'
-1.831476 O b'+1:lemma:2'
-1.836996 OD b'lemma[:1]:-'
-2.234728 O b'+1:lemma:1'
-3.071950 O b'-1:lemma::'
-3.880058 O b'-1:lemma:_'
......