attardi
diff --git a/‎ChangeLog‎
Lines changed: 24 additions & 0 deletions b/‎ChangeLog‎
Lines changed: 24 additions & 0 deletions
diff --git a/‎bin/dl-conv.py‎
Lines changed: 20 additions & 17 deletions b/‎bin/dl-conv.py‎
Lines changed: 20 additions & 17 deletions
diff --git a/‎bin/dl-ner.py‎
Lines changed: 4 additions & 4 deletions b/‎bin/dl-ner.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎bin/dl-pos.py‎
Lines changed: 4 additions & 4 deletions b/‎bin/dl-pos.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎bin/dl-sentiwords.py‎
Lines changed: 3 additions & 3 deletions b/‎bin/dl-sentiwords.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎bin/dl-words.py‎
Lines changed: 3 additions & 3 deletions b/‎bin/dl-words.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎deepnl/classifier.cpp‎
Lines changed: 9 additions & 25 deletions b/‎deepnl/classifier.cpp‎
Lines changed: 9 additions & 25 deletions
@@ -1,3 +1,27 @@
+2016-01-06  Giuseppe Attardi  <attardi@di.unipi.it>
+
+	* deepnl/trainer.pyx (train): initialize AdaGrad accumulators by adaEps.
+
+	* deepnl/extractors.pyx (Extractor.adaGradInit): initialize with adaEps.
+
+	* bin/dl-conv.py (main): added option --eps.
+
+2015-12-24  Giuseppe Attardi  <attardi@di.unipi.it>
+
+	* deepnl/networkconv.pyx (backpropagate): use MultiMarginCriterion
+	also for computing gradients.
+
+2015-12-18  Giuseppe Attardi  <attardi@di.unipi.it>
+
+	* deepnl/utils.py (create_feature_tables): removed.
+
+	* bin/dl-sentiwords.py (create_trainer): consider parameter --window
+	as left/right context, consistently with word2vec.
+	* bin/dl-conv.py (main): idem.
+	* bin/dl-ner.py (main): idem.
+	* bin/dl-pos.py (main): idem.
+	* bin/dl-words.py (main): idem.
+
 2015-11-18  Giuseppe Attardi  <attardi@di.unipi.it>
 
 	* bin/dl-conv.py (main): added options text_field and label_field
 
@@ -50,14 +50,15 @@ def create_trainer(args, converter, labels):
         logger.info('Creating new network...')
         # sum the number of features in all extractors' tables 
         feat_size = converter.size()
-        pool_size = args.window
+        pool_size = args.window * 2 + 1
         nn = ConvolutionalNetwork(feat_size * pool_size, args.hidden,
                                   args.hidden2, len(labels), pool_size)
         options = {
             'learning_rate': args.learning_rate,
+            'eps': args.eps,
             'verbose': args.verbose,
-            'left_context': args.window/2,
-            'right_context': args.window/2
+            'left_context': args.window,
+            'right_context': args.window
         }
         trainer = ConvTrainer(nn, converter, labels, options)
 
@@ -109,31 +110,33 @@ def main():
     format = parser.add_argument_group('Format')
 
     format.add_argument('--label-field', type=int, default=1,
-                      help='Field containing label.')
+                        help='Field containing label (default %(default)s).')
     format.add_argument('--text-field', type=int, default=2,
-                      help='Field containing text.')
+                        help='Field containing text (default %(default)s).')
 
     # training options
     train = parser.add_argument_group('Train')
 
     train.add_argument('-t', '--train', type=str, default=None,
-                      help='File with annotated data for training.')
+                       help='File with annotated data for training.')
 
     train.add_argument('-w', '--window', type=int, default=5,
-                        help='Size of the word window (default %(default)s)')
+                       help='Size of the word window (default %(default)s)')
     train.add_argument('-s', '--embeddings-size', type=int, default=50,
-                        help='Number of features per word (default %(default)s)',
-                        dest='embeddings_size')
+                       help='Number of features per word (default %(default)s)',
+                       dest='embeddings_size')
     train.add_argument('-e', '--epochs', type=int, default=100,
-                        help='Number of training epochs (default %(default)s)',
-                        dest='iterations')
+                       help='Number of training epochs (default %(default)s)',
+                       dest='iterations')
     train.add_argument('-l', '--learning_rate', type=float, default=0.001,
-                        help='Learning rate for network weights (default %(default)s)',
-                        dest='learning_rate')
+                       help='Learning rate for network weights (default %(default)s)',
+                       dest='learning_rate')
+    train.add_argument('--eps', type=float, default=1e-6,
+                        help='Epsilon value for AdaGrad (default %(default)s)')
     train.add_argument('-n', '--hidden', type=int, default=200,
-                        help='Number of hidden neurons (default %(default)s)')
+                       help='Number of hidden neurons (default %(default)s)')
     train.add_argument('-n2', '--hidden2', type=int, default=200,
-                        help='Number of hidden neurons (default %(default)s)')
+                       help='Number of hidden neurons (default %(default)s)')
 
     # Extractors:
     extractors = parser.add_argument_group('Extractors')
@@ -189,7 +192,7 @@ def main():
         sentences = reader.read(args.train)
 
         if args.vocab and os.path.exists(args.vocab):
-            if args.vectors and  os.path.exists(args.vectors):
+            if args.vectors and os.path.exists(args.vectors):
                 # use supplied embeddings
                 embeddings = Embeddings(vectors=args.vectors, vocab_file=args.vocab,
                                         variant=args.variant)
@@ -285,7 +288,7 @@ def main():
         labels_index = {}
         labels = []
         for i,c in enumerate(set(sent_labels)):
-            labels_index[c] = i 
+            labels_index[c] = i
             labels.append(c)
         trainer = create_trainer(args, converter, labels)
         logger.info("Starting training with %d examples" % len(examples))
 
@@ -49,15 +49,15 @@ def create_trainer(args, converter, tag_index):
     else:
         logger.info('Creating new network...')
         # sum the number of features in all tables 
-        input_size = converter.size() * args.window
+        input_size = converter.size() * args.window * 2 + 1
         nn = SequenceNetwork(input_size, args.hidden, len(tag_index))
         options = {
             'learning_rate': args.learning_rate,
             'eps': args.eps,
             'ro': args.ro,
             'verbose': args.verbose,
-            'left_context': args.window/2,
-            'right_context': args.window/2
+            'left_context': args.window,
+            'right_context': args.window
         }
         trainer = TaggerTrainer(nn, converter, tag_index, options)
 
@@ -108,7 +108,7 @@ def main():
     train = parser.add_argument_group('Train')
     train.add_argument('-t', '--train', type=str, default='',
                         help='File with annotated data for training.')
-    train.add_argument('-w', '--window', type=int, default=5,
+    train.add_argument('-w', '--window', type=int, default=2,
                         help='Size of the word window (default %(default)s)')
     train.add_argument('-s', '--embeddings-size', type=int, default=50,
                         help='Number of features per word (default %(default)s)',
 
@@ -48,15 +48,15 @@ def create_trainer(args, converter, tag_index):
     else:
         logger.info('Creating new network...')
         # sum the number of features in all tables 
-        input_size = converter.size() * args.window
+        input_size = converter.size() * args.window * 2 + 1
         nn = SequenceNetwork(input_size, args.hidden, len(tag_index))
         options = {
             'learning_rate': args.learning_rate,
             'eps': args.eps,
             'ro': args.ro,
             'verbose': args.verbose,
-            'left_context': args.window/2,
-            'right_context': args.window/2
+            'left_context': args.window,
+            'right_context': args.window
         }
         trainer = TaggerTrainer(nn, converter, tag_index, options)
 
@@ -112,7 +112,7 @@ def main():
     train.add_argument('-t', '--train', type=str, default=None,
                         help='File with annotated data for training.')
 
-    train.add_argument('-w', '--window', type=int, default=5,
+    train.add_argument('-w', '--window', type=int, default=2,
                         help='Size of the word window (default %(default)s)')
     train.add_argument('-s', '--embeddings-size', type=int, default=50,
                         help='Number of features per word (default %(default)s)',
 
@@ -47,15 +47,15 @@ def create_trainer(args, converter):
     else:
         logger.info('Creating new network...')
         # sum the number of features in all extractors' tables 
-        input_size = converter.size() * args.window
+        input_size = converter.size() * args.window * 2 + 1
         nn = Network(input_size, args.hidden, 2)
         options = {
             'learning_rate': args.learning_rate,
             'eps': args.eps,
             'ro': args.ro,
             'verbose': args.verbose,
-            'left_context': args.window/2,
-            'right_context': args.window/2,
+            'left_context': args.window,
+            'right_context': args.window,
             'ngram_size': args.ngrams,
             'alpha': args.alpha
         }
 
@@ -46,15 +46,15 @@ def create_trainer(args, converter):
     else:
         logger.info('Creating new network...')
         # sum the number of features in all extractors' tables 
-        input_size = converter.size() * args.windows
+        input_size = converter.size() * args.windows * 2 + 1
         nn = LmNetwork(input_size, args.hidden, 1)
         options = {
             'learning_rate': args.learning_rate,
             'eps': args.eps,
             'ro': args.ro,
             'verbose': args.verbose,
-            'left_context': args.window/2,
-            'right_context': args.window/2,
+            'left_context': args.window,
+            'right_context': args.window,
             'ngram_size': args.ngrams
         }
         trainer = LmTrainer(nn, converter, options)