From 53cfcf10531256d0e4411a7e0bda431ec27f28e7 Mon Sep 17 00:00:00 2001
From: Jonathan Herman <hermanjl@cs.unc.edu>
Date: Tue, 30 Oct 2012 16:04:23 -0400
Subject: Process all non-scaling statistics for base experiments.

---
 parse/ft.py          |  2 --
 parse/sched.py       | 13 +++++++------
 parse/tuple_table.py | 10 +++++++++-
 3 files changed, 16 insertions(+), 9 deletions(-)

(limited to 'parse')

diff --git a/parse/ft.py b/parse/ft.py
index feb338f..4e310b0 100644
--- a/parse/ft.py
+++ b/parse/ft.py
@@ -20,7 +20,6 @@ def get_ft_output(data_dir, out_dir, force=False):
         if force:
             os.remove(output_file)
         else:
-            print("ft-output already exists for %s" % data_dir)
             return output_file
 
     if len(bins) != 0:
@@ -41,7 +40,6 @@ def get_ft_output(data_dir, out_dir, force=False):
         # Analyze will summarize those
         # todo pass in f
         cmd_arr = [conf.BINS['analyze']]
-        print("cmd arr: %s-%s" % (cmd_arr, bins))
         cmd_arr.extend(bins)
         with open(output_file, "w") as f:
             subprocess.call(cmd_arr, cwd=out_dir, stdout=f, stderr=err_file)
diff --git a/parse/sched.py b/parse/sched.py
index 80764b6..bbf6e10 100644
--- a/parse/sched.py
+++ b/parse/sched.py
@@ -11,6 +11,7 @@ import os
 import re
 import numpy as np
 import subprocess
+import pprint
 
 from collections import namedtuple,defaultdict
 from operator import methodcaller
@@ -54,6 +55,7 @@ class LeveledArray(object):
     def add(self, task, value):
         self.vals[task.config.level] += [value]
 
+
     def write_measurements(self, result):
         for level, arr in self.vals.iteritems():
             name = "%s%s" % ("%s-" % level if level else "", self.name)
@@ -72,7 +74,6 @@ def get_st_output(data_dir, out_dir, force=False):
         if force:
             os.remove(output_file)
         else:
-            print("st-output already exists for %s" % data_dir)
             return output_file
 
     if len(bins) != 0:
@@ -195,8 +196,11 @@ def extract_variance(task_dict, data, exp_point):
         completions[pid] += [duration]
 
     for pid, durations in completions.iteritems():
+        m = Measurement(pid).from_array(durations)
+
         # TODO: not this, please
-        task_dict[pid].run.append(Measurement(pid).from_array(durations))
+        if not task_dict[pid].run:
+            task_dict[pid].run.append(m)
 
         job_times = np.array(durations)
         mean = job_times.mean()
@@ -210,6 +214,7 @@ def extract_variance(task_dict, data, exp_point):
         corrected = (1 + 1/(4 * len(job_times))) * cv
 
         varz.add(task_dict[pid], corrected)
+        # varz.add(task_dict[pid], m[Type.Var])
 
     if exp_point:
         map(methodcaller('write_measurements', exp_point),
@@ -272,17 +277,13 @@ def extract_scaling_data(task_dict, data, result, base_file):
         for data_stat, base_stat in zip(data_stats[config],base_stats[config]):
             if not base_stat[Type.Avg] or not base_stat[Type.Max] or \
                not data_stat[Type.Avg] or not data_stat[Type.Max]:
-               print("missing a thing: {},{}".format(base_stat, data_stat))
                continue
             # How much larger is their exec stat than ours?
-            print("%s vs %s" % (base_stat, data_stat))
             avg_scale = float(base_stat[Type.Avg]) / float(data_stat[Type.Avg])
             max_scale = float(base_stat[Type.Max]) / float(data_stat[Type.Max])
 
             task = task_dict[data_stat.id]
 
-            print("scaling for %s" % data_stat.id)
-
             avg_scales.add(task, avg_scale)
             max_scales.add(task, max_scale)
 
diff --git a/parse/tuple_table.py b/parse/tuple_table.py
index 465abb3..e5dc39b 100644
--- a/parse/tuple_table.py
+++ b/parse/tuple_table.py
@@ -21,7 +21,6 @@ class ColMap(object):
                 key += (None,)
             else:
                 key += (kv[col],)
-
         return key
 
     def __contains__(self, col):
@@ -43,6 +42,15 @@ class ColMap(object):
                 self.value_map[column] = value
             elif value != self.value_map[column]:
                 self.force_add(column)
+                del(self.value_map[column])
+
+    def try_remove(self, column):
+        if column in self.rev_map:
+            idx = self.rev_map[column]
+            for value in self.col_list[idx+1:]:
+                self.rev_map[value] -= 1
+            del(self.col_list[self.rev_map[column]])
+            del(self.rev_map[column])
 
     def __str__(self):
         return "<ColMap>%s" % (self.rev_map)
-- 
cgit v1.2.2