Process all non-scaling statistics for base experiments.

author: Jonathan Herman <hermanjl@cs.unc.edu> 2012-10-30 16:04:23 -0400
committer: Jonathan Herman <hermanjl@cs.unc.edu> 2012-10-30 16:04:23 -0400
commit: 53cfcf10531256d0e4411a7e0bda431ec27f28e7 (patch)
tree: d9119ebe9658f4f41ab870811b6a89f6e9683cbc /parse
parent: 2e804f8fa7d26755088e47357f8de6feb6dbe292 (diff)
3 files changed, 16 insertions, 9 deletions
diff --git a/parse/ft.py b/parse/ft.py
index feb338f..4e310b0 100644
--- a/parse/ft.py
+++ b/parse/ft.py
@@ -20,7 +20,6 @@ def get_ft_output(data_dir, out_dir, force=False):
        if force:
            os.remove(output_file)
        else:
-            print("ft-output already exists for %s" % data_dir)
            return output_file
    if len(bins) != 0:
@@ -41,7 +40,6 @@ def get_ft_output(data_dir, out_dir, force=False):
        # Analyze will summarize those
        # todo pass in f
        cmd_arr = [conf.BINS['analyze']]
-        print("cmd arr: %s-%s" % (cmd_arr, bins))
        cmd_arr.extend(bins)
        with open(output_file, "w") as f:
            subprocess.call(cmd_arr, cwd=out_dir, stdout=f, stderr=err_file)
diff --git a/parse/sched.py b/parse/sched.py
index 80764b6..bbf6e10 100644
--- a/parse/sched.py
+++ b/parse/sched.py
@@ -11,6 +11,7 @@ import os
 import re
 import numpy as np
 import subprocess
+import pprint
 from collections import namedtuple,defaultdict
 from operator import methodcaller
@@ -54,6 +55,7 @@ class LeveledArray(object):
    def add(self, task, value):
        self.vals[task.config.level] += [value]
    def write_measurements(self, result):
        for level, arr in self.vals.iteritems():
            name = "%s%s" % ("%s-" % level if level else "", self.name)
@@ -72,7 +74,6 @@ def get_st_output(data_dir, out_dir, force=False):
        if force:
            os.remove(output_file)
        else:
-            print("st-output already exists for %s" % data_dir)
            return output_file
    if len(bins) != 0:
@@ -195,8 +196,11 @@ def extract_variance(task_dict, data, exp_point):
        completions[pid] += [duration]
    for pid, durations in completions.iteritems():
+        m = Measurement(pid).from_array(durations)
        # TODO: not this, please
-        task_dict[pid].run.append(Measurement(pid).from_array(durations))
+        if not task_dict[pid].run:
+            task_dict[pid].run.append(m)
        job_times = np.array(durations)
        mean = job_times.mean()
@@ -210,6 +214,7 @@ def extract_variance(task_dict, data, exp_point):
        corrected = (1 + 1/(4 * len(job_times))) * cv
        varz.add(task_dict[pid], corrected)
+        # varz.add(task_dict[pid], m[Type.Var])
    if exp_point:
        map(methodcaller('write_measurements', exp_point),
@@ -272,17 +277,13 @@ def extract_scaling_data(task_dict, data, result, base_file):
        for data_stat, base_stat in zip(data_stats[config],base_stats[config]):
            if not base_stat[Type.Avg] or not base_stat[Type.Max] or \
               not data_stat[Type.Avg] or not data_stat[Type.Max]:
-               print("missing a thing: {},{}".format(base_stat, data_stat))
               continue
            # How much larger is their exec stat than ours?
-            print("%s vs %s" % (base_stat, data_stat))
            avg_scale = float(base_stat[Type.Avg]) / float(data_stat[Type.Avg])
            max_scale = float(base_stat[Type.Max]) / float(data_stat[Type.Max])
            task = task_dict[data_stat.id]
-            print("scaling for %s" % data_stat.id)
            avg_scales.add(task, avg_scale)
            max_scales.add(task, max_scale)
diff --git a/parse/tuple_table.py b/parse/tuple_table.py
index 465abb3..e5dc39b 100644
--- a/parse/tuple_table.py
+++ b/parse/tuple_table.py
@@ -21,7 +21,6 @@ class ColMap(object):
                key += (None,)
            else:
                key += (kv[col],)
        return key
    def __contains__(self, col):
@@ -43,6 +42,15 @@ class ColMap(object):
                self.value_map[column] = value
            elif value != self.value_map[column]:
                self.force_add(column)
+                del(self.value_map[column])
+    def try_remove(self, column):
+        if column in self.rev_map:
+            idx = self.rev_map[column]
+            for value in self.col_list[idx+1:]:
+                self.rev_map[value] -= 1
+            del(self.col_list[self.rev_map[column]])
+            del(self.rev_map[column])
    def __str__(self):
        return "<ColMap>%s" % (self.rev_map)
author	Jonathan Herman <hermanjl@cs.unc.edu>	2012-10-30 16:04:23 -0400
committer	Jonathan Herman <hermanjl@cs.unc.edu>	2012-10-30 16:04:23 -0400
commit	53cfcf10531256d0e4411a7e0bda431ec27f28e7 (patch)
tree	d9119ebe9658f4f41ab870811b6a89f6e9683cbc /parse
parent	2e804f8fa7d26755088e47357f8de6feb6dbe292 (diff)