Added option to parse scaling factors against a base task set.

author: Jonathan Herman <hermanjl@cs.unc.edu> 2012-09-28 16:55:30 -0400
committer: Jonathan Herman <hermanjl@cs.unc.edu> 2012-09-28 16:55:30 -0400
commit: 2844e3887b4ff635dfa85e9b2ec773b06fe9af4f (patch)
tree: 2308fd16cd7def6d4fce28239524e28f1ce3ed67 /parse
parent: e9c71d9c11628b24fd7661d7473841fbda43cdda (diff)
3 files changed, 107 insertions, 26 deletions
diff --git a/parse/ft.py b/parse/ft.py
index 9837898..868c8ca 100644
--- a/parse/ft.py
+++ b/parse/ft.py
@@ -41,7 +41,7 @@ def get_ft_output(data_dir, out_dir):
        return None
    return output_file
-def get_ft_data(data_file, result, overheads):
+def extract_ft_data(data_file, result, overheads):
    rstr = r",(?:\s+[^\s]+){3}.*?([\d\.]+).*?([\d\.]+),(?:\s+[^\s]+){3}.*?([\d\.]+)"
    with open(data_file) as f:
diff --git a/parse/sched.py b/parse/sched.py
index a84aece..94ab000 100644
--- a/parse/sched.py
+++ b/parse/sched.py
@@ -1,5 +1,6 @@
 """
 TODO: make regexes indexable by name
 """
 import config.config as conf
@@ -8,10 +9,11 @@ import re
 import numpy as np
 import subprocess
-from collections import namedtuple
+from collections import namedtuple,defaultdict
-from point import Measurement
+from point import Measurement,Type
-Task = namedtuple('Task', ['pid', 'period'])
+TaskConfig = namedtuple('TaskConfig', ['cpu','wcet','period'])
+Task = namedtuple('Task', ['pid', 'config'])
 def get_st_output(data_dir, out_dir):
    bin_files = conf.FILES['sched_data'].format(".*")
@@ -32,32 +34,54 @@ def get_st_output(data_dir, out_dir):
    return output_file
 def get_tasks(data):
-    reg = r"PARAM.*?(\d+).*?cost:\s+[\d\.]+ms.*?period.*?([\d.]+)"
+    reg = r"PARAM *?(\d+)\/.*?cost:\s+([\d\.]+)ms.*?period.*?([\d.]+)ms.*?part.*?(\d+)"
-    return [Task(x[0], x[1]) for x in re.findall(reg, data)]
+    ret = []
+    for match in re.findall(reg, data):
+        t = Task(match[0], TaskConfig(match[3],match[1],match[2]))
+        ret += [t]
+    return ret
+def get_task_exits(data):
+    reg = r"TASK_EXIT *?(\d+)/.*?Avg.*?(\d+).*?Max.*?(\d+)"
+    ret = []
+    for match in re.findall(reg, data):
+        m = Measurement(match[0], {Type.Max : match[2], Type.Avg : match[1]})
+        ret += [m]
+    return ret
+        
 def extract_tardy_vals(data, exp_point):
-    ratios = []
+    ratios    = []
-    tards = []
+    avg_tards = []
+    max_tards = []
    for t in get_tasks(data):
-        reg = r"TARDY.*?" + t.pid + "/(\d+).*?Tot.*?([\d.]+).*?ms.*([\d.]+).*?ms.*?([\d.]+)"
+        reg = r"TARDY.*?" + t.pid + "/(\d+).*?Tot.*?([\d\.]+).*?ms.*([\d\.]+).*?ms.*?([\d\.]+)"
        matches = re.findall(reg, data)
        if len(matches) != 0:
            jobs = float(matches[0][0])
            total_tard = float(matches[0][1])
-            # max_tard = float(matches[0][2])
+            print("total tard: %s" % total_tard)
+            avg_tard = (total_tard / jobs) / float(t.config.period)
+            max_tard = float(matches[0][2]) / float(t.config.period)
+            print("avg tard: %s" % avg_tard)
            misses = float(matches[0][3])
-            rel_tard = (total_tard / jobs) / float(t.period)
            if misses != 0:
                miss_ratio = (misses / jobs)
+                print("misses is %d, jobs is %d" % (misses, jobs))
            else:
                miss_ratio = 0
-            ratios.append(miss_ratio)
+            ratios    += [miss_ratio]
-            tards.append(rel_tard)
+            avg_tards += [avg_tard]
+            max_tards += [max_tard]
-    for (array, name) in ((tards, "rel-tard"), (ratios, "miss-ratio")):
+    exp_point["avg-rel-tard"] = Measurement().from_array(avg_tards)
-        exp_point[name] = Measurement().from_array(array)
+    exp_point["max-rel-tard"] = Measurement().from_array(max_tards)
+    exp_point["miss-ratio"] = Measurement().from_array(ratios)
 def extract_variance(data, exp_point):
    varz = []
@@ -77,17 +101,70 @@ def extract_variance(data, exp_point):
        varz.append(corrected)
-    exp_point['var'] = Measurement().from_array(varz)
+    exp_point['exec-var'] = Measurement().from_array(varz)
-def get_sched_data(data_file, result):
+def extract_sched_data(data_file, result):
    with open(data_file, 'r') as f:
        data = f.read()
-        # if conf != BASE:
+    extract_tardy_vals(data, result)
-        #     (our_values, their_values) = extract_exec_vals(our_data, their_data)
+    extract_variance(data, result)
-        #     conf_result = get_stats(our_values, their_values)
-        #     for key in conf_result.keys():
-        #         result[key][conf] = conf_result[key]
-        extract_tardy_vals(data, result)
+def config_exit_stats(file):
-        extract_variance(data, result)
+    with open(file, 'r') as f:
+        data = f.read()
+        
+    tasks = get_tasks(data)
+    # Dictionary of task exit measurements by pid
+    exits = get_task_exits(data)
+    exit_dict = dict((e.id, e) for e in exits)
+    # Dictionary where keys are configurations, values are list
+    # of tasks with those configuratino
+    config_dict = defaultdict(lambda: [])
+    for t in tasks:
+        config_dict[t.config] += [t]
+    for config in config_dict:
+        task_list = sorted(config_dict[config])
+        # Replace tasks with corresponding exit stats
+        exit_list = [exit_dict[t.pid] for t in task_list]
+        config_dict[config] = exit_list        
+    return config_dict
+saved_stats = {}
+def get_base_stats(base_file):
+    if base_file in saved_stats:
+        return saved_stats[base_file]
+    result = config_exit_stats(base_file)
+    saved_stats[base_file] = result
+    return result
+def extract_scaling_data(data_file, base_file, result):
+    # Generate trees of tasks with matching configurations
+    data_stats = config_exit_stats(data_file)
+    base_stats = get_base_stats(base_file)
+    # Scaling factors are calculated by matching groups of tasks with the same
+    # config, then comparing task-to-task exec times in order of PID within
+    # each group
+    max_scales = []
+    avg_scales = []
+    for config in data_stats:
+        if len(data_stats[config]) != len(base_stats[config]):
+            # Quit, we are missing a record and can't guarantee
+            # a task-to-task comparison
+            continue
+        for data_stat, base_stat in zip(data_stats[config],base_stats[config]):
+            # How much larger is their exec stat than ours?
+            avg_scale = float(base_stat[Type.Avg]) / float(base_stat[Type.Avg])
+            max_scale = float(base_stat[Type.Max]) / float(base_stat[Type.Max])
+            avg_scales += [avg_scale]
+            max_scales += [max_scale]
+    result['max-scale'] = Measurement().from_array(max_scales)
+    result['avg-scale'] = Measurement().from_array(avg_scales)
diff --git a/parse/tuple_table.py b/parse/tuple_table.py
index 0cf6bec..b56fa6c 100644
--- a/parse/tuple_table.py
+++ b/parse/tuple_table.py
@@ -21,8 +21,8 @@ class ColMap(object):
                added += 1
                key += (kv[col],)
-        if added != len(kv):
+        if added < len(kv):
-            raise Exception("column map '%s' missed field in map\n%s" %
+            raise Exception("column map '%s' missed field in map '%s'" %
                            (self.col_list, kv))
               
        return key
@@ -51,6 +51,10 @@ class TupleTable(object):
        key = self.col_map.get_key(kv)
        self.table[key] += [point]
+    def get_exps(self, kv):
+        key = self.col_map.get_key(kv)
+        return self.table[key]
    def __reduce(self):
        if self.reduced:
            raise Exception("cannot reduce twice!")
author	Jonathan Herman <hermanjl@cs.unc.edu>	2012-09-28 16:55:30 -0400
committer	Jonathan Herman <hermanjl@cs.unc.edu>	2012-09-28 16:55:30 -0400
commit	2844e3887b4ff635dfa85e9b2ec773b06fe9af4f (patch)
tree	2308fd16cd7def6d4fce28239524e28f1ce3ed67 /parse
parent	e9c71d9c11628b24fd7661d7473841fbda43cdda (diff)