From b43b83beead92ff7cf28a5fe5a2710537268aae1 Mon Sep 17 00:00:00 2001
From: Jonathan Herman <hermanjl@cs.unc.edu>
Date: Mon, 26 Nov 2012 17:06:27 -0500
Subject: Read locations of binary files from path instead of config.py.

---
 run/experiment.py | 209 ++++++++++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 209 insertions(+)
 create mode 100644 run/experiment.py

(limited to 'run/experiment.py')

diff --git a/run/experiment.py b/run/experiment.py
new file mode 100644
index 0000000..4bd47c6
--- /dev/null
+++ b/run/experiment.py
@@ -0,0 +1,209 @@
+import os
+import time
+import litmus_util
+from operator import methodcaller
+from tracer import SchedTracer, LogTracer, PerfTracer, LinuxTracer, OverheadTracer
+
+class ExperimentException(Exception):
+    '''Used to indicate when there are problems with an experiment.'''
+    def __init__(self, name):
+        self.name = name
+
+
+class ExperimentDone(ExperimentException):
+    '''Raised when an experiment looks like it's been run already.'''
+    def __str__(self):
+        return "Experiment finished already: %d" % self.name
+
+
+class ExperimentInterrupted(ExperimentException):
+    '''Raised when an experiment appears to be interrupted (partial results).'''
+    def __str__(self):
+        return "Experiment was interrupted in progress: %d" % self.name
+
+
+class ExperimentFailed(ExperimentException):
+    def __str__(self):
+        return "Experiment failed during execution: %d" % self.name
+
+
+class Experiment(object):
+    '''Execute one task-set and save the results. Experiments have unique IDs.'''
+    INTERRUPTED_DIR = ".interrupted"
+
+    def __init__(self, name, scheduler, working_dir, finished_dir, proc_entries, executables):
+        '''Run an experiment, optionally wrapped in tracing.'''
+
+        self.name = name
+        self.scheduler = scheduler
+        self.working_dir  = working_dir
+        self.finished_dir = finished_dir
+        self.proc_entries = proc_entries
+        self.executables  = executables
+        self.exec_out = None
+        self.exec_err = None
+
+        self.__make_dirs()
+        self.__assign_executable_cwds()
+
+        self.tracers = []
+        if SchedTracer.enabled():
+            self.log("Enabling sched_trace")
+            self.tracers.append( SchedTracer(working_dir) )
+        if LinuxTracer.enabled():
+            self.log("Enabling trace-cmd / ftrace / kernelshark")
+            self.tracers.append( LinuxTracer(working_dir) )
+        if LogTracer.enabled():
+            self.log("Enabling logging")
+            self.tracers.append( LogTracer(working_dir) )
+        if PerfTracer.enabled():
+            self.log("Tracking CPU performance counters")
+            self.tracers.append( PerfTracer(working_dir) )
+
+        # Overhead trace must be handled seperately, see __run_tasks
+        if OverheadTracer.enabled():
+            self.log("Enabling overhead tracing")
+            self.overhead_trace = OverheadTracer(working_dir)
+        else:
+            self.overhead_trace = None
+
+    def __make_dirs(self):
+        interrupted = None
+
+        if os.path.exists(self.finished_dir):
+            raise ExperimentDone(self.name)
+
+        if os.path.exists(self.working_dir):
+            self.log("Found interrupted experiment, saving in %s" %
+                     Experiment.INTERRUPTED_DIR)
+            interrupted = "%s/%s" % (os.path.split(self.working_dir)[0],
+                                     Experiment.INTERRUPTED_DIR)
+            os.rename(self.working_dir, interrupted)
+
+        os.mkdir(self.working_dir)
+
+        if interrupted:
+            os.rename(interrupted, "%s/%s" % (self.working_dir,
+                                              os.path.split(interrupted)[1]))
+
+    def __assign_executable_cwds(self):
+        def assign_cwd(executable):
+            executable.cwd = self.working_dir
+        map(assign_cwd, self.executables)
+
+    def __run_tasks(self):
+        exec_pause = 0.3
+        self.log("Starting the programs over ({0} seconds)".format(
+            len(self.executables) * exec_pause))
+        for e in self.executables:
+            try:
+                e.execute()
+            except:
+                raise Exception("Executable failed: %s" % e)
+            time.sleep(exec_pause)
+
+        sleep_time = len(self.executables) / litmus_util.num_cpus()
+        self.log("Sleeping for %d seconds before release" % sleep_time)
+        time.sleep(sleep_time)
+
+        # Overhead tracer must be started right after release or overhead
+        # measurements will be full of irrelevant records
+        if self.overhead_trace:
+            self.log("Starting overhead trace")
+            self.overhead_trace.start_tracing()
+
+        self.log("Releasing %d tasks" % len(self.executables))
+        released = litmus_util.release_tasks()
+
+        ret = True
+        if released != len(self.executables):
+            # Some tasks failed to release, kill all tasks and fail
+            # Need to re-release non-released tasks before we can kill them though
+            self.log("Failed to release {} tasks! Re-releasing and killing".format(
+                len(self.executables) - released, len(self.executables)))
+
+            time.sleep(5)
+
+            released = litmus_util.release_tasks()
+
+            self.log("Re-released %d tasks" % released)
+
+            time.sleep(5)
+
+            self.log("Killing all tasks")
+            map(methodcaller('kill'), self.executables)
+
+            ret = False
+
+        self.log("Waiting for program to finish...")
+        for e in self.executables:
+            if not e.wait():
+                ret = False
+
+        # And it must be stopped here for the same reason
+        if self.overhead_trace:
+            self.log("Stopping overhead trace")
+            self.overhead_trace.stop_tracing()
+
+        if not ret:
+            raise ExperimentFailed(self.name)
+
+    def __save_results(self):
+        os.rename(self.working_dir, self.finished_dir)
+
+    def log(self, msg):
+        print "[Exp %s]: %s" % (self.name, msg)
+
+    def run_exp(self):
+        succ = False
+        try:
+            self.setup()
+
+            try:
+                self.__run_tasks()
+                self.log("Saving results in %s" % self.finished_dir)
+                succ = True
+            finally:
+                self.teardown()
+        finally:
+            self.log("Switching to Linux scheduler")
+            litmus_util.switch_scheduler("Linux")
+
+        if succ:
+            self.__save_results()
+            self.log("Experiment done!")
+
+
+    def setup(self):
+        self.log("Writing %d proc entries" % len(self.proc_entries))
+        map(methodcaller('write_proc'), self.proc_entries)
+
+        if len(self.proc_entries):
+            time.sleep(2)
+
+        self.log("Switching to %s" % self.scheduler)
+        litmus_util.switch_scheduler(self.scheduler)
+
+        self.log("Starting %d tracers" % len(self.tracers))
+        map(methodcaller('start_tracing'), self.tracers)
+
+        self.exec_out = open('%s/exec-out.txt' % self.working_dir, 'w')
+        self.exec_err = open('%s/exec-err.txt' % self.working_dir, 'w')
+        def set_out(executable):
+            executable.stdout_file = self.exec_out
+            executable.stderr_file = self.exec_err
+        map(set_out, self.executables)
+
+        time.sleep(4)
+
+    def teardown(self):
+        self.exec_out and self.exec_out.close()
+        self.exec_err and self.exec_err.close()
+
+        sleep_time = 10
+        self.log("Sleeping %d seconds to allow buffer flushing" % sleep_time)
+        time.sleep(sleep_time)
+
+        self.log("Stopping tracers")
+        map(methodcaller('stop_tracing'), self.tracers)
+
-- 
cgit v1.2.2