codalab
diff --git a/‎.circleci/config.yml‎
Lines changed: 20 additions & 10 deletions b/‎.circleci/config.yml‎
Lines changed: 20 additions & 10 deletions
diff --git a/‎.env_sample‎
Lines changed: 7 additions & 0 deletions b/‎.env_sample‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎Containerfile.compute_worker_podman‎
Lines changed: 18 additions & 28 deletions b/‎Containerfile.compute_worker_podman‎
Lines changed: 18 additions & 28 deletions
diff --git a/‎Containerfile.compute_worker_podman_gpu‎
Lines changed: 4 additions & 71 deletions b/‎Containerfile.compute_worker_podman_gpu‎
Lines changed: 4 additions & 71 deletions
diff --git a/‎Dockerfile.compute_worker‎
Lines changed: 1 addition & 0 deletions b/‎Dockerfile.compute_worker‎
Lines changed: 1 addition & 0 deletions
@@ -15,39 +15,49 @@ jobs:
           #
           #     In another terminal:
           #         $ open vnc://0.0.0.0:5900
-          name: Download and start X for VNC viewing
+          name: "Setup: Enable VNC access"
           command: |
             sudo apt-get update
             sudo apt-get install -y x11vnc
           #  x11vnc -forever -nopw
           background: true
 
-      - run: cp .env_circleci .env
+      - run: 
+          name: "Setup: Copy environment variables"
+          command: cp .env_circleci .env
 
 
       - run:
-          name: Making gross directories for minio, cannot be made by docker for some reason
+          name: "Setup: Create directories for MinIO (cannot be made by docker for some reason)"
           command: |
             sudo mkdir -p var/minio/public
             sudo mkdir -p var/minio/private
 
       - run:
-          name: Build containers and collect static
+          name: "Docker: Build containers and collect static files"
           command: |
             docker compose -f docker-compose.yml -f docker-compose.selenium.yml up -d
             docker compose -f docker-compose.yml -f docker-compose.selenium.yml exec django python manage.py collectstatic --noinput
 
-      - run: docker-compose exec django flake8 src/
-      - run: docker pull codalab/codalab-legacy:py37 # not available without "not e2e" tests as they pull ahead of time
-      - run: docker pull codalab/codalab-legacy:py3 # not available without "not e2e" tests as they pull ahead of time
-      - run: docker pull vergilgxw/autotable:v2 # not available without "not e2e" tests as they pull ahead of time
+      - run: 
+          name: "Lint: Check code style with flake8"
+          command: docker-compose exec django flake8 src/
+
+
+      - run: 
+          name: "Docker: Pull required images"
+          # not available without "not e2e" tests as they pull ahead of time
+          command: |
+            docker pull codalab/codalab-legacy:py37 
+            docker pull codalab/codalab-legacy:py3 
+            docker pull vergilgxw/autotable:v2 
 
       - run:
-          name: pytest
+          name: "Tests: Run unit/integration tests (excluding e2e)"
           command: docker compose -f docker-compose.yml -f docker-compose.selenium.yml exec django py.test src/ -m "not e2e"
 
       - run:
-          name: e2e tests
+          name: "Tests: Run end-to-end (E2E) tests"
           command: docker compose -f docker-compose.yml -f docker-compose.selenium.yml exec django py.test src/tests/functional/ -m e2e
           no_output_timeout: 60m
 
 
@@ -104,3 +104,10 @@ ENABLE_SIGN_IN=True
 # GS_PUBLIC_BUCKET_NAME=public
 # GS_PRIVATE_BUCKET_NAME=private
 # GOOGLE_APPLICATION_CREDENTIALS=/app/certs/google-storage-api.json
+
+
+# -----------------------------------------------------------------------------
+# Logging (Serialized outputs the logs in JSON format)
+# -----------------------------------------------------------------------------
+LOG_LEVEL=info
+SERIALIZED=false
@@ -1,44 +1,34 @@
-FROM fedora:37
+FROM fedora:42
 
 # Include deps
 RUN dnf -y update && \
-    # https://bugzilla.redhat.com/show_bug.cgi?id=1995337#c3
-    rpm --setcaps shadow-utils 2>/dev/null && \
     dnf -y install podman fuse-overlayfs python3.9 \
         --exclude container-selinux && \
     dnf clean all && \
     rm -rf /var/cache /var/log/dnf* /var/log/yum.*
 
-# Setup user
-RUN useradd worker; \
-echo -e "worker:1:999\nworker:1001:64535" > /etc/subuid; \
-echo -e "worker:1:999\nworker:1001:64535" > /etc/subgid;
+# Copy the podman-connections file to allow for podman inside the container to connect to podman on the host, running containers alongside podman instead of inside
+COPY podman/podman-connections.json /root/.config/containers/podman-connections.json
 
 # Copy over the podman container configuration
 COPY podman/containers.conf /etc/containers/containers.conf
-COPY podman/worker-containers.conf /home/worker/.config/containers/containers.conf
+COPY podman/worker-containers.conf /root/.config/containers/containers.conf
 
 # Copy over the podman storage configuration
-COPY podman/worker-storage.conf /home/worker/.config/containers/storage.conf
+COPY podman/worker-storage.conf /root/.config/containers/storage.conf
 
-RUN mkdir -p /home/worker/.local/share/containers && \
-    chown worker:worker -R /home/worker && \
-    chmod 644 /etc/containers/containers.conf
+RUN mkdir -p /root/.local/share/containers
 
 # Copy & modify the defaults to provide reference if runtime changes needed.
 # Changes here are required for running with fuse-overlay storage inside container.
 RUN sed -e 's|^#mount_program|mount_program|g' \
-           -e '/additionalimage.*/a "/var/lib/shared",' \
-           -e 's|^mountopt[[:space:]]*=.*$|mountopt = "nodev,fsync=0"|g' \
-           /usr/share/containers/storage.conf \
-           > /etc/containers/storage.conf
+        -e '/additionalimage.*/a "/var/lib/shared",' \
+        -e 's|^mountopt[[:space:]]*=.*$|mountopt = "nodev,fsync=0"|g' \
+        /usr/share/containers/storage.conf \
+        > /etc/containers/storage.conf
 
 # Add volume for containers
-VOLUME /home/worker/.local/share/containers
-
-# Create directory for tmp space
-RUN mkdir /codabench && \
-    chown worker:worker /codabench
+VOLUME /root/.local/share/containers
 
 # Set up podman registry for dockerhub
 RUN echo -e "[registries.search]\nregistries = ['docker.io']\n" > /etc/containers/registries.conf
@@ -47,26 +37,26 @@ RUN echo -e "[registries.search]\nregistries = ['docker.io']\n" > /etc/container
 ENV PYTHONUNBUFFERED 1
 ENV CONTAINER_ENGINE_EXECUTABLE podman
 
-WORKDIR /home/worker/compute_worker
-
-ADD compute_worker/ /home/worker/compute_worker
+WORKDIR /root/compute_worker
 
-RUN chown worker:worker -R /home/worker/compute_worker
+ADD compute_worker/ /root/compute_worker
 
-RUN curl -sSL https://install.python-poetry.org | python3.9 -
+RUN curl -sSL https://install.python-poetry.org | python3.9 - --version 1.8.3
 # Poetry location so future commands (below) work
 ENV PATH $PATH:/root/.local/bin
+
 # Want poetry to use system python of docker container
 RUN poetry config virtualenvs.create false
 RUN poetry config virtualenvs.in-project false
+
 # So we get 3.9
 RUN poetry config virtualenvs.prefer-active-python true
 COPY ./compute_worker/pyproject.toml ./
 COPY ./compute_worker/poetry.lock ./
 RUN poetry install
-
+COPY ./src/settings/logs_loguru.py /usr/bin
 CMD celery -A compute_worker worker \
     -l info \
     -Q compute-worker \
     -n compute-worker@%n \
-    --concurrency=1
+    --concurrency=1
@@ -1,75 +1,8 @@
-FROM fedora:37
+FROM codalab/codabench_worker_podman:latest
 
 # Include deps
-RUN curl -s -L https://developer.download.nvidia.com/compute/cuda/repos/rhel9/x86_64/cuda-rhel9.repo | tee /etc/yum.repos.d/cuda.repo && \
-    curl -s -L https://nvidia.github.io/nvidia-docker/rhel9.0/nvidia-docker.repo | tee /etc/yum.repos.d/nvidia-docker.repo && \
-    rpm -Uvh http://download1.rpmfusion.org/free/fedora/rpmfusion-free-release-$(rpm -E %fedora).noarch.rpm && \
-    rpm -Uvh http://download1.rpmfusion.org/nonfree/fedora/rpmfusion-nonfree-release-$(rpm -E %fedora).noarch.rpm && \
+RUN dnf -y config-manager addrepo --from-repofile=https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo && \
     dnf -y update && \
-    dnf module install -y nvidia-driver:latest-dkms && \
-    dnf -y install podman fuse-overlayfs python3.9 nvidia-container-runtime nvidia-container-toolkit \
-     cuda --exclude container-selinux && \
+    dnf -y install nvidia-container-runtime nvidia-container-toolkit --exclude container-selinux && \
     dnf clean all && \
-    rm -rf /var/cache /var/log/dnf* /var/log/yum.*
-
-# Setup user
-RUN useradd worker; \
-echo -e "worker:1:999\nworker:1001:64535" > /etc/subuid; \
-echo -e "worker:1:999\nworker:1001:64535" > /etc/subgid;
-
-# Copy over the podman container configuration
-COPY podman/containers.conf /etc/containers/containers.conf
-COPY podman/worker-containers.conf /home/worker/.config/containers/containers.conf
-
-# Copy over the podman storage configuration
-COPY podman/worker-storage.conf /home/worker/.config/containers/storage.conf
-
-RUN mkdir -p /home/worker/.local/share/containers && \
-    chown worker:worker -R /home/worker && \
-    chmod 644 /etc/containers/containers.conf
-
-# Copy & modify the defaults to provide reference if runtime changes needed.
-# Changes here are required for running with fuse-overlay storage inside container.
-RUN sed -e 's|^#mount_program|mount_program|g' \
-           -e '/additionalimage.*/a "/var/lib/shared",' \
-           -e 's|^mountopt[[:space:]]*=.*$|mountopt = "nodev,fsync=0"|g' \
-           /usr/share/containers/storage.conf \
-           > /etc/containers/storage.conf; sed -i 's/^#no-cgroups = false/no-cgroups = true/;' /etc/nvidia-container-runtime/config.toml
-
-
-# Add volume for containers
-VOLUME /home/worker/.local/share/containers
-
-# This makes output not buffer and return immediately, nice for seeing results in stdout
-ENV PYTHONUNBUFFERED 1
-ENV CONTAINER_ENGINE_EXECUTABLE podman
-
-# Create directory for tmp space
-RUN mkdir /codabench && \
-    chown worker:worker /codabench && \
-# Set up podman registry for dockerhub
-    echo -e "[registries.search]\nregistries = ['docker.io']\n" > /etc/containers/registries.conf && \
-
-WORKDIR /home/worker/compute_worker
-
-ADD compute_worker/ /home/worker/compute_worker
-
-RUN curl -sSL https://install.python-poetry.org | python3.9 -
-# Poetry location so future commands (below) work
-ENV PATH $PATH:/root/.local/bin
-# Want poetry to use system python of docker container
-RUN poetry config virtualenvs.create false
-RUN poetry config virtualenvs.in-project false
-# So we get 3.9
-RUN poetry config virtualenvs.prefer-active-python true
-COPY ./compute_worker/pyproject.toml ./
-COPY ./compute_worker/poetry.lock ./
-RUN poetry install
-
-RUN chown worker:worker -R /home/worker/compute_worker
-
-CMD nvidia-smi && celery -A compute_worker worker \
-    -l info \
-    -Q compute-worker \
-    -n compute-worker@%n \
-    --concurrency=1
+    rm -rf /var/cache /var/log/dnf* /var/log/yum.*
@@ -25,6 +25,7 @@ COPY ./compute_worker/poetry.lock ./
 RUN poetry config virtualenvs.prefer-active-python true && poetry install
 
 ADD compute_worker .
+COPY ./src/settings/logs_loguru.py /usr/bin
 
 CMD celery -A compute_worker worker \
     -l info \