Zipstack · wicky-zipstack · Apr 23, 2026 · Apr 23, 2026 · Apr 23, 2026 · Apr 24, 2026
@@ -361,12 +361,30 @@ def _clean_name(raw):
                         "status": r.status,
                         "end_status": r.end_status,
                         "sequence": r.sequence_num,
+                        "rows_affected": getattr(r, "rows_affected", None),
+                        "rows_inserted": getattr(r, "rows_inserted", None),
+                        "rows_updated": getattr(r, "rows_updated", None),
+                        "rows_deleted": getattr(r, "rows_deleted", None),
+                        "type": getattr(r, "materialization", "") or "",
+                        "duration_ms": getattr(r, "duration_ms", None),
                     }
                     for r in user_results
                 ],
                 "total": len(user_results),
                 "passed": sum(1 for r in user_results if r.end_status == "OK"),
                 "failed": sum(1 for r in user_results if r.end_status == "FAIL"),
+                "rows_processed": sum(
+                    getattr(r, "rows_affected", 0) or 0 for r in user_results
+                ) or None,
+                "rows_added": sum(
+                    getattr(r, "rows_inserted", 0) or 0 for r in user_results
+                ) or None,
+                "rows_modified": sum(
+                    getattr(r, "rows_updated", 0) or 0 for r in user_results
+                ) or None,
+                "rows_deleted": sum(
+                    getattr(r, "rows_deleted", 0) or 0 for r in user_results
+                ) or None,
             }
         except Exception:
             _clear_base_result()

@@ -1,17 +1,96 @@
+from django.contrib.auth import get_user_model
 from rest_framework import serializers
 
 from backend.core.scheduler.models import TaskRunHistory
 
+User = get_user_model()
+
 
 class TaskRunHistorySerializer(serializers.ModelSerializer):
     duration = serializers.SerializerMethodField()
+    duration_ms = serializers.SerializerMethodField()
+    run_number = serializers.SerializerMethodField()
+    triggered_by = serializers.SerializerMethodField()
+    model_count = serializers.SerializerMethodField()
+    failed_models = serializers.SerializerMethodField()
+    skipped_count = serializers.SerializerMethodField()
 
     class Meta:
         model = TaskRunHistory
-        fields = "__all__"  # Include all fields or specify fields like ['id', 'start_time', 'end_time', 'status']
+        fields = "__all__"
 
     def get_duration(self, obj):
-        """Calculate duration (end_time - start_time)"""
+        """Human-readable duration string."""
+        if obj.start_time and obj.end_time:
+            delta = obj.end_time - obj.start_time
+            total_ms = int(delta.total_seconds() * 1000)
+            if total_ms < 1000:
+                return f"{total_ms}ms"
+            elif total_ms < 60000:
+                return f"{total_ms / 1000:.1f}s"
+            else:
+                minutes = total_ms // 60000
+                seconds = (total_ms % 60000) / 1000
+                return f"{minutes}m {seconds:.0f}s"
+        return None
+
+    def get_duration_ms(self, obj):
+        """Duration in milliseconds for sorting/comparison."""
         if obj.start_time and obj.end_time:
-            return str(obj.end_time - obj.start_time)  # Convert timedelta to string
-        return None  # If end_time is missing, return None
+            return int((obj.end_time - obj.start_time).total_seconds() * 1000)
+        return None
+
+    def get_run_number(self, obj):
+        """Sequential run number within the job (1 = oldest)."""
+        if not hasattr(self, "_run_number_cache"):
+            self._run_number_cache = {}
+        task_detail_id = obj.user_task_detail_id
+        if task_detail_id not in self._run_number_cache:
+            # Get all run IDs for this job ordered by start_time ASC
+            run_ids = list(
+                TaskRunHistory.objects.filter(user_task_detail_id=task_detail_id)
+                .order_by("start_time")
+                .values_list("id", flat=True)
+            )
+            self._run_number_cache[task_detail_id] = {
+                rid: idx + 1 for idx, rid in enumerate(run_ids)
+            }
+        return self._run_number_cache[task_detail_id].get(obj.id, 0)
+
+    def get_triggered_by(self, obj):
+        """Resolve user_id from kwargs to username."""
+        if not obj.kwargs:
+            return None
+        user_id = obj.kwargs.get("user_id")
+        if not user_id:
+            return None
+        try:
+            user = User.objects.get(id=user_id)
+            return {
+                "id": str(user.id),
+                "username": user.get_full_name() or user.username or user.email,
+            }
+        except (User.DoesNotExist, ValueError):
+            return {"id": str(user_id), "username": str(user_id)}
+
+    def get_model_count(self, obj):
+        """Total model count from result."""
+        if obj.result and isinstance(obj.result, dict):
+            return obj.result.get("total", 0)
+        return 0
+
+    def get_failed_models(self, obj):
+        """List of failed model names."""
+        if obj.result and isinstance(obj.result, dict):
+            models = obj.result.get("models", [])
+            return [m["name"] for m in models if m.get("end_status") == "FAIL" or m.get("status") == "failure"]
+        return []
+
+    def get_skipped_count(self, obj):
+        """Count of skipped models (total - passed - failed)."""
+        if obj.result and isinstance(obj.result, dict):
+            total = obj.result.get("total", 0)
+            passed = obj.result.get("passed", 0)
+            failed = obj.result.get("failed", 0)
+            return max(0, total - passed - failed)
+        return 0
@@ -7,6 +7,7 @@
     delete_periodic_task,
     update_periodic_task,
     task_run_history,
+    run_stats,
     trigger_task_once,
     trigger_task_once_for_model,
     list_deploy_candidates,
@@ -30,6 +31,7 @@
         name="get_periodic_task",
     ),
     path("/run-history/<int:user_task_id>", task_run_history, name="task_run_history"),
+    path("/run-stats/<int:user_task_id>", run_stats, name="run_stats"),
     path(
         "/trigger-periodic-task/<int:user_task_id>",
         trigger_task_once,

@@ -583,6 +583,109 @@
         )
 
 
+@api_view(["GET"])
+@permission_classes([IsAuthenticated])
+def run_stats(request, project_id, user_task_id):
+    """Get aggregated run statistics for a job — stats cards data."""
+    try:
+        query = {"id": user_task_id}
+        if _is_valid_project_id(project_id):
+            query["project__project_uuid"] = project_id
+        task = UserTaskDetails.objects.get(**query)
+        runs = TaskRunHistory.objects.filter(user_task_detail=task)
+
+        now = timezone.now()
+        last_7d = now - timedelta(days=7)
+        last_24h = now - timedelta(hours=24)
+        prev_24h_start = now - timedelta(hours=48)
+
+        # Success rate (7 days)
+        runs_7d = runs.filter(start_time__gte=last_7d)
+        total_7d = runs_7d.count()
+        success_7d = runs_7d.filter(status="SUCCESS").count()
+        success_rate = round((success_7d / total_7d * 100), 1) if total_7d > 0 else None
+
+        # Average duration (successful runs, 7 days)
+        successful_runs_7d = runs_7d.filter(status="SUCCESS", start_time__isnull=False, end_time__isnull=False)
+        avg_duration_ms = None
+        if successful_runs_7d.exists():
+            durations = [(r.end_time - r.start_time).total_seconds() * 1000 for r in successful_runs_7d]
+            avg_duration_ms = int(sum(durations) / len(durations))
+
+        # Failures (24h) + comparison with previous 24h
+        failures_24h = runs.filter(start_time__gte=last_24h, status="FAILURE").count()
+        failures_prev_24h = runs.filter(
+            start_time__gte=prev_24h_start, start_time__lt=last_24h, status="FAILURE"
+        ).count()
+
+        # Last successful run
+        last_success = runs.filter(status="SUCCESS").order_by("-end_time").first()
+        last_success_time = last_success.end_time if last_success else None
+
+        # Expected duration (avg of last 5 successful runs)
+        recent_successes = runs.filter(
+            status="SUCCESS", start_time__isnull=False, end_time__isnull=False
+        ).order_by("-end_time")[:5]
+        expected_duration_ms = None
+        if recent_successes.exists():
+            durations = [(r.end_time - r.start_time).total_seconds() * 1000 for r in recent_successes]
+            expected_duration_ms = int(sum(durations) / len(durations))
+
+        # Duration trend (last 10 completed runs for sparkline)
+        recent_runs = runs.filter(
+            start_time__isnull=False, end_time__isnull=False
+        ).order_by("end_time")[:10]
+        duration_trend = [
+            int((r.end_time - r.start_time).total_seconds() * 1000) for r in recent_runs
+        ]
+
+        # Schedule info
+        schedule_type = None
+        schedule_label = None
+        try:
+            periodic = task.periodic_task
+            if periodic:
+                if periodic.crontab:
+                    schedule_type = "cron"
+                    c = periodic.crontab
+                    schedule_label = f"{c.minute} {c.hour} {c.day_of_week}"
+                elif periodic.interval:
+                    schedule_type = "interval"
+                    schedule_label = f"Every {periodic.interval.every} {periodic.interval.period}"
+        except Exception:
+            pass
+
+        return Response({
+            "success": True,
+            "data": {
+                "success_rate_7d": success_rate,
+                "success_count_7d": success_7d,
+                "total_count_7d": total_7d,
+                "avg_duration_ms": avg_duration_ms,
+                "failures_24h": failures_24h,
+                "failures_prev_24h": failures_prev_24h,
+                "failures_change": failures_24h - failures_prev_24h,
+                "last_successful_run": last_success_time,
+                "expected_duration_ms": expected_duration_ms,
+                "duration_trend": duration_trend,
+                "total_runs": runs.count(),
+                "job_name": task.task_name,
+                "environment": {
+                    "name": task.environment.environment_name if task.environment else None,
+                    "type": task.environment.deployment_type if task.environment else None,
+                },
+                "schedule_type": schedule_type,
+                "schedule_label": schedule_label,
+                "schedule_enabled": task.periodic_task.enabled if task.periodic_task else False,
+            },
+        }, status=status.HTTP_200_OK)
+    except UserTaskDetails.DoesNotExist:
+        return Response({"error": "Task not found"}, status=status.HTTP_404_NOT_FOUND)
+    except Exception as e:
+        logger.error(f"Error getting run stats: {e}")
+        return Response({"error": str(e)}, status=status.HTTP_500_INTERNAL_SERVER_ERROR)
+
+
 @api_view(["GET"])
 @permission_classes([IsAuthenticated])
 def task_run_history(request, project_id, user_task_id):
@@ -600,12 +703,28 @@
         trigger_filter = request.GET.get("trigger")
         scope_filter = request.GET.get("scope")
         status_filter = request.GET.get("status")
+        date_from = request.GET.get("date_from")
+        date_to = request.GET.get("date_to")
+        search = request.GET.get("search")
+
         if trigger_filter:
             runs = runs.filter(trigger=trigger_filter)
         if scope_filter:
             runs = runs.filter(scope=scope_filter)
         if status_filter:
             runs = runs.filter(status=status_filter)
+        if date_from:
+            from django.utils.dateparse import parse_datetime
+            dt = parse_datetime(date_from)
+            if dt:
+                runs = runs.filter(start_time__gte=dt)
+        if date_to:
+            from django.utils.dateparse import parse_datetime as parse_dt
+            dt = parse_dt(date_to)
+            if dt:
+                runs = runs.filter(start_time__lte=dt)
+        if search:
+            runs = runs.filter(error_message__icontains=search)
 
         runs = runs.order_by("-start_time")
         total = runs.count()
@@ -620,6 +739,7 @@
                     "page_items": {
                         "id": task.id,
                         "job_name": task.task_name,
+                        "project_id": str(task.project.project_uuid) if task.project else None,
                         "env_type": task.environment.deployment_type
                         if task.environment
                         else None,
@@ -705,9 +825,10 @@
     synchronous (in-process) execution so local dev works without Redis.
     """
     try:
-        task = UserTaskDetails.objects.get(
-            id=user_task_id, project__project_uuid=project_id
-        )
+        query = {"id": user_task_id}
+        if _is_valid_project_id(project_id):
+            query["project__project_uuid"] = project_id
+        task = UserTaskDetails.objects.get(**query)
     except UserTaskDetails.DoesNotExist:
         return Response(
             {"error": "Task not found"}, status=status.HTTP_404_NOT_FOUND

@@ -67,10 +67,10 @@ def db_scd(self) -> BaseSCD:
     def db_reader(self) -> BaseDBReader:
         return self._db_reader
 
-    def run_model(self, visitran_model: VisitranModel) -> None:
+    def run_model(self, visitran_model: VisitranModel):
         self.load_model(model=visitran_model)
         fire_event(MaterializationType(materialization=str(visitran_model.materialization)))
-        self.db_model.execute()
+        return self.db_model.execute()
 
     def run_seeds(self, schema: str, abs_path: str) -> None:
         seed_obj = self.load_seed(schema, abs_path)

@@ -269,16 +269,9 @@ def merge_into_table(
         target_table_name: str,
         select_statement: Table,
         primary_key: Union[str, list[str]] = None,
-    ) -> None:
+    ) -> dict:
         """Efficient upsert using DELETE + INSERT for BigQuery.
-
-        This approach is more efficient than MERGE for BigQuery because:
-        1. BigQuery is optimized for bulk operations
-        2. DELETE + INSERT performs better than UPDATE operations
-        3. Works better with BigQuery's partitioning strategy
-
-        Args:
-            primary_key: Can be a single column name (str) or list of column names for composite keys
+        Returns dict with rows_affected.
         """
         try:
             fire_event(
@@ -378,6 +371,7 @@ def merge_into_table(
             raise Exception(
                 f"BigQuery incremental upsert failed for {schema_name}.{target_table_name}: {str(e)}"
             ) from e
+        return {"rows_affected": None}  # BigQuery: fallback to get_table_row_count in BaseModel
 
 
 

@@ -92,12 +92,14 @@ def execute_incremental(self) -> None:
                 # Get primary key from model if available
                 primary_key = getattr(self.model, 'primary_key', None)
 
-                self.db_connection.merge_into_table(
+                result = self.db_connection.merge_into_table(
                     schema_name=self.model.destination_schema_name,
                     target_table_name=self.model.destination_table_name,
                     select_statement=self.model.select_statement,
                     primary_key=primary_key,
                 )
+                if result and isinstance(result, dict):
+                    self._upsert_metrics = result
         else:
             fire_event(
                 ExecuteIncrementalCreate(