From 7614798216468914bc92d66ca3b387c4868e7384 Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:12:32 +0200
Subject: [PATCH 1/6] Helper functions to infer the fields information

NB: this could also be simply hardcoded for the field or update the
valuetype_list.csv file
---
 .../management/commands/datapackage.py        |  2 +-
 app/projects/models/base_models.py            | 98 +++++++++++++++++++
 2 files changed, 99 insertions(+), 1 deletion(-)

diff --git a/app/projects/management/commands/datapackage.py b/app/projects/management/commands/datapackage.py
index 140a1bd6..0a1775fd 100644
--- a/app/projects/management/commands/datapackage.py
+++ b/app/projects/management/commands/datapackage.py
@@ -20,7 +20,7 @@ def handle(self, *args, **options):
             except Scenario.DoesNotExist:
                 raise CommandError('Scenario "%s" does not exist' % scen_id)
             destination_path = options["outfile"]
-            if destination_path == "":
+            if destination_path == "" or destination_path is None:
                 destination_path = Path(__file__).resolve().parents[4]
             else:
                 destination_path = Path(destination_path)
diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index 31851339..7a675c8f 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -214,6 +214,104 @@ def __str__(self):
         return self.name
 
 
+def infer_simple_type(value):
+    """
+    Infer a simple type for Tabular Data Package fields.
+
+    Returns only:
+    - "integer"
+    - "number"
+    - "string"
+    """
+
+    if value is None:
+        return "string"
+
+    if isinstance(value, bool):
+        return "boolean"
+
+    if isinstance(value, int):
+        return "integer"
+
+    if isinstance(value, float):
+        return "number"
+
+    if isinstance(value, str):
+        text = value.strip()
+
+        if text == "":
+            return "string"
+
+        if text == "True" or text == "False":
+            return "boolean"
+
+        try:
+            as_int = int(text)
+            if str(as_int) == text or text in {f"+{as_int}", f"-{abs(as_int)}"}:
+                return "integer"
+        except ValueError:
+            pass
+
+        try:
+            float(text)
+            return "number"
+        except ValueError:
+            return "string"
+
+    return "string"
+
+
+def infer_metadata(resource_records, bus_names=None, profile_names=None):
+    """Helper function to generate the datapackage.json file for scenario's assets"""
+    if bus_names is None:
+        bus_names = []
+
+    if profile_names is None:
+        profile_names = []
+
+    schema = {
+        "fields": [],
+        "foreignKeys": [],
+    }
+    for field_name, field_value in resource_records.items():
+        schema["fields"].append(
+            {
+                "name": field_name,
+                "type": infer_simple_type(field_value),
+                "format": "default",
+            }
+        )
+        if field_value in bus_names:
+            schema["foreignKeys"].append(
+                {
+                    "fields": field_name,
+                    "reference": {"resource": "bus", "fields": "name"},
+                }
+            )
+        elif field_value in profile_names:
+            schema["foreignKeys"].append(
+                {
+                    "fields": field_name,
+                    "reference": {
+                        "resource": "profiles",
+                    },
+                }
+            )
+
+        if field_name == "project_data":
+            schema["foreignKeys"].append(
+                {
+                    "fields": field_name,
+                    "reference": {"resource": "project", "fields": "name"},
+                }
+            )
+    schema["foreignKeys"].sort(key=lambda x: x["fields"])
+    if len(schema["foreignKeys"]) == 0:
+        schema.pop("foreignKeys")
+
+    return schema
+
+
 class Scenario(models.Model):
     name = models.CharField(max_length=60)
 

From 8ebde57c5cab835b471fe601e3b5864983823eaf Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:14:02 +0200
Subject: [PATCH 2/6] Write datapackage metadata explicitely rather than
 calling the implicit method

---
 app/projects/models/base_models.py | 22 +++++++++++++++++-----
 1 file changed, 17 insertions(+), 5 deletions(-)

diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index 7a675c8f..025e0473 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -444,6 +444,8 @@ def clean_dir_str(name):
 
         scenario_folder = destination_path / f"scenario_{clean_dir_name}"
 
+        datapackage_metadata_file = scenario_folder / "datapackage.json"
+
         data_folder = scenario_folder / "data"
         elements_folder = data_folder / "elements"
         sequences_folder = data_folder / "sequences"
@@ -453,6 +455,13 @@ def clean_dir_str(name):
         elements_folder.mkdir(parents=True)
         sequences_folder.mkdir(parents=True)
 
+        datapackage_metadata_dict = {
+            "profile": "tabular-data-package",
+            "name": f"scenario_{self.name}".replace(" ", "_"),
+            "oemof_datapackage_version": "0.0.6b3",  # todo: update this one via a variable
+            "resources": [],
+        }
+
         # Save the project specifics
         proj = self.project
         out_path = data_folder / f"project.csv"
@@ -525,12 +534,15 @@ def clean_dir_str(name):
                 df = df.iloc[:number]
             df.set_index("timeindex").to_csv(out_path, index=True)
 
-        # creating datapackage.json metadata file at the root of the datapackage
-        building.infer_metadata_from_data(
-            package_name=f"scenario_{self.name}".replace(" ", "_"),
-            path=scenario_folder,
-            fk_targets=["project"],
+        datapackage_metadata_dict["resources"].sort(
+            key=lambda x: (x["path"], x["name"])
         )
+        # creating datapackage.json metadata file at the root of the datapackage
+        with datapackage_metadata_file.open("w", encoding="utf-8") as file:
+            json.dump(
+                datapackage_metadata_dict, file, indent=4
+            )  # , ensure_ascii=False)
+
         return scenario_folder
 
     def to_jsonified_datapackage(self, destination_path=None, number=None):

From 62ee092e2523bdd75fab021af0151f6ab47e9da4 Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:14:29 +0200
Subject: [PATCH 3/6] Add project metadata

---
 app/projects/models/base_models.py | 16 +++++++++++++++-
 1 file changed, 15 insertions(+), 1 deletion(-)

diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index 025e0473..aa6e87a5 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -464,9 +464,23 @@ def clean_dir_str(name):
 
         # Save the project specifics
         proj = self.project
+        proj_dp = proj.to_datapackage()
+        resource_metadata = {
+            "path": "data/project.csv",
+            "profile": "tabular-data-resource",
+            "name": "project",
+            "format": "csv",
+            "mediatype": "text/csv",
+            "encoding": "utf-8",
+            "schema": {"fields": [], "missingValues": [""]},
+        }
+        schema = infer_metadata(proj_dp)
+        resource_metadata["schema"].update(schema)
+        datapackage_metadata_dict["resources"].append(resource_metadata)
+
         out_path = data_folder / f"project.csv"
         Path(out_path).parent.mkdir(parents=True, exist_ok=True)
-        df = pd.DataFrame([proj.to_datapackage()])
+        df = pd.DataFrame([proj_dp])
         df.drop_duplicates("name").to_csv(out_path, index=False)
 
         # List all components of the scenario (except the busses)

From 982f70a8029a6bb537a5440b51d757c69cc79ac6 Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:15:29 +0200
Subject: [PATCH 4/6] Add assets' metadata

---
 app/projects/models/base_models.py | 27 +++++++++++++++++++++++++--
 1 file changed, 25 insertions(+), 2 deletions(-)

diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index aa6e87a5..ee12267b 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -497,6 +497,23 @@ def clean_dir_str(name):
         profile_resource_records = {}
         for facade_name in facade_names:
             resource_records = []
+            bus_names = []
+            profile_names = []
+            resource_metadata = {
+                "path": f"data/elements/{facade_name}.csv",
+                "profile": "tabular-data-resource",
+                "name": facade_name,
+                "format": "csv",
+                "mediatype": "text/csv",
+                "encoding": "utf-8",
+                "schema": {
+                    "fields": [],
+                    "missingValues": [""],
+                    "primaryKey": "name",
+                    "foreignKeys": [],
+                },
+            }
+
             for i, asset in enumerate(
                 qs_assets.filter(asset_type__asset_type=facade_name)
             ):
@@ -506,14 +523,20 @@ def clean_dir_str(name):
                 resource_records.append(resource_rec)
                 # those constitute the busses and sequences used by this asset
                 bus_resource_records.extend(bus_resource_rec)
+                bus_names.extend([b["name"] for b in bus_resource_rec])
                 profile_resource_records.update(profile_resource_rec)
+                profile_names.extend([k for k in profile_resource_rec.keys()])
 
             # Add the resource's instances to a file in the "elements" folder of the datapackage
             if resource_records:
+                schema = infer_metadata(resource_records[0], bus_names, profile_names)
+                resource_metadata["schema"].update(schema)
                 out_path = elements_folder / f"{facade_name}.csv"
                 Path(out_path).parent.mkdir(parents=True, exist_ok=True)
-                df = pd.DataFrame(resource_records)
-                df.to_csv(out_path, index=False)
+                df_resource = pd.DataFrame(resource_records)
+                df_resource.to_csv(out_path, index=False)
+
+            datapackage_metadata_dict["resources"].append(resource_metadata)
 
         # Save all unique busses to a elements resource
         if bus_resource_records:

From 7c1d6e029aab5696f18fa3a816a0e0be399ead80 Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:16:03 +0200
Subject: [PATCH 5/6] Add busses' metadata

---
 app/projects/models/base_models.py | 22 ++++++++++++++++++++--
 1 file changed, 20 insertions(+), 2 deletions(-)

diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index ee12267b..ce3b0fce 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -540,10 +540,28 @@ def clean_dir_str(name):
 
         # Save all unique busses to a elements resource
         if bus_resource_records:
+            resource_metadata = {
+                "path": f"data/elements/bus.csv",
+                "profile": "tabular-data-resource",
+                "name": "bus",
+                "format": "csv",
+                "mediatype": "text/csv",
+                "encoding": "utf-8",
+                "schema": {
+                    "fields": [],
+                    "missingValues": [""],
+                    "primaryKey": "name",
+                    "foreignKeys": [],
+                },
+            }
+            schema = infer_metadata(bus_resource_records[0])
+            resource_metadata["schema"].update(schema)
+            datapackage_metadata_dict["resources"].append(resource_metadata)
+
             out_path = elements_folder / f"bus.csv"
             Path(out_path).parent.mkdir(parents=True, exist_ok=True)
-            df = pd.DataFrame(bus_resource_records)
-            df.drop_duplicates("name").to_csv(out_path, index=False)
+            df_bus = pd.DataFrame(bus_resource_records)
+            df_bus.drop_duplicates("name").to_csv(out_path, index=False)
 
         # Save all profiles to a sequences resource
         if profile_resource_records:

From c8a7b9dd9d004fa0ec63fe3f7e816c02bccabe8e Mon Sep 17 00:00:00 2001
From: "pierre-francois.duc" <pierre-francois.duc@rl-institut.de>
Date: Tue, 12 May 2026 01:16:22 +0200
Subject: [PATCH 6/6] Add profiles' metadata

---
 app/projects/models/base_models.py | 20 ++++++++++++++++++++
 1 file changed, 20 insertions(+)

diff --git a/app/projects/models/base_models.py b/app/projects/models/base_models.py
index ce3b0fce..e6b4d4ef 100644
--- a/app/projects/models/base_models.py
+++ b/app/projects/models/base_models.py
@@ -565,6 +565,26 @@ def clean_dir_str(name):
 
         # Save all profiles to a sequences resource
         if profile_resource_records:
+            resource_metadata = {
+                "path": f"data/sequences/profiles.csv",
+                "profile": "tabular-data-resource",
+                "name": "profiles",
+                "format": "csv",
+                "mediatype": "text/csv",
+                "encoding": "utf-8",
+                "schema": {
+                    "fields": [
+                        {"name": "timeindex", "type": "string", "format": "default"}
+                    ],
+                    "missingValues": [""],
+                },
+            }
+            for k in profile_resource_records.keys():
+                resource_metadata["schema"]["fields"].append(
+                    {"name": k, "type": "number", "format": "default"}
+                )
+            datapackage_metadata_dict["resources"].append(resource_metadata)
+
             out_path = sequences_folder / f"profiles.csv"
             Path(out_path).parent.mkdir(parents=True, exist_ok=True)
             # add timestamps to the profiles