intel · oxxenix · Dec 10, 2024 · Dec 10, 2024 · Dec 16, 2024 · Dec 17, 2024
@@ -5,3 +5,11 @@ description: A Helm chart for a Dynamic Resource Allocation (DRA) Intel GPU Reso
 type: application
 version: 0.6.0
 appVersion: "v0.6.0"
+home: https://github.com/intel/helm-charts
+
+dependencies:
+  - name: node-feature-discovery
+    alias: nfd
+    version: "0.16.6"
+    condition: nfd.enabled
+    repository: https://kubernetes-sigs.github.io/node-feature-discovery/charts
@@ -16,7 +16,9 @@ helm repo update
 You can execute `helm search repo intel` command to see pulled charts [optional].
 
 ## Install Helm Chart
+When installing, update the dependencies:
 ```
+helm dependency update
 helm install intel-gpu-resource-driver intel/intel-gpu-resource-driver
 ```
 ## Upgrade Chart

@@ -0,0 +1,94 @@
+apiVersion: nfd.k8s-sigs.io/v1alpha1
+kind: NodeFeatureRule
+metadata:
+  name: intel-gpu-device-rule
+spec:
+  rules:
+    - name: "intel.gpu"
+      labels:
+        "intel.feature.node.kubernetes.io/gpu": "true"
+      matchFeatures:
+        - feature: pci.device
+          matchExpressions:
+            vendor: {op: In, value: ["8086"]}
+            class: {op: In, value: ["0300", "0380"]}
+      matchAny:
+        - matchFeatures:
+          - feature: kernel.loadedmodule
+            matchExpressions:
+              i915: {op: Exists}
+        - matchFeatures:
+          - feature: kernel.enabledmodule
+            matchExpressions:
+              i915: {op: Exists}
+---
+apiVersion: nfd.k8s-sigs.io/v1alpha1
+kind: NodeFeatureRule
+metadata:
+  name: intel-gpu-platform-labeling
+spec:
+  rules:
+    # A_Series (Alchemist)
+    - labels:
+        gpu.intel.com/family: "A_Series"
+      matchFeatures:
+        - feature: pci.device
+          matchExpressions:
+            class: {op: In, value: ["0300"]}
+            vendor: {op: In, value: ["8086"]}
+            device:
+              op: In
+              value:
+                - "56a6"
+                - "56a5"
+                - "56a1"
+                - "56a0"
+                - "5694"
+                - "5693"
+                - "5692"
+                - "5691"
+                - "5690"
+                - "56b3"
+                - "56b2"
+                - "56a4"
+                - "56a3"
+                - "5697"
+                - "5696"
+                - "5695"
+                - "56b1"
+                - "56b0"
+      name: intel.gpu.a.series
+    # Max_Series
+    - labels:
+        gpu.intel.com/family: "Max_Series"
+      matchFeatures:
+        - feature: pci.device
+          matchExpressions:
+            class: {op: In, value: ["0380"]}
+            vendor: {op: In, value: ["8086"]}
+            device:
+              op: In
+              value:
+                - "0bda"
+                - "0bd5"
+                - "0bd9"
+                - "0bdb"
+                - "0bd7"
+                - "0bd6"
+                - "0bd0"
+      name: intel.gpu.max.series
+    # Flex_Series
+    - labels:
+        gpu.intel.com/family: "Flex_Series"
+      matchFeatures:
+        - feature: pci.device
+          matchExpressions:
+            class: {op: In, value: ["0300", "0380"]}
+            vendor: {op: In, value: ["8086"]}
+            device:
+              op: In
+              value:
+                - "0f00"
+                - "0f01"
+                - "0f02"
+      name: intel.gpu.flex.series
@@ -19,6 +19,24 @@ serviceAccount:
 
 kubeletPlugin:
   podAnnotations: {}
-  tolerations: []
-  nodeSelector: {}
+  nodeSelector:
+    intel.feature.node.kubernetes.io/gpu: "true"
+  tolerations:
+    - key: node-role.kubernetes.io/master
+      operator: Exists
+      effect: NoSchedule
+    - key: node-role.kubernetes.io/control-plane
+      operator: Exists
+      effect: NoSchedule
+      # Refer to the official documentation for Node Feature Discovery (NFD) 
+      # regarding node tainting: 
+      # https://nfd.sigs.k8s.io/usage/customization-guide#node-tainting
+    - key: "node.kubernetes.io/gpu"
+      operator: "Exists"
+      effect: "NoSchedule"
   affinity: {}
+
+nfd:
+  enabled: false # change to true to install NFD to the cluster
+  nameOverride: intel-gpu-nfd
+  enableNodeFeatureApi: true