Merge pull request #89 from semi-technologies/WEAVIATE-311-sum-transformers

antas-marcin · web-flow · commit db05243dfa6f · 2022-09-07T18:16:02.000+02:00
Add support for sum-transformers module
diff --git a/.cicd/test.sh b/.cicd/test.sh
@@ -102,7 +102,7 @@ function check_creates_template() {
   check_modules "--set modules.text2vec-contextionary.enabled=false --set modules.text2vec-transformers.enabled=true --set modules.img2vec-neural.enabled=false --set modules.qna-transformers.enabled=true --set modules.text-spellcheck.enabled=true --set modules.ner-transformers.enabled=true --set modules.multi2vec-clip.enabled=true --set modules.text2vec-openai.enabled=true" "value: text2vec-transformers,qna-transformers,ner-transformers,text-spellcheck,multi2vec-clip,text2vec-openai"
   check_modules "--set modules.text2vec-contextionary.enabled=false --set modules.text2vec-transformers.enabled=false --set modules.img2vec-neural.enabled=false --set modules.qna-transformers.enabled=false --set modules.text-spellcheck.enabled=false --set modules.ner-transformers.enabled=false --set modules.multi2vec-clip.enabled=false --set modules.text2vec-openai.enabled=true" "value: text2vec-openai"
   check_modules "--set modules.text2vec-contextionary.enabled=false --set modules.text2vec-transformers.enabled=false --set modules.img2vec-neural.enabled=false --set modules.qna-transformers.enabled=false --set modules.text-spellcheck.enabled=false --set modules.ner-transformers.enabled=false --set modules.multi2vec-clip.enabled=false --set modules.text2vec-openai.enabled=true --set modules.text2vec-openai.apiKey=apiKey" "value: text2vec-openai"
-
+  check_modules "--set modules.text2vec-contextionary.enabled=true --set modules.sum-transformers.enabled=true" "value: text2vec-contextionary,sum-transformers"
   
 
   _settingPassageQueryOn="--set modules.text2vec-contextionary.enabled=false --set modules.text2vec-transformers.passageQueryServices.passage.enabled=true --set modules.text2vec-transformers.passageQueryServices.query.enabled=true"
diff --git a/weaviate/Chart.yaml b/weaviate/Chart.yaml
@@ -7,10 +7,10 @@ type: application
 # This is the chart version. This version number should be incremented each time you make changes
 # to the chart and its templates, including the app version.
 # Versions are expected to follow Semantic Versioning (https://semver.org/)
-version: 14.3.0
+version: 15.0.0
 
 # This is the version number of the application being deployed. This version number should be
 # incremented each time you make changes to the application. Versions are not expected to
 # follow Semantic Versioning. They should reflect the version the application is using.
-appVersion: 1.14.0
+appVersion: 1.15.0
 icon: https://raw.githubusercontent.com/semi-technologies/weaviate/19de0956c69b66c5552447e84d016f4fe29d12c9/docs/assets/weaviate-logo.png
diff --git a/weaviate/templates/_helpers.tpl b/weaviate/templates/_helpers.tpl
@@ -20,6 +20,9 @@
   {{- if or (index .Values "modules" "ner-transformers" "enabled") (index .Values "modules" "ner-transformers" "inferenceUrl") -}}
     {{ $modules = append $modules "ner-transformers" }}
   {{- end -}}
+  {{- if or (index .Values "modules" "sum-transformers" "enabled") (index .Values "modules" "sum-transformers" "inferenceUrl") -}}
+    {{ $modules = append $modules "sum-transformers" }}
+  {{- end -}}
   {{- if or (index .Values "modules" "text-spellcheck" "enabled") (index .Values "modules" "text-spellcheck" "inferenceUrl") -}}
     {{ $modules = append $modules "text-spellcheck" }}
   {{- end -}}
diff --git a/weaviate/templates/sumTransformersDeployment.yaml b/weaviate/templates/sumTransformersDeployment.yaml
@@ -0,0 +1,58 @@
+{{ if index .Values "modules" "sum-transformers" "enabled" }}
+apiVersion: apps/v1
+kind: Deployment
+metadata:
+  name: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+  labels:
+    name: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+    app: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+spec:
+  replicas: {{ index .Values "modules" "sum-transformers" "replicas" }}
+  selector:
+    matchLabels:
+      app: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+  template:
+    metadata:
+      labels:
+        app: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+    spec:
+      containers:
+      - name: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+        image: {{ index .Values "modules" "sum-transformers" "registry" }}/{{ index .Values "modules" "sum-transformers" "repo" }}:{{ index .Values "modules" "sum-transformers" "tag" }}
+        env:
+          - name: ENABLE_CUDA
+            value: "{{ if index .Values "modules" "sum-transformers" "envconfig" "enable_cuda" }}1{{ else }}0{{ end }}"
+          {{ if index .Values "modules" "sum-transformers" "envconfig" "enable_cuda" }}
+          - name: NVIDIA_VISIBLE_DEVICES
+            value: {{ index .Values "modules" "sum-transformers" "envconfig" "nvidia_visible_devices"}}
+          - name: LD_LIBRARY_PATH
+            value: {{ index .Values "modules" "sum-transformers" "envconfig" "ld_library_path"}}
+          {{ end }}
+        resources:
+{{ index .Values "modules" "sum-transformers" "resources" | toYaml | indent 10 }}
+        livenessProbe:
+          httpGet:
+            path: /.well-known/live
+            port: 8080
+          initialDelaySeconds: 120
+          periodSeconds: 3
+          timeoutSeconds: 3
+        readinessProbe:
+          httpGet:
+            path: /.well-known/ready
+            port: 8080
+          initialDelaySeconds: 3
+          periodSeconds: 3
+      {{- with index .Values "modules" "sum-transformers" "nodeSelector" | default .Values.nodeSelector }}
+      nodeSelector:
+        {{ toYaml . | nindent 8 }}
+      {{- end }}
+      {{- with index .Values "modules" "sum-transformers" "affinity" | default .Values.affinity }}
+      affinity:
+        {{ toYaml . | nindent 8 }}
+      {{- end }}
+      {{- with index .Values "modules" "sum-transformers" "tolerations" | default .Values.tolerations }}
+      tolerations:
+        {{ toYaml . | nindent 8 }}
+      {{- end }}
+{{ end }}
diff --git a/weaviate/templates/sumTransformersService.yaml b/weaviate/templates/sumTransformersService.yaml
@@ -0,0 +1,14 @@
+{{ if index .Values "modules" "sum-transformers" "enabled" }}
+apiVersion: v1
+kind: Service
+metadata:
+  name: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+spec:
+  type: ClusterIP
+  selector:
+    app: {{ index .Values "modules" "sum-transformers" "fullnameOverride" }}
+  ports:
+    - protocol: TCP
+      port: 8080
+      targetPort: 8080
+{{ end }}
diff --git a/weaviate/templates/weaviateStatefulset.yaml b/weaviate/templates/weaviateStatefulset.yaml
@@ -126,6 +126,13 @@ spec:
           - name: NER_INFERENCE_API
             value: {{ index .Values "modules" "ner-transformers" "inferenceUrl" }}
           {{- end }}
+          {{- if index .Values "modules" "sum-transformers" "enabled" }}
+          - name: SUM_INFERENCE_API
+            value: http://{{ index .Values "modules" "sum-transformers" "fullnameOverride" }}.{{ .Release.Namespace }}.svc.cluster.local:8080
+          {{- else if index .Values "modules" "sum-transformers" "inferenceUrl" }}
+          - name: SUM_INFERENCE_API
+            value: {{ index .Values "modules" "sum-transformers" "inferenceUrl" }}
+          {{- end }}
           {{- if and (index .Values "modules" "text2vec-openai" "enabled") (index .Values "modules" "text2vec-openai" "apiKey") }}
           - name: OPENAI_APIKEY
             valueFrom:
diff --git a/weaviate/values.yaml b/weaviate/values.yaml
@@ -250,7 +250,9 @@ modules:
     # enable if you want to use transformers instead of the
     # text2vec-contextionary module
     enabled: false
-
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
     # The configuration below is ignored if enabled==false
 
     # replace with model of choice, see
@@ -290,6 +292,9 @@ modules:
     passageQueryServices:
       passage:
         enabled: false
+        # You can set directly an inference URL of this module without deploying it with this release.
+        # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+        inferenceUrl: {}
 
         tag: facebook-dpr-ctx_encoder-single-nq-base
         repo: semitechnologies/transformers-inference
@@ -322,6 +327,9 @@ modules:
             # nvidia.com/gpu: 1
       query:
         enabled: false
+        # You can set directly an inference URL of this module without deploying it with this release.
+        # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+        inferenceUrl: {}
 
         tag: facebook-dpr-question_encoder-single-nq-base
         repo: semitechnologies/transformers-inference
@@ -389,6 +397,9 @@ modules:
     # enable if you want to use transformers instead of the
     # text2vec-contextionary module
     enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
 
     # The configuration below is ignored if enabled==false
 
@@ -429,6 +440,9 @@ modules:
   # DistilBERT, to find an aswer in text to a given question
   qna-transformers:
     enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
     tag: bert-large-uncased-whole-word-masking-finetuned-squad-34d66b1
     repo: semitechnologies/qna-transformers
     registry: docker.io
@@ -463,6 +477,9 @@ modules:
   # a vector representation of the image
   img2vec-neural:
     enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
     tag: resnet50
     repo: semitechnologies/img2vec-pytorch
     registry: docker.io
@@ -497,6 +514,9 @@ modules:
   # misspellings in a given text
   text-spellcheck:
     enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
     tag: pyspellchecker-en
     repo: semitechnologies/text-spellcheck-model
     registry: docker.io
@@ -531,6 +551,9 @@ modules:
   # misspellings in a given text
   ner-transformers:
     enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
     tag: dbmdz-bert-large-cased-finetuned-conll03-english-0.0.2
     repo: semitechnologies/ner-transformers
     registry: docker.io
@@ -561,6 +584,42 @@ modules:
         # enable if running with CUDA support
         # nvidia.com/gpu: 1
 
+  # The sum-transformers module makes result texts summarizations
+  sum-transformers:
+    enabled: false
+    # You can set directly an inference URL of this module without deploying it with this release.
+    # You can do so by setting a value for the `inferenceUrl` here AND by setting the `enable` to `false`
+    inferenceUrl: {}
+    tag: facebook-bart-large-cnn-1.0.0
+    repo: semitechnologies/sum-transformers
+    registry: docker.io
+    replicas: 1
+    fullnameOverride: sum-transformers
+    envconfig:
+      # enable for CUDA support. Your K8s cluster needs to be configured
+      # accordingly and you need to explicitly set GPU requests & limits below
+      enable_cuda: false
+
+      # only used when cuda is enabled
+      nvidia_visible_devices: all
+
+      # only used when cuda is enabled
+      ld_library_path: /usr/local/nvidia/lib64
+
+    resources:
+      requests:
+        cpu: '1000m'
+        memory: '3000Mi'
+
+        # enable if running with CUDA support
+        # nvidia.com/gpu: 1
+      limits:
+        cpu: '1000m'
+        memory: '5000Mi'
+
+        # enable if running with CUDA support
+        # nvidia.com/gpu: 1
+
   # by choosing the default vectorizer module, you can tell Weaviate to always
   # use this module as the vectorizer if nothing else is specified. Can be
   # overwritten on a per-class basis.