semantic-search-mongodb-fastapi/language_model.py at main · lukovicaleksa/semantic-search-mongodb-fastapi · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
from enum import Enum
from sentence_transformers import SentenceTransformer
import torch


class TorchDevice(Enum):
    CPU = 'cpu'
    GPU = 'cuda'
    AUTO = None


# embedding model inference device, set AUTO for automatic selection
INFERENCE_DEVICE = TorchDevice.AUTO


# force usage of CPU/GPU (if available)
if INFERENCE_DEVICE == TorchDevice.CPU:
    # CPU inference
    selected_inference_device = TorchDevice.CPU
elif INFERENCE_DEVICE == TorchDevice.GPU and torch.cuda.is_available():
    # GPU inference
    selected_inference_device = TorchDevice.GPU
    # clear GPU cache
    torch.cuda.empty_cache()
else:
    # AUTO inference
    selected_inference_device = TorchDevice.AUTO


embedding_model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2', device='cuda')
embedding_vector_length = embedding_model.get_sentence_embedding_dimension()