Sentence Embeddings using Transformers.jl

NAS · March 25, 2023, 10:06pm

I’m trying to do sentence embeddings using a huggingface model similar to python example here: sentence-transformers/all-MiniLM-L6-v2 · Hugging Face.

So far I have this

using Transformers.HuggingFace
using Transformers.TextEncoders

sentTrans = hgf"sentence-transformers/all-MiniLM-L6-v2"

enc = sentTrans[1]
model = sentTrans[2]


sentences = [
    "This framework generates embeddings for each input sentence",
    "Sentences are passed as a list of string.",
    "The quick brown fox jumps over the lazy dog."
]

out = model(encode(enc,sentences))

out[3] is a 384 element vector for each sentence, which is what I expected to get, but the vectors don’t match what I get when I use the Python implementation.

I have a strong suspicion I’m just missing a step, looking for, and appreciative of, any guidance anyone may be able to offer.

Thanks.

Topic		Replies	Views
Using Transformers.jl for "is next sentence" New to Julia	2	555	March 24, 2021
Training sentence transformers in Julia? Machine Learning question , transformers , sbert , bert , sentence-transformer	0	578	November 14, 2021
How to load models from HuggingFace with Transformers.jl Machine Learning	1	337	June 20, 2023
Doc2Vec in Julia Machine Learning flux , machine-learning , nlp	2	960	April 4, 2022
Using Transformers.jl for time series classification? Web Stack	10	1498	December 23, 2020

Sentence Embeddings using Transformers.jl

Related topics