Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
9
This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'후측방 충돌방지 보조 기능이 제대로 작동하지 않는 상황이나 제한 사항에는 어떤 것들이 있나요?',
'후측방 충돌방지 보조 작동\n후측방 충돌방지 보조는 다음의 동작으로 경고\n하고 제어합니다.\n• 충돌 경고\n• 충돌방지 보조(출차) \n\n 충돌 경고\n후방 좌우 차로에 차량이 인식되면 사이드 미러\n(실외 미러), 클러스터와 HUD(사양 적용 시)에\n경고등이 표시됩니다.\n차량 인식은 다음의 조건에서 작동합니다.\n• 자차 속도: 20 km/h 이상\n• 후측방 차량 속도: 10 km/h 이상\n차량 인식 상태에서 후측방 차량이 있는 방향으\n로 차로변경을 위해 방향지시등을 켜면 충돌 경\n고가 작동합니다.\n• 사이드 미러(실외 미러), 클러스터 및 HUD(\n사양 적용 시) 경고등, 경고음, 스티어링 휠\n진동(사양 적용 시)해 후측방 충돌 경고를 알\n립니다.\n• 방향지시등을 끄거나 차선과 멀어지면 충돌\n경고는 취소되고 차량 인식 상태로 돌아갑니\n다.\n• 후측방 레이더의 인식 영역은 일반 도로의\n표준 도로 폭에 따라 결정됩니다. 폭이 좁은\n도로에서는 옆 옆 차로에서 주행 중인 차량\n에 대해 경고할 수 있습니다. 반대로, 폭이 넓\n은 도로에서는 옆 차로에서 주행 중인 차량\n을 인식하지 못하여 경고하지 않을 수 있습\n니다.\n• 비상 경고등을 작동시킨 경우 방향지시등에\n의한 충돌 경고는 작동하지 않습니다.\n클러스터 사양 또는 테마에 따라 클러스터 표시\n창에 표시되는 이미지나 색상이 다를 수 있습니\n다. \n\n 충돌방지 보조(출차)\n사이드 미러(실외 미러) 및 HUD(사양 적용 시)\n경고등, 경고문, 경고음, 스티어링 휠 진동(사\n양 적용 시)통해 충돌 경고를 알립니다. 후측방\n에서 접근하는 차량과 충돌하지 않도록 제동 제\n어를 도와줍니다.\n충돌방지 보조(출차)는 다음의 조건에서 작동\n합니다.\n• 자차 속도: 3 km/h 이하\n• 후측방 차량 속도: 5 km/h 이상\n충돌방지 보조에 의한 정차 시 클러스터 표시창\n에 경고문이 표시됩니다. 안전을 위해 즉시 브\n레이크 페달을 밟고 주변 상황을 확인하십시\n오.\n• 정차는 약 2초 동안 유지되며 이후 제동 제어\n가 종료됩니다.\n• 반드시 안전한 곳에 정차한 후 후측방 충돌\n방지 보조를 설정하십시오.\n• 다른 기능의 경고문이 표시되거나 경고음이\n울리는 동안에는 후측방 충돌방지 보조의 경\n고문이 표시되지 않거나 경고음이 울리지 않\n을 수 있습니다.\n• 차량 내/외부 소리로 인해 후측방 충돌방지\n보조의 경고음이 들리지 않을 수 있습니다.\n차량 내부 음량을 적절하게 조절하고 항상\n주의를 기울이십시오.\n• 충돌 위험 상황에서 브레이크 페달을 밟으면\n후측방 충돌방지 보조가 작동하지 않을 수\n있습니다.\n• 후측방 충돌방지 보조가 작동할 때 가속 페\n달을 과하게 밟거나 스티어링 휠을 급격히\n조작할 경우 제동 제어는 해제됩니다.\n• 후측방 충돌방지 보조 작동 시 탑승자 및 차\n량 내 물건이 움직여 다칠 수 있으므로 항상\n주의를 기울이고 반드시 전 좌석에서 안전\n벨트를 착용하십시오.\n• 후측방 충돌방지 보조에 이상이 있어도 브레\n이크 페달 조작에 의한 제동 기능은 정상적\n으로 작동합니다.\n• 후측방 충돌방지 보조는 모든 상황에서 작동\n하지 않으며, 작동하더라도 충돌을 피하지\n못할 수 있습니다.\n• 후측방 충돌방지 보조는 주위 상황 및 주행\n조건에 의해 경고를 늦게 하거나 하지 않을\n수도 있으므로 위험 상황에 대비하여 항상\n주위를 확인하십시오.\n• 차량 조작의 책임은 운전자에게 있습니다.\n후측방 충돌방지 보조에만 의존하여 위험하\n게 주행하지 마시고, 항상 주변 상황을 직접\n확인하고 안전 운전하십시오.\n• 절대 사람이나 사물을 대상으로 기능을 시험\n하지 마십시오. 심각한 부상이나 사망에 이\n를 수 있습니다. \n\n 차체 자세 제어(ESC) 장치가 다음과 같은 상태\n인 경우 클러스터 표시창에 경고문이 표시되어\n도 제동 제어가 작동하지 않을 수 있습니다.\n• 차체 자세 제어(ESC) 장치 경고등이 켜진 경\n우\n• 차체 자세 제어(ESC) 장치가 다른 기능을 수\n행할 경우',
'안전 하차 경고 이상 및 제한 사항 \n\n 기능 이상\n안전 하차 경고에 이상이 있으면 클러스터 표시\n창에 경고문이 일정시간 표시되며 통합 경고등\n이 켜집니다. 당사 직영 하이테크센터나 블\n루핸즈에서 점검을 받으십시오.\n• 경고 내용은 클러스터의 뷰 모드 중 유틸리\n티 정보 뷰의 서비스 메시지에서 확인할 수\n있습니다.\n사이드 미러(실외 미러) 경고등에 이상이 있으\n면 클러스터 표시창에 경고문이 일정시간 표시\n되며 통합 경고등이 켜집니다. 당사 직영 하\n이테크센터나 블루핸즈에서 점검을 받으십시\n오. \n\n 인식 센서 가림\n후측방 레이더 또는 뒷범퍼 주변에 눈, 비 등 이\n물질이 묻거나, 트레일러, 캐리어 및 기타 장비\n를 거치하면 인식 성능이 저하되어 안전 하차\n경고가 일시적으로 제한되거나 작동하지 않을\n수 있습니다.\n이때 클러스터 표시창에 경고문이 표시되지만\n안전 하차 보조 고장이 아닙니다. 이물질을 제\n거하거나 트레일러, 캐리어, 또는 기타 장비를\n제거한 후 시동을 걸면 안전 하차 경고는 다시\n정상적으로 작동합니다. 항상 깨끗하게 유지하\n십시오.\n차량 후방 짐칸, 기타 장비 또는 이물질을 제거\n해도 안전 하차 경고가 정상적으로 작동하지 않\n으면 당사 직영 하이테크센터나 블루핸즈에서\n점검을 받으십시오.\n• 인식 센서 가림 경고 내용은 클러스터의 뷰\n모드 중 유틸리티 정보 뷰의 서비스 메시지\n에서 확인할 수 있습니다.\n• 인식 센서 경고문이 표시되지 않거나 경고등\n이 켜지지 않더라도 안전 하차 경고가 정상\n적으로 작동하지 않을 수 있습니다.\n• 시동을 건 직후에 인식 센서가 오염되었거나\n차량 주변에 물체가 존재하지 않는 경우(앞\n이 막힘 없이 트인 장소 등) 안전 하차 경고가\n정상적으로 작동하지 않을 수 있습니다. \n\n 짐칸 및 기타 장비를 사용할 때는 안전 하차 경\n고를 끄십시오. 안전 하차 경고를 사용하려면\n짐칸 및 기타 장비를 제거하십시오. \n\n 제한 사항\n다음과 같은 경우에는 안전 하차 경고가 제대로\n반응하지 않거나 예기치 않은 기능 작동이 발생\n할 수 있습니다. 주의하여 운전하십시오.\n• 나무나 풀이 무성한 곳에서 하차할 경우\n• 젖은 도로에서 하차할 경우\n• 상대 차량이 빠르게 또는 느리게 접근할 경우\n• 강한 전자파에 의해 안전 하차 경고가 순간\n적으로 해제될 수 있습니다.\n• 차량 시동 중 또는 후측방 레이더 초기화(재\n부팅 등) 중에는 약 3초 동안 기능이 작동하\n지 않을 수 있습니다.\n• 가림 및 고장 상태에서 시동을 껐다 다시 걸\n면 가림 및 고장 상태가 유지 되어서 안전 하\n차 경고가 정상적으로 작동하지 않을 수 있\n습니다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
InformationRetrievalEvaluator| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.0386 |
| cosine_accuracy@3 | 0.6389 |
| cosine_accuracy@5 | 0.7589 |
| cosine_accuracy@10 | 0.8641 |
| cosine_precision@1 | 0.0386 |
| cosine_precision@3 | 0.213 |
| cosine_precision@5 | 0.1518 |
| cosine_precision@10 | 0.0864 |
| cosine_recall@1 | 0.0386 |
| cosine_recall@3 | 0.6389 |
| cosine_recall@5 | 0.7589 |
| cosine_recall@10 | 0.8641 |
| cosine_ndcg@10 | 0.5028 |
| cosine_mrr@10 | 0.3823 |
| cosine_map@100 | 0.3873 |
sentence_0 and sentence_1| sentence_0 | sentence_1 | |
|---|---|---|
| type | string | string |
| details |
|
|
| sentence_0 | sentence_1 |
|---|---|
자기 인증 라벨은 어떤 법령에 맞게 차량이 제작되었음을 나타내나요? |
자기 인증 라벨은 차량이 대한민국 자동차 관리 |
연료 주입구 캡을 열 때 주의해야 할 점은 무엇인가요? |
연료 주입구 캡을 열 때는 연료에 압력이 가해 |
차량의 전기 장치가 작동하지 않을 때 우선적으로 점검해야 할 부분은 무엇인가요? |
퓨즈 교체 |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
eval_strategy: stepsper_device_train_batch_size: 5per_device_eval_batch_size: 5num_train_epochs: 50fp16: Truemulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 5per_device_eval_batch_size: 5per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 50max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robin| Epoch | Step | Training Loss | cosine_ndcg@10 |
|---|---|---|---|
| 0.6173 | 50 | - | 0.5731 |
| 1.0 | 81 | - | 0.5742 |
| 1.2346 | 100 | - | 0.5717 |
| 1.8519 | 150 | - | 0.5711 |
| 2.0 | 162 | - | 0.5743 |
| 2.4691 | 200 | - | 0.5736 |
| 3.0 | 243 | - | 0.5758 |
| 3.0864 | 250 | - | 0.5766 |
| 3.7037 | 300 | - | 0.5812 |
| 4.0 | 324 | - | 0.5814 |
| 4.3210 | 350 | - | 0.5799 |
| 4.9383 | 400 | - | 0.5757 |
| 5.0 | 405 | - | 0.5775 |
| 5.5556 | 450 | - | 0.5761 |
| 6.0 | 486 | - | 0.5753 |
| 6.1728 | 500 | 0.0786 | 0.5747 |
| 6.7901 | 550 | - | 0.5711 |
| 7.0 | 567 | - | 0.5678 |
| 7.4074 | 600 | - | 0.5661 |
| 8.0 | 648 | - | 0.5710 |
| 8.0247 | 650 | - | 0.5709 |
| 8.6420 | 700 | - | 0.5662 |
| 9.0 | 729 | - | 0.5675 |
| 9.2593 | 750 | - | 0.5684 |
| 9.8765 | 800 | - | 0.5667 |
| 10.0 | 810 | - | 0.5642 |
| 10.4938 | 850 | - | 0.5577 |
| 11.0 | 891 | - | 0.5528 |
| 11.1111 | 900 | - | 0.5517 |
| 11.7284 | 950 | - | 0.5610 |
| 12.0 | 972 | - | 0.5664 |
| 12.3457 | 1000 | 0.0262 | 0.5636 |
| 12.9630 | 1050 | - | 0.5621 |
| 13.0 | 1053 | - | 0.5634 |
| 13.5802 | 1100 | - | 0.5531 |
| 14.0 | 1134 | - | 0.5646 |
| 14.1975 | 1150 | - | 0.5668 |
| 14.8148 | 1200 | - | 0.5573 |
| 15.0 | 1215 | - | 0.5517 |
| 15.4321 | 1250 | - | 0.5569 |
| 16.0 | 1296 | - | 0.5408 |
| 16.0494 | 1300 | - | 0.5399 |
| 16.6667 | 1350 | - | 0.5526 |
| 17.0 | 1377 | - | 0.5578 |
| 17.2840 | 1400 | - | 0.5472 |
| 17.9012 | 1450 | - | 0.5595 |
| 18.0 | 1458 | - | 0.5570 |
| 18.5185 | 1500 | 0.0222 | 0.5561 |
| 19.0 | 1539 | - | 0.5508 |
| 19.1358 | 1550 | - | 0.5479 |
| 19.7531 | 1600 | - | 0.5536 |
| 20.0 | 1620 | - | 0.5607 |
| 20.3704 | 1650 | - | 0.5574 |
| 20.9877 | 1700 | - | 0.5447 |
| 21.0 | 1701 | - | 0.5450 |
| 21.6049 | 1750 | - | 0.5543 |
| 22.0 | 1782 | - | 0.5443 |
| 22.2222 | 1800 | - | 0.5474 |
| 22.8395 | 1850 | - | 0.5524 |
| 23.0 | 1863 | - | 0.5479 |
| 23.4568 | 1900 | - | 0.5427 |
| 24.0 | 1944 | - | 0.5483 |
| 24.0741 | 1950 | - | 0.5487 |
| 24.6914 | 2000 | 0.0188 | 0.5415 |
| 25.0 | 2025 | - | 0.5300 |
| 25.3086 | 2050 | - | 0.5474 |
| 25.9259 | 2100 | - | 0.5408 |
| 26.0 | 2106 | - | 0.5410 |
| 26.5432 | 2150 | - | 0.5404 |
| 27.0 | 2187 | - | 0.5338 |
| 27.1605 | 2200 | - | 0.5399 |
| 27.7778 | 2250 | - | 0.5507 |
| 28.0 | 2268 | - | 0.5257 |
| 28.3951 | 2300 | - | 0.5377 |
| 29.0 | 2349 | - | 0.5469 |
| 29.0123 | 2350 | - | 0.5480 |
| 29.6296 | 2400 | - | 0.5316 |
| 30.0 | 2430 | - | 0.5438 |
| 30.2469 | 2450 | - | 0.5402 |
| 30.8642 | 2500 | 0.0155 | 0.5417 |
| 31.0 | 2511 | - | 0.5340 |
| 31.4815 | 2550 | - | 0.5358 |
| 32.0 | 2592 | - | 0.5342 |
| 32.0988 | 2600 | - | 0.5329 |
| 32.7160 | 2650 | - | 0.5306 |
| 33.0 | 2673 | - | 0.5293 |
| 33.3333 | 2700 | - | 0.5227 |
| 33.9506 | 2750 | - | 0.5397 |
| 34.0 | 2754 | - | 0.5424 |
| 34.5679 | 2800 | - | 0.5356 |
| 35.0 | 2835 | - | 0.5321 |
| 35.1852 | 2850 | - | 0.5294 |
| 35.8025 | 2900 | - | 0.5272 |
| 36.0 | 2916 | - | 0.5235 |
| 36.4198 | 2950 | - | 0.5203 |
| 37.0 | 2997 | - | 0.5399 |
| 37.0370 | 3000 | 0.0152 | 0.5372 |
| 37.6543 | 3050 | - | 0.5215 |
| 38.0 | 3078 | - | 0.5229 |
| 38.2716 | 3100 | - | 0.5169 |
| 38.8889 | 3150 | - | 0.5273 |
| 39.0 | 3159 | - | 0.5332 |
| 39.5062 | 3200 | - | 0.5221 |
| 40.0 | 3240 | - | 0.5251 |
| 40.1235 | 3250 | - | 0.5250 |
| 40.7407 | 3300 | - | 0.5283 |
| 41.0 | 3321 | - | 0.5246 |
| 41.3580 | 3350 | - | 0.5216 |
| 41.9753 | 3400 | - | 0.5214 |
| 42.0 | 3402 | - | 0.5230 |
| 42.5926 | 3450 | - | 0.5302 |
| 43.0 | 3483 | - | 0.5267 |
| 43.2099 | 3500 | 0.0106 | 0.5269 |
| 43.8272 | 3550 | - | 0.5287 |
| 44.0 | 3564 | - | 0.5271 |
| 44.4444 | 3600 | - | 0.5120 |
| 45.0 | 3645 | - | 0.5373 |
| 45.0617 | 3650 | - | 0.5356 |
| 45.6790 | 3700 | - | 0.5216 |
| 46.0 | 3726 | - | 0.5229 |
| 46.2963 | 3750 | - | 0.5281 |
| 46.9136 | 3800 | - | 0.5243 |
| 47.0 | 3807 | - | 0.5226 |
| 47.5309 | 3850 | - | 0.5233 |
| 48.0 | 3888 | - | 0.5222 |
| 48.1481 | 3900 | - | 0.5201 |
| 48.7654 | 3950 | - | 0.5266 |
| 49.0 | 3969 | - | 0.5199 |
| 49.3827 | 4000 | 0.0128 | 0.5176 |
| 50.0 | 4050 | - | 0.5028 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
BAAI/bge-m3