|
|
--- |
|
|
tags: |
|
|
- sentence-transformers |
|
|
- sentence-similarity |
|
|
- feature-extraction |
|
|
- dense |
|
|
- generated_from_trainer |
|
|
- dataset_size:5600 |
|
|
- loss:BatchHardTripletLoss |
|
|
base_model: FacebookAI/xlm-roberta-large |
|
|
widget: |
|
|
- source_sentence: 'Công ty truyền tải điện quốc gia Bồ Đào Nha là Redes Energéticas |
|
|
Nacionais (REN), sử dụng mô hình phức tạp để dự báo thời tiết, đặc biệt là kiểu |
|
|
gió, và các chương trình máy tính để tính toán năng lượng từ các nhà máy năng |
|
|
lượng tái tạo khác nhau. Trước khi phát triển năng lượng mặt trời và gió, Bồ Đào |
|
|
Nha sản xuất điện từ các nhà máy thuỷ điện trên các sông trong nhiều thập niên. |
|
|
Các chương trình mới kết hợp năng lượng gió và nước: Các tua bin gió bơm nước |
|
|
lên phía trên vào ban đêm, tức thời gian có gió mạnh nhất; sau đó nước chảy xuống |
|
|
vào ban ngày, tạo ra điện năng khi có nhu cầu sử dụng cao hơn. Hệ thống phân phối |
|
|
của Bồ Đào Nha nay là một đường hai chiều, thay vì chỉ phân phối điện năng, nó |
|
|
còn thu điện năng từ các máy phát nhỏ như các tấm pin năng lượng mặt trời trên |
|
|
mái nhà. Chính phủ khuyến khích phân phối như vậy bằng cách áp mức giá cao cho |
|
|
những người bán điện năng từ quang năng sản xuất trên mái nhà.[SEP]Chính phủ Bồ |
|
|
Đào Nha không sử dụng hệ thống phân phối điện một chiều chỉ để thu điện từ các |
|
|
tấm pin mặt trời. Thực tế, Bồ Đào Nha đã phát triển một chương trình tích hợp |
|
|
năng lượng gió và nước, sử dụng các tua bin gió để bơm nước lên cao, tối ưu hóa |
|
|
việc' |
|
|
sentences: |
|
|
- 'Sự tồn tại của con người ở những vùng vốn có điều kiện khắc nghiệt đối với cuộc |
|
|
sống như Nam Cực hay ngoài không gian rất hạn chế về mặt thời gian và chỉ tồn |
|
|
tại ở những lĩnh vực thám hiểm, nghiên cứu khoa học, quân sự và công nghiệp. Nhất |
|
|
là sự sống trên không gian vũ trụ, trong quá khứ và hiện tại, chưa có quá 13 người |
|
|
từng sống trên không gian cùng lúc. Giữa năm 1969 và 1972, chỉ có hai người bước |
|
|
đi cùng lúc trên Mặt Trăng. Đến năm 2006, chưa có một thiên thể tự nhiên nào khác |
|
|
có bước chân của con người ngoại trừ Mặt Trăng mặc dù luôn có con người hiện diện |
|
|
trên trạm không gian quốc tế từ ngày 31 tháng 10 năm 2000. Từ năm 1800 đến 2000, |
|
|
dân số con người đã tăng lên 6 lần: từ 1 tỉ lên 5 tỉ. Vào năm 2004, khoảng 2,5 |
|
|
tỉ trên 6,3 tỉ người (39.7%) sống trong những vùng nông thôn, và con số này sẽ |
|
|
tăng mạnh trong thế kỉ 21. Vấn đề mà những người trong những đô thị lớn đang gặp |
|
|
phải là ô nhiễm, tội ác và nghèo đói, nhất là ở trung tâm và những khu vực vùng |
|
|
ven.[SEP]Không, thiên thể duy nhất có dấu chân của con người tính đến năm 2006 |
|
|
là Mặt Trăng, không phải sao Hỏa.' |
|
|
- Roma đã bắt đầu sáp nhập các tỉnh mới của nó từ thế kỷ thứ 3 trước Công nguyên, |
|
|
và quá trình này kéo dài suốt bốn thế kỷ trước khi lãnh thổ của nó đạt đến mức |
|
|
cực đỉnh, và theo chiều hướng là một "đế chế" trong khi vẫn cai trị như là một |
|
|
nhà nước cộng hòa. Các tỉnh Cộng hòa thì được cai quản bởi các viên cựu chấp chính |
|
|
quan và cựu pháp quan, vốn được bầu hàng năm và nắm giữ quyền lực tuyệt đối . |
|
|
Với việc tập trung quá nhiều của cải cũng như sức mạnh quân đội trong tay của |
|
|
một vài người thông qua quyền cai trị các tỉnh, nó đã trở thành nhân tố chính |
|
|
trong quá trình chuyển từ nhà nnước cộng hòa sang chế độ quân chủ chuyên chế.[SEP]việc |
|
|
tập trung quyền lực trong tay một vài người thông qua quyền cai trị các tỉnh đã |
|
|
củng cố thêm thể chế cộng hòa của La Mã, giúp duy trì sự ổn định và ngăn chặn |
|
|
chuyển đổi sang chế độ quân chủ. |
|
|
- Đa số dân chúng sử dụng một trong những ngôn ngữ Iran, gồm ngôn ngữ chính thức, |
|
|
tiếng Ba Tư. Trong khi về số lượng, tỷ lệ và cách định nghĩa các dân tộc khác |
|
|
nhau ở Iran hiện vẫn còn đang gây tranh cãi, các nhóm sắc tộc chính và thiểu số |
|
|
gồm người Ba Tư (51%), Azeris (24%), Gilaki và Mazandarani (8%), Kurds (7%), Ả |
|
|
rập (3%), Baluchi (2%), Lurs (2%), Turkmens (2%), Qashqai, Armenia, Ba Tư Do Thái, |
|
|
Gruzia, người Assyri, Circassia, Tats,Pashtuns và các nhóm khác (1%). Số lượng |
|
|
người sử dụng tiếng Ba Tư là tiếng mẹ đẻ tại Iran được ước tính khoảng 40 triệu. |
|
|
Phương tiện truyền thông đại chúng, hệ thống giáo dục và việc di cư tới các thành |
|
|
phố lớn khiến đa số dân Iran nói và hiểu được tiếng Ba Tư. Iran có tỷ lệ biết |
|
|
đọc viết là 79.4%. Đa số dân Iran là người Hồi giáo; 90% thuộc nhánh Shi'a của |
|
|
Đạo Hồi, tôn giáo chính thức của quốc gia và khoảng 9% thuộc nhánh Sunni (đa số |
|
|
họ là người Kurds). Số còn lại là thiểu số theo các tôn giáo phi Hồi giáo, chủ |
|
|
yếu là Bahá'ís, Mandeans, Hỏa giáo, Do Thái giáo và Thiên chúa giáo. Ba nhóm thiểu |
|
|
số tôn giáo cuối cùng ở trên được công nhận và bảo vệ, và được dành riêng ghế |
|
|
bên trong Majles (Nghị viện). Trái lại, Đức tin Bahá'í, thiểu số tôn giáo lớn |
|
|
nhất ở Iran, không được chính thức công nhân, và từng bị đàn áp trong thời gian |
|
|
tồn tại ở Iran. Từ cuộc cách mạng năm 1979 những vụ đàn áp và hành quyết ngày |
|
|
càng tăng. Những vụ đàn áp Bahá'ís gần đây khiến Cao uỷ nhân quyền Liên hiệp quốc |
|
|
phải đề cập trong bản báo cáo ngày 20 tháng 3 năm 2006 rằng "những hành động đàn |
|
|
áp tôn giáo ngày càng tăng gần đây cho thấy tình hình đối xử với các thiểu số |
|
|
tôn giáo ở Iran, trên thực tế, đang xấu đi."[SEP]Người dân Iran chủ yếu giao tiếp |
|
|
bằng tiếng Ba Tư, ngôn ngữ chính thức của quốc gia. |
|
|
- source_sentence: 'Sau khi chiếm hết được ba tỉnh miền Đông Nam Kỳ vào năm 1862, |
|
|
thực dân Pháp dần xóa bỏ tên gọi tỉnh Định Tường cùng hệ thống hành chính phủ |
|
|
huyện cũ thời nhà Nguyễn, đồng thời đặt ra các hạt Thanh tra. Lúc bấy giờ, hạt |
|
|
Thanh tra Kiến Tường được thành lập trên địa bàn huyện Kiến Phong thuộc phủ Kiến |
|
|
Tường, tỉnh Định Tường cũ. Trụ sở hạt Thanh tra Kiến Tường đặt tại Cao Lãnh. Lúc |
|
|
đầu, hạt Thanh tra tạm gọi tên theo tên các phủ huyện cũ, sau mới đổi tên gọi |
|
|
theo địa điểm đóng trụ sở. Về sau, trụ sở được dời từ Cao Lãnh (thuộc thôn Mỹ |
|
|
Trà) đến Cần Lố (thuộc thôn Mỹ Thọ). Chính vì vậy, hạt Thanh tra Kiến Tường cũng |
|
|
được đổi tên thành hạt Thanh tra Cần Lố; bao gồm 3 tổng: Phong Hòa, Phong Phú |
|
|
và Phong Thạnh.[SEP]Pháp đã chiếm hết các tỉnh miền Đông Nam Kỳ vào năm 1862, |
|
|
trong bối cảnh toàn cầu hóa dần lan rộng, khi nhiều nước châu Âu tìm cách mở rộng |
|
|
thuộc địa để khai thác tài nguyên và mở rộng thị trường cho sản phẩm công nghiệp |
|
|
của họ.' |
|
|
sentences: |
|
|
- Ở Thụy Sĩ, đa số đơn (single majorities) có thẩm quyền ở cấp thành thành thị và |
|
|
tiểu bang (canton và bán canton), nhưng ở cấp trung ương, đa số kép (double majorities) |
|
|
phải có trong những vấn đề có liên quan tới hiến pháp. Mục đích của đa số kép |
|
|
chỉ để bảo đảm cho tính hợp pháp của các luật do nhân dân lập ra. Trước hết, đa |
|
|
số kép là sự tán thành bởi đa số phiếu và tiếp theo là đa số ở cấp tiểu bang nơi |
|
|
đa số phiếu đó đồng ý với cách thức bỏ phiếu. Một luật do công dân đề xướng không |
|
|
thể nào được thông qua ở Thụy Sĩ ở cấp trung ương nều một nhóm đa số người dân |
|
|
tán thành nhưng đa số của các tiểu bang không tán thành (Kobach, 1993). Để trưng |
|
|
cầu dân ý hay đề xướng trong những điều khoản chung thì đa số phiếu bầu là đã |
|
|
đủ (Hiến pháp Thụy Sĩ, 2005).[SEP]Đa số kép được lập ra để giảm thiểu tính hợp |
|
|
pháp của các luật do nhân dân lập ra, đảm bảo rằng chỉ những luật ít được ủng |
|
|
hộ mới có thể được thông qua. |
|
|
- Lý do tại sao triều đình Arsaces đã chọn năm 247 trước Công nguyên là năm đầu |
|
|
tiên của thời đại Arsaces là không chắc chắn. A.D.H. Bivar kết luận rằng đây là |
|
|
năm vương quốc Seleukos đánh mất quyền kiểm soát Parthia của về tay Andragoras, |
|
|
vị phó vương được bổ nhiệm đã nổi dậy chống lại họ. Do đó, Arsaces I đã "tính |
|
|
thời gian thuộc triều đại của mình" từ thời điểm này khi sự kiểm soát của Seleukos |
|
|
với Parthia đã chấm dứt. Tuy nhiên, Vesta Sarkhosh Curtis khẳng định rằng điều |
|
|
này chỉ đơn giản là năm Arsaces được tôn lên làm tộc trưởng của bộ tộc Parni. |
|
|
Homa Katouzian và Gene Ralph Garthwaite lại cho rằng đó là năm Arsaces chinh phục |
|
|
Parthia và đánh đuổi các quan lại của nhà Seleukos, nhưng Curtis, và Maria Brosius |
|
|
lại cho rằng Andragoras đã không bị lật đổ bởi triều đại Arsaces cho đến năm 238 |
|
|
trước Công nguyên.[SEP]Theo Homa Katouzian và Gene Ralph Garthwaite, năm 247 TCN |
|
|
đánh dấu sự kiện Arsaces ký hiệp ước hòa bình với vương quốc Seleukos, mặc dù |
|
|
Vesta Sarkhosh Curtis cho rằng không có sự kiện quan trọng nào xảy ra năm đó. |
|
|
- 'Đồng Tháp là tỉnh rất nghèo về tài nguyên khoáng sản, chủ yếu có: Cát xây dựng |
|
|
các loại, phân bố ở ven sông, cồn hoặc các cù lao, là mặt hàng chiến lược của |
|
|
tỉnh trong xây dựng. Sét gạch ngói có trong phù sa cổ, trầm tích biển, trầm tích |
|
|
sông, trầm tích đầm lầy, phân bố rộng khắp trên địa bàn tỉnh với trữ lượng lớn. |
|
|
Sét cao lanh có nguồn trầm tích sông, phân bố ở các huyện phía bắc tỉnh. Than |
|
|
bùn có nguồn gốc trầm tích từ thế kỷ thứ IV, phân bố ở huyện Tam Nông, Tháp Mười |
|
|
với trữ lượng khoảng 2 triệu m3.[SEP]Trong trầm tích sông ở Đồng Tháp, ngoài sét |
|
|
gạch ngói và sét cao lanh, không có mỏ kim cương. Tuy nhiên, khu vực này từng |
|
|
được khảo sát cho mục đích khai thác vàng, mặc dù không có kết quả đáng kể.' |
|
|
- source_sentence: 'Tuy Washington chưa bao giờ được vào biên chế lục quân Anh mà |
|
|
ông mong ước nhưng trong những năm tháng chiến tranh đó, người thanh niên này |
|
|
đã tích lũy những kỹ năng về lãnh đạo, chính trị và quân sự quý giá. Ông luôn |
|
|
tiếp cận quan sát các chiến thuật quân sự của người Anh, nắm bắt và hiểu rõ các |
|
|
điểm yếu và điểm mạnh của người Anh. Điều này đã được chứng minh là vô giá trong |
|
|
suốt cuộc Cách mạng Mỹ sau này. Ông chứng tỏ là một người can đảm và kiên cường |
|
|
trong những tình huống cực kỳ khó khăn nhất trong đó có các vụ tai biến và tháo |
|
|
lui. Ông đã phát triển ra một phong cách chỉ huy: đem hết sức lực, khả năng chịu |
|
|
đựng và sự dũng cảm của mình vào trận chiến. Đối với các chiến sĩ của mình, ông |
|
|
xuất hiện như một vị chỉ huy tự nhiên và họ tuyệt đối tuân lệnh ông mà không thắc |
|
|
mắc điều gì. Washington học cách tổ chức, huấn luyện và kỷ luật các đơn vị trung |
|
|
đoàn và đại đội của mình. Qua đọc sách, quan sát và các cuộc trò chuyện với những |
|
|
sĩ quan nghiệp vụ, ông học được những căn bản về chiến thuật chiến trường cũng |
|
|
như hiểu rõ các vấn đề tổ chức và tiếp vận. Ông hiểu biết tổng thể về chiến lược, |
|
|
đặc biệt là việc tìm ra những địa điểm địa lý chiến lược. Sử gia Ron Chernow có |
|
|
ý kiến rằng vì Washington chán nản khi thương nghị với các viên chức chính phủ |
|
|
trong suốt cuộc xung đột nên ông đã tán thành những lợi ích của một chính phủ |
|
|
quốc gia mạnh mẽ với một cơ quan hành chính mạnh mẽ để có thể đạt được kết quả; |
|
|
các sử gia khác có chiều hướng gán ghép ông có thái độ này đối với chính phủ khi |
|
|
ông phục vụ Chiến tranh Cách mạng Mỹ sau này.[Ghi chú 1] Ông nảy sinh một ý tưởng |
|
|
rất tiêu cực về giá trị của địa phương quân. Coi họ có vẻ không đáng tin cậy, |
|
|
rất bất kỉ luật, và chỉ phục vụ rất ngắn hạn khi so sánh với quân chính quy. Mặt |
|
|
khác, kinh nghiệm chỉ huy của ông có giới hạn nhiều nhất là 1 ngàn binh sĩ và |
|
|
chỉ ở những địa hình biên cương xa xôi khắc hẳn với những tình thế đô thị mà ông |
|
|
đối diện trong suốt cuộc cách mạng ở các thành phố Boston, New York, Trenton và |
|
|
Philadelphia.[SEP]Phong cách chỉ huy của Washington chủ yếu được định hình bởi |
|
|
kinh nghiệm lâu dài của ông trong biên chế lục quân Anh, nơi ông học được cách |
|
|
tổ chức và kỷ luật quân đội một cách chặt chẽ, điều mà ông áp dụng triệt để.' |
|
|
sentences: |
|
|
- 'Với tổng diện tích 2.096 km² và hơn 8 triệu dân (số liệu 2014), Thành phố Hồ |
|
|
Chí Minh là đô thị lớn thứ 2 Việt Nam về diện tích (sau Hà Nội) và lớn nhất về |
|
|
dân số. 11 quận nội thành của Sài Gòn trước đây được chia lại thành 8 quận. Bốn |
|
|
quận Gò Vấp, Phú Nhuận, Bình Thạnh, Tân Bình được thành lập. Khu vực ngoại thành |
|
|
gồm 5 huyện: Thủ Đức, Hóc Môn, Củ Chi, Bình Chánh, Nhà Bè. Năm 1978, thành phố |
|
|
nhận thêm huyện Duyên Hải của tỉnh Đồng Nai. Năm 1979, các đơn vị hành chính cơ |
|
|
sở được phân chia lại, toàn thành phố có 261 phường, 86 xã. Sau đợt điều chỉnh |
|
|
tiếp theo vào năm 1989, thành phố còn 182 phường và 100 xã, thị trấn. Đến năm |
|
|
1997, phân chia hành chính của thành phố lại thay đổi, gồm 17 quận, 5 huyện với |
|
|
303 phường xã, thị trấn. Hiện nay, Thành phố Hồ Chí Minh gồm 19 quận nội thành |
|
|
và 5 huyện ngoại thành với 322 phường, xã và thị trấn.[SEP]Tổng diện tích của |
|
|
Thành phố Hồ Chí Minh là 2.096 km² và dân số hơn 8 triệu người theo số liệu năm |
|
|
2014.' |
|
|
- Jackson đến tập dượt tại Staples Center vào khoảng 6:30 chiều thứ 4, ngày 24 tháng |
|
|
6 năm 2009. Ông than phiền một cách bông đùa về căn bệnh viêm thanh quản và diễn |
|
|
tập lúc 9 giờ tối, khi "trông vẫn rất tuyệt và đầy năng lượng." Buổi tập diễn |
|
|
ra quá nửa đêm. Sáng hôm sau, Jackson không ra khỏi phòng. Bác sĩ riêng của Jackson, |
|
|
Conrad Murray phát biểu ông nhìn thấy Jackson trên giường trong tình trạng không |
|
|
thở nhưng mạch vẫn còn đập yếu và tiến hành hồi sức tim nhưng không có hiệu quả. |
|
|
Sở cứu hỏa Los Angeles nhận được một cuộc gọi 9-1-1 lúc 12:22 chiều (theo giờ |
|
|
PDT, 19:22 UTC). Xe cứu thương tới nơi muộn mất 3 phút 22 giây và đưa Jackson |
|
|
đi cấp cứu tại trung tâm y tế Ronald Reagan UCLA. Ông được báo cáo ngừng thở và |
|
|
việc hô hấp nhân tạo vẫn tiếp tục diễn ra sau hơn 1 tiếng đến UCLA vào lúc 1:13 |
|
|
chiều (20:13 UTC). Ông chính thức qua đời vào lúc 2:26 chiều giờ địa phương (21:25 |
|
|
UTC), chưa đầy 3 tuần trước khi đêm diễn This Is It đầu tiên bắt đầu tại Luân |
|
|
Đôn, với toàn bộ buổi hòa nhạc đều cháy vé.[SEP]Conrad Murray, người từng là bác |
|
|
sĩ riêng của Jackson, đã không tham gia vào việc chăm sóc sức khỏe của ông vào |
|
|
ngày ông qua đời do tai nạn xe hơi, điều đó hoàn toàn do một nhóm bác sĩ khác |
|
|
phụ trách. |
|
|
- Harvard được thành lập vào năm 1636 theo sau cuộc bỏ phiếu của Cơ quan Lập pháp |
|
|
vùng Thuộc địa Vịnh Massachusetts. Ban đầu được gọi là New College hay "trường |
|
|
đại học ở New Towne". Năm 1638, trường đại học này trở thành nơi có chiếc máy |
|
|
in đầu tiên được biết là có mặt ở Bắc Mỹ, do con tàu John of London chở từ Anh |
|
|
sang. Năm 1639, trường được đổi tên thành Harvard College, theo tên mục sư John |
|
|
Harvard (1607-1638), một cựu sinh viên của Viện Đại học Cambridge ở Anh, người |
|
|
đã hiến tặng tài sản cho trường. John Harvard khi mất đã để lại cho trường 779 |
|
|
bảng Anh (một nửa gia sản của ông) và chừng 400 cuốn sách.[SEP]John Harvard đã |
|
|
cống hiến cho Harvard College 779 bảng Anh và khoảng 400 cuốn sách. Chiếc máy |
|
|
in đầu tiên ở Bắc Mỹ không phải do ông mang từ Anh sang. |
|
|
- source_sentence: Vườn quốc gia này là một bộ phận của vùng sinh thái Trường Sơn. |
|
|
Cho đến nay, chủng loại thực vật lớn nhất ở đây là rừng thường xanh ẩm, rậm nhiệt |
|
|
đới trên đá vôi cao 800 m so với mực nước biển. 96,2% diện tích khu vườn quốc |
|
|
gia này được rừng bao phủ; 92,2% là rừng nguyên sinh; 74,7% (110.476 ha) khu vườn |
|
|
quốc gia này là rừng ẩm nhiệt đới thường xanh trên đá vôi có độ cao dưới 800 m; |
|
|
8,5% (12.600 ha) là rừng ẩm nhiệt đới thường xanh trên đá vôi có độ cao trên 800 |
|
|
m; 8,3% (12.220 ha) là rừng ẩm nhiệt đới trên đất núi đất có cao độ dưới 800 m, |
|
|
1,3% (1.925 ha) là bụi cây và cỏ và cây rải rác trên đá vôi; 2% (2.950 ha) là |
|
|
cỏ, bụi cây và cây rải rác trên núi đất; 180 ha là rừng tre nứa và mây song; thảm |
|
|
cây nông nghiệp 521 ha.[SEP]Vườn quốc gia Phong Nha - Kẻ Bàng là một phần của |
|
|
vùng sinh thái Đông Nam Á, nổi bật với rừng rậm khô nhiệt đới trên đá vôi cao |
|
|
1000 m so với mực nước biển. |
|
|
sentences: |
|
|
- Tại Hội nghị Yalta vào tháng 2 năm 1945, lãnh đạo Liên Xô Joseph Stalin kêu gọi |
|
|
lập "các vùng đệm" tại châu Á và châu Âu. Stalin tin rằng Liên Xô phải có tiếng |
|
|
nói quyết định tại Trung Quốc và để đổi lại Liên Xô sẽ tham chiến chống Nhật Bản |
|
|
"hai hoặc ba tuần sau khi Đức đầu hàng." Ngày 6 tháng 8 năm 1945, Liên Xô tuyên |
|
|
chiến với Đế quốc Nhật Bản và vào ngày 8 tháng 8 bắt đầu tấn công phía bắc Bán |
|
|
đảo Triều Tiên. Như đã thỏa thuận với Mỹ, Liên Xô dừng quân lại ở vĩ tuyến 38 |
|
|
độ bắc. Quân đội Hoa Kỳ ở phần phía nam của bán đảo đầu tháng 9 năm 1945. Nhiều |
|
|
người Triều Tiên đã tổ chức chính trị trước khi quân đội Hoa Kỳ đến.[SEP]Sai. |
|
|
Trước khi quân đội Hoa Kỳ đến, khu vực phía nam vĩ tuyến 38 độ bắc đã được Liên |
|
|
Xô chiếm đóng và họ đã thiết lập một chính quyền quân quản để chuẩn bị cho sự |
|
|
chuyển giao quyền lực. |
|
|
- Roma phát triển rất nhanh sau chiến tranh, là một trong các động lực chính đằng |
|
|
sau "kỳ tích kinh tế Ý" về tái thiết và hiện đại hoá hậu chiến trong thập niên |
|
|
1950 và đầu thập niên 1960. Trong giai đoạn này, những năm la dolce vita ("cuộc |
|
|
sống ngọt ngào"), Roma trở thành một thành phố thời thượng, với các phim cổ điển |
|
|
đại chúng như Ben Hur, Quo Vadis, Roman Holiday và La Dolce Vita được quay tại |
|
|
xưởng phim Cinecittà có tính biểu tượng của thành phố. Xu hướng tăng trưởng dân |
|
|
số tiếp tục cho đến giữa thập niên 1980, khi comune đạt trên 2,8 triệu cư dân. |
|
|
Sau đó, dân số bắt đầu giảm chậm do cư dân bắt đầu chuyển đến các vùng ngoại ô |
|
|
lân cận Roma.[SEP]Roma phát triển rất nhanh sau chiến tranh, đóng góp vào "kỳ |
|
|
tích kinh tế Ý". Thành phố này trở thành trung tâm sản xuất phim quốc tế, thu |
|
|
hút nhiều ngôi sao Hollywood đến làm việc tại Cinecittà, tăng cường du lịch và |
|
|
thương mại. |
|
|
- Sư đoàn biệt động Texas (Texas Ranger Division) của Cơ quan Công an Texas (Texas |
|
|
Department of Public Safety) là một thể chế thực thi luật pháp có thẩm quyền trên |
|
|
toàn bang. Trong nhiều năm qua, Biệt động Texas điều tra các vụ phạm tội khác |
|
|
nhau, từ giết người đến tham nhũng chính trị. Họ hành động trong vai trò của cảnh |
|
|
sát chống bạo động và trinh thám, bảo vệ thống đốc, truy nã đối tượng phạm tội, |
|
|
và hoạt động như một lực lượng bán quân sự của nước cộng hòa và bang. Biệt động |
|
|
Texas do Stephen F. Austin thành lập không chính thức vào năm 1823 và được thành |
|
|
lập chính thức vào năm 1835. Biệt động có vai trò trong một vài sự kiện quan trọng |
|
|
trong lịch sử Texas và một số vụ án hình sự được biết đến nhiều nhất trong lịch |
|
|
sử của vùng Cựu Tây Hoa Kỳ.[SEP]Biệt động Texas, được thành lập vào năm 2000, |
|
|
chủ yếu điều tra các vụ trộm cắp vặt và vi phạm giao thông nhẹ, tập trung vào |
|
|
các vấn đề nhỏ lẻ trong cộng đồng địa phương. |
|
|
- source_sentence: Trong năm 2005, mức thu nhập bình quân của người dân độ tuổi trên |
|
|
18 là 3.317 đô la cho phụ nữ thất nghiệp, có gia đình gốc Á cho tới 55.935 đô |
|
|
la cho đàn ông có việc làm toàn thời gian gốc Á. Theo cục thống kê dân số Mỹ, |
|
|
nam giới có mức thu nhập cao hơn phụ nữ trong khi người Mỹ gốc châu Á và Âu kiếm |
|
|
nhiều tiền hơn người Mỹ gốc Phi và Tây Ban Nha. Thu nhập bình quân chung của tất |
|
|
cả người dân trên 18 tuổi là 24.062 đô la (và 32.140 đô la cho độ tuổi từ 25 trở |
|
|
lên) trong năm 2005.[SEP]Không, thông tin không đúng. Người Mỹ gốc Á không có |
|
|
mức thu nhập thấp nhất. Vào năm 2005, thu nhập bình quân của đàn ông gốc Á có |
|
|
việc làm toàn thời gian là 55.935 đô la mỗi năm. |
|
|
sentences: |
|
|
- Từ cuối năm 1950, Quân đội Nhân dân Việt Nam bắt đầu thực hiện các trận chiến |
|
|
quy mô lớn theo kiểu kinh điển. Nhưng họ đã phải chịu thiệt hại lớn, các chiến |
|
|
dịch Trung du, Đường 18 và Hà Nam Ninh bị thất bại trước quân Pháp do tướng Jean |
|
|
de Lattre de Tassigny chỉ huy. Chiến dịch Hòa Bình mà de Lattre mở vào tháng 11 |
|
|
năm 1951 đã trở thành "cối xay thịt" đối với cả hai bên. Khi trận đánh kết thúc |
|
|
vào tháng 2 năm 1952, Quân đội Nhân dân Việt Nam chịu thương vong không nhỏ, nhưng |
|
|
họ đã học được cách đối phó với chiến thuật và vũ khí của Pháp, và họ đã thâm |
|
|
nhập được sâu hơn vào trong vòng cung phòng thủ của Pháp.[SEP]Quân đội Nhân dân |
|
|
Việt Nam hoàn toàn từ bỏ các trận chiến quy mô lớn và chỉ tập trung vào chiến |
|
|
thuật du kích, tránh đối đầu trực tiếp với quân Pháp, điều này giúp họ tránh được |
|
|
thương vong đáng kể. |
|
|
- Nhận ra rằng ông không thể nào giữ được Jerusalem cho dù ông có chiếm được nó, |
|
|
Richard ra lệnh rút lui. Có vài vụ xung đột nhỏ đã nổ ra giữa quân của Richard |
|
|
và Saladin khi hai người đàm phán để giải quyết cuộc xung đột, vì cả hai đều nhận |
|
|
ra rằng họ khó giữ vững được vị trí của mình nếu xung đột tiếp diễn. Richard biết |
|
|
rằng cả Philip và chính em trai ông John đều đang âm mưu chống lại mình. Tuy nhiên, |
|
|
Saladin buộc Richard phải san bằng các công sự mà ông đã xây dựng tại Ascalon |
|
|
và vài việc khác. Richard thực hiện một nỗ lực cuối cùng để giành thế thượng phong |
|
|
trên bàn đàm phán bằng việc xâm lược Ai Cập – nguồn tiếp vận chính của Saladin |
|
|
– nhưng thất bại. Cuối cùng, thời gian không còn nữa. Việc trở về không thể trì |
|
|
hoãn được nữa vì cả Philip và John đều đang lợi dụng sự vắng mặt của ông. Ông |
|
|
và Saladin đi đến một thỏa thuận vào ngày 2 tháng 9, 1192; bao gồm việc phá hủy |
|
|
các công sự của Ascalon, cùng với việc cho phép người hành hương và thương nhân |
|
|
Cơ đốc đến Jerusalem. Nó cũng bao gồm một hòa ước ba năm.[SEP]Richard cho xâm |
|
|
lược Ai Cập với mục đích chính là thiết lập một liên minh vững chắc với Saladin, |
|
|
nhằm củng cố mối quan hệ hòa bình lâu dài giữa hai bên và đảm bảo sự ổn định trong |
|
|
khu vực. |
|
|
- 'Vào đầu công nguyên, xuất hiện hai vương quốc của người Malayo - Polynesia lớn |
|
|
trên bán đảo Ðông Dương: Phù Nam và Chiêm Thành. Lãnh thổ Phù Nam rộng từ Vịnh |
|
|
Thái Lan đến Biển Hồ nhưng ảnh hưởng tỏa lên Thượng Lào và Bắc Miến Ðiện. Chiêm |
|
|
Thành gồm nhiều vương quốc nhỏ sinh hoạt độc lập với nhau dọc các đồng bằng eo |
|
|
hẹp miền Trung đến chân dãy Trường Sơn về phía Tây: Lâm Ấp hay Indrapura (Bình |
|
|
Trị Thiên), Amaravati (Quảng Nam), Vijaya (Bình Định), Aryaru (Phú Yên), Kauthara |
|
|
(Khánh Hòa) và Panduranga (Phan Rang). Sinh hoạt chính của người Malayo - Polynesia |
|
|
là trồng lúa nước và buôn bán. Ðể tìm thêm nguồn hàng quí hiếm trao đổi với các |
|
|
thuyền buôn, người Malayo - Polynesia mở rộng tầm kiểm soát lên các vùng rừng |
|
|
núi đồng thời khuất phục luôn các nhóm dân cư bản địa đã có mặt từ trước, điển |
|
|
hình điển hình nhóm Bih ven krong A-na mà ngày nay được gọi là Ê Đê Bih với kỹ |
|
|
năng dệt, trang sức, làm gốm, trồng lúa nước. Nhóm Bih là nhóm Malayo - Polynesia |
|
|
định cư và chạy nạn sớm vào sâu nhất trong lục địa, họ đem theo kỹ thuật trồng |
|
|
lúa nước ven sông,dệt vải thô, trang sức hạt, và kỹ nghệ làm gốm thô. Theo chiều |
|
|
lịch sử, danh tự Ê Đê có nguồn gốc từ cách đọc âm của người Champa, bia ký Champa |
|
|
cổ nhất tại tháp Po Nagar vào khoảng thế kỷ VIII đã ghi chép về tộc danh Rang |
|
|
Đê vùng sông Nha Trang, sông Jing, sông Hing. Những bia ký sớm nhất của Champa |
|
|
thế kỷ VIII - đã có nhắc đến nhóm Rangde ven sông Ea trang (Nha Trang). Trong |
|
|
Bia Po Nagar được dựng năm 965 tại tháp Po Nagar (Nha Trang, Khánh Hòa): Nội dung |
|
|
bia như sau:Vào khoảng năm 703 - 706 lịch saka (781 - 784 Công lịch), vua Satyavarman |
|
|
cho dựng một linga (linh vật) thờ thần Siva và lập cháu mình lên làm vua Vikrantavarman(vì |
|
|
theo chế độ mẫu hệ nên cậu truyền ngôi cho cháu theo dòng mẹ)... và đức Vua có |
|
|
thu phục được người Randaya (Rang Đê).Rất có thể từ Rang Đê sau này bị biến âm |
|
|
thành Ra đê, Rađêy hay Ê đê. Ngoài ra, người Ê đê còn tự nhận là nhóm tộc Đêgar, |
|
|
Êđê Êga Anak Đêgar - người trên Cao Nguyên. Đêgar là từ tiếng Ấn Độ srakrit Deccan, |
|
|
và bản thân nó lại có nguồn gốc từ tiếng Phạn दक्षिण, Đêkṣarṇa, nghĩa là "cao |
|
|
nguyên phía nam".[SEP]Người Malayo - Polynesia đầu công nguyên đã phát triển mạnh |
|
|
mẽ ngành công nghiệp ô tô và hàng không, đây là các ngành kinh tế chủ yếu của |
|
|
họ, đóng góp lớn vào sự thịnh vượng của vương quốc.' |
|
|
pipeline_tag: sentence-similarity |
|
|
library_name: sentence-transformers |
|
|
--- |
|
|
|
|
|
# SentenceTransformer based on FacebookAI/xlm-roberta-large |
|
|
|
|
|
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [FacebookAI/xlm-roberta-large](https://huggingface.co/FacebookAI/xlm-roberta-large). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. |
|
|
|
|
|
## Model Details |
|
|
|
|
|
### Model Description |
|
|
- **Model Type:** Sentence Transformer |
|
|
- **Base model:** [FacebookAI/xlm-roberta-large](https://huggingface.co/FacebookAI/xlm-roberta-large) <!-- at revision c23d21b0620b635a76227c604d44e43a9f0ee389 --> |
|
|
- **Maximum Sequence Length:** 512 tokens |
|
|
- **Output Dimensionality:** 1024 dimensions |
|
|
- **Similarity Function:** Cosine Similarity |
|
|
<!-- - **Training Dataset:** Unknown --> |
|
|
<!-- - **Language:** Unknown --> |
|
|
<!-- - **License:** Unknown --> |
|
|
|
|
|
### Model Sources |
|
|
|
|
|
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net) |
|
|
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) |
|
|
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) |
|
|
|
|
|
### Full Model Architecture |
|
|
|
|
|
``` |
|
|
SentenceTransformer( |
|
|
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'}) |
|
|
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) |
|
|
) |
|
|
``` |
|
|
|
|
|
## Usage |
|
|
|
|
|
### Direct Usage (Sentence Transformers) |
|
|
|
|
|
First install the Sentence Transformers library: |
|
|
|
|
|
```bash |
|
|
pip install -U sentence-transformers |
|
|
``` |
|
|
|
|
|
Then you can load this model and run inference. |
|
|
```python |
|
|
from sentence_transformers import SentenceTransformer |
|
|
|
|
|
# Download from the 🤗 Hub |
|
|
model = SentenceTransformer("phuocsang/contrastive-encoder") |
|
|
# Run inference |
|
|
sentences = [ |
|
|
'Trong năm 2005, mức thu nhập bình quân của người dân độ tuổi trên 18 là 3.317 đô la cho phụ nữ thất nghiệp, có gia đình gốc Á cho tới 55.935 đô la cho đàn ông có việc làm toàn thời gian gốc Á. Theo cục thống kê dân số Mỹ, nam giới có mức thu nhập cao hơn phụ nữ trong khi người Mỹ gốc châu Á và Âu kiếm nhiều tiền hơn người Mỹ gốc Phi và Tây Ban Nha. Thu nhập bình quân chung của tất cả người dân trên 18 tuổi là 24.062 đô la (và 32.140 đô la cho độ tuổi từ 25 trở lên) trong năm 2005.[SEP]Không, thông tin không đúng. Người Mỹ gốc Á không có mức thu nhập thấp nhất. Vào năm 2005, thu nhập bình quân của đàn ông gốc Á có việc làm toàn thời gian là 55.935 đô la mỗi năm.', |
|
|
'Vào đầu công nguyên, xuất hiện hai vương quốc của người Malayo - Polynesia lớn trên bán đảo Ðông Dương: Phù Nam và Chiêm Thành. Lãnh thổ Phù Nam rộng từ Vịnh Thái Lan đến Biển Hồ nhưng ảnh hưởng tỏa lên Thượng Lào và Bắc Miến Ðiện. Chiêm Thành gồm nhiều vương quốc nhỏ sinh hoạt độc lập với nhau dọc các đồng bằng eo hẹp miền Trung đến chân dãy Trường Sơn về phía Tây: Lâm Ấp hay Indrapura (Bình Trị Thiên), Amaravati (Quảng Nam), Vijaya (Bình Định), Aryaru (Phú Yên), Kauthara (Khánh Hòa) và Panduranga (Phan Rang). Sinh hoạt chính của người Malayo - Polynesia là trồng lúa nước và buôn bán. Ðể tìm thêm nguồn hàng quí hiếm trao đổi với các thuyền buôn, người Malayo - Polynesia mở rộng tầm kiểm soát lên các vùng rừng núi đồng thời khuất phục luôn các nhóm dân cư bản địa đã có mặt từ trước, điển hình điển hình nhóm Bih ven krong A-na mà ngày nay được gọi là Ê Đê Bih với kỹ năng dệt, trang sức, làm gốm, trồng lúa nước. Nhóm Bih là nhóm Malayo - Polynesia định cư và chạy nạn sớm vào sâu nhất trong lục địa, họ đem theo kỹ thuật trồng lúa nước ven sông,dệt vải thô, trang sức hạt, và kỹ nghệ làm gốm thô. Theo chiều lịch sử, danh tự Ê Đê có nguồn gốc từ cách đọc âm của người Champa, bia ký Champa cổ nhất tại tháp Po Nagar vào khoảng thế kỷ VIII đã ghi chép về tộc danh Rang Đê vùng sông Nha Trang, sông Jing, sông Hing. Những bia ký sớm nhất của Champa thế kỷ VIII - đã có nhắc đến nhóm Rangde ven sông Ea trang (Nha Trang). Trong Bia Po Nagar được dựng năm 965 tại tháp Po Nagar (Nha Trang, Khánh Hòa): Nội dung bia như sau:Vào khoảng năm 703 - 706 lịch saka (781 - 784 Công lịch), vua Satyavarman cho dựng một linga (linh vật) thờ thần Siva và lập cháu mình lên làm vua Vikrantavarman(vì theo chế độ mẫu hệ nên cậu truyền ngôi cho cháu theo dòng mẹ)... và đức Vua có thu phục được người Randaya (Rang Đê).Rất có thể từ Rang Đê sau này bị biến âm thành Ra đê, Rađêy hay Ê đê. Ngoài ra, người Ê đê còn tự nhận là nhóm tộc Đêgar, Êđê Êga Anak Đêgar - người trên Cao Nguyên. Đêgar là từ tiếng Ấn Độ srakrit Deccan, và bản thân nó lại có nguồn gốc từ tiếng Phạn दक्षिण, Đêkṣarṇa, nghĩa là "cao nguyên phía nam".[SEP]Người Malayo - Polynesia đầu công nguyên đã phát triển mạnh mẽ ngành công nghiệp ô tô và hàng không, đây là các ngành kinh tế chủ yếu của họ, đóng góp lớn vào sự thịnh vượng của vương quốc.', |
|
|
'Nhận ra rằng ông không thể nào giữ được Jerusalem cho dù ông có chiếm được nó, Richard ra lệnh rút lui. Có vài vụ xung đột nhỏ đã nổ ra giữa quân của Richard và Saladin khi hai người đàm phán để giải quyết cuộc xung đột, vì cả hai đều nhận ra rằng họ khó giữ vững được vị trí của mình nếu xung đột tiếp diễn. Richard biết rằng cả Philip và chính em trai ông John đều đang âm mưu chống lại mình. Tuy nhiên, Saladin buộc Richard phải san bằng các công sự mà ông đã xây dựng tại Ascalon và vài việc khác. Richard thực hiện một nỗ lực cuối cùng để giành thế thượng phong trên bàn đàm phán bằng việc xâm lược Ai Cập – nguồn tiếp vận chính của Saladin – nhưng thất bại. Cuối cùng, thời gian không còn nữa. Việc trở về không thể trì hoãn được nữa vì cả Philip và John đều đang lợi dụng sự vắng mặt của ông. Ông và Saladin đi đến một thỏa thuận vào ngày 2 tháng 9, 1192; bao gồm việc phá hủy các công sự của Ascalon, cùng với việc cho phép người hành hương và thương nhân Cơ đốc đến Jerusalem. Nó cũng bao gồm một hòa ước ba năm.[SEP]Richard cho xâm lược Ai Cập với mục đích chính là thiết lập một liên minh vững chắc với Saladin, nhằm củng cố mối quan hệ hòa bình lâu dài giữa hai bên và đảm bảo sự ổn định trong khu vực.', |
|
|
] |
|
|
embeddings = model.encode(sentences) |
|
|
print(embeddings.shape) |
|
|
# [3, 1024] |
|
|
|
|
|
# Get the similarity scores for the embeddings |
|
|
similarities = model.similarity(embeddings, embeddings) |
|
|
print(similarities) |
|
|
# tensor([[1.0000, 1.0000, 1.0000], |
|
|
# [1.0000, 1.0000, 1.0000], |
|
|
# [1.0000, 1.0000, 1.0000]]) |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
### Direct Usage (Transformers) |
|
|
|
|
|
<details><summary>Click to see the direct usage in Transformers</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Downstream Usage (Sentence Transformers) |
|
|
|
|
|
You can finetune this model on your own dataset. |
|
|
|
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Out-of-Scope Use |
|
|
|
|
|
*List how the model may foreseeably be misused and address what users ought not to do with the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Bias, Risks and Limitations |
|
|
|
|
|
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Recommendations |
|
|
|
|
|
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.* |
|
|
--> |
|
|
|
|
|
## Training Details |
|
|
|
|
|
### Training Dataset |
|
|
|
|
|
#### Unnamed Dataset |
|
|
|
|
|
* Size: 5,600 training samples |
|
|
* Columns: <code>sentence_0</code> and <code>label</code> |
|
|
* Approximate statistics based on the first 1000 samples: |
|
|
| | sentence_0 | label | |
|
|
|:--------|:--------------------------------------------------------------------------------------|:-------------------------------------------------------------------| |
|
|
| type | string | int | |
|
|
| details | <ul><li>min: 145 tokens</li><li>mean: 267.06 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>0: ~33.00%</li><li>1: ~35.10%</li><li>2: ~31.90%</li></ul> | |
|
|
* Samples: |
|
|
| sentence_0 | label | |
|
|
|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------| |
|
|
| <code>Chính phủ liên bang thiết lập mọi nỗ lực mới trong nước để ngăn chặn các vụ tấn công tương lai. Đạo luật Yêu nước Mỹ gây nhiều tranh cãi tạo điều kiện gia tăng quyền hạn của chính phủ để theo dõi thông tin liên lạc và tháo vỡ các hạn chế pháp lý về chia sẻ thông tin giữa các cơ quan tình báo và thi hành luật pháp liên bang. Một cơ quan cấp nội các, được gọi là bộ nội an được thành lập để lãnh đạo và điều hợp các hoạt động chống khủng bố của chính phủ liên bang. Một trong số các nỗ lực chống khủng bố này, đặc biệt là việc chính phủ liên quan cầm giữ các phạm nhân tại nhà tù tại vịnh Guantanamo, dẫn đến các cáo buộc rằng chính phủ liên bang vị phạm nhân quyền.[SEP]Không, việc giam giữ các phạm nhân tại vịnh Guantanamo dẫn đến cáo buộc vi phạm nhân quyền, không phải quyền tự do ngôn luận được Hiến pháp Hoa Kỳ bảo đảm.</code> | <code>0</code> | |
|
|
| <code>Việc hợp nhất này đã tước đoạt chính sách đối ngoại độc lập của Bồ Đào Nha và dẫn đến việc họ tham gia Chiến tranh Tám mươi Năm giữa Tây Ban Nha và Hà Lan. Cuộc chiến này làm tổn hại quan hệ giữa Bồ Đào Nha và đồng minh lâu năm nhất của họ là Anh, và để mất cảng mậu dịch chiến lược Hormuz tại vùng vịnh Ba Tư. Từ năm 1595 đến năm 1663, Chiến tranh Hà Lan-Bồ Đào Nha chủ yếu liên quan đến việc các công ty Hà Lan xâm phạm nhiều thuộc địa và lợi ích thương nghiệp của Bồ Đào Nha tại Brasil, châu Phi, Ấn Độ và Viễn Đông, khiến Bồ Đào Nha bị mất thế độc quyền mậu dịch hàng hải trên Ấn Độ Dương.[SEP]Các công ty Hà Lan đã xâm phạm nhiều thuộc địa và lợi ích thương nghiệp của Bồ Đào Nha tại Brasil, châu Phi, Ấn Độ và Viễn Đông trong khoảng thời gian từ năm 1595 đến năm 1663.</code> | <code>0</code> | |
|
|
| <code>Bắc Ireland có cơ quan hành pháp và lập pháp địa phương, thi hành quyền lực được Anh phân quyền. Đứng đầu cơ quan hành pháp là bộ trưởng thứ nhất và thứ trưởng thứ nhất, còn các bộ trưởng được phân bổ theo tỷ lệ đại biểu của mỗi đảng trong nghị hội. Thủ đô Bắc Ireland là Belfast. Quyền lực chính trị tối hậu thuộc về Chính phủ Anh, Chính phủ Anh từng có các giai đoạn cai trị trực tiếp Bắc Ireland. Bắc Ireland được phân 18 ghế trong số 650 ghế của Hạ nghị viện Anh. Quốc vụ khanh về Bắc Ireland là một chức vụ cấp nội các trong chính phủ của Anh. Bắc Ireland tạo thành một trong ba khu vực phạm vi quyền hạn tư pháp riêng biệt của Anh, song Toà án Tối cao Anh là toà án tối cao.[SEP]Hạ nghị viện Anh có tổng cộng 700 ghế đại biểu, trong đó Bắc Ireland chiếm 18 ghế. Điều này cho phép họ có tiếng nói mạnh mẽ hơn trong các quyết định chính trị của Vương quốc Anh.</code> | <code>1</code> | |
|
|
* Loss: [<code>BatchHardTripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#batchhardtripletloss) |
|
|
|
|
|
### Training Hyperparameters |
|
|
#### Non-Default Hyperparameters |
|
|
|
|
|
- `per_device_train_batch_size`: 32 |
|
|
- `per_device_eval_batch_size`: 32 |
|
|
- `num_train_epochs`: 2 |
|
|
- `multi_dataset_batch_sampler`: round_robin |
|
|
|
|
|
#### All Hyperparameters |
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
- `overwrite_output_dir`: False |
|
|
- `do_predict`: False |
|
|
- `eval_strategy`: no |
|
|
- `prediction_loss_only`: True |
|
|
- `per_device_train_batch_size`: 32 |
|
|
- `per_device_eval_batch_size`: 32 |
|
|
- `per_gpu_train_batch_size`: None |
|
|
- `per_gpu_eval_batch_size`: None |
|
|
- `gradient_accumulation_steps`: 1 |
|
|
- `eval_accumulation_steps`: None |
|
|
- `torch_empty_cache_steps`: None |
|
|
- `learning_rate`: 5e-05 |
|
|
- `weight_decay`: 0.0 |
|
|
- `adam_beta1`: 0.9 |
|
|
- `adam_beta2`: 0.999 |
|
|
- `adam_epsilon`: 1e-08 |
|
|
- `max_grad_norm`: 1 |
|
|
- `num_train_epochs`: 2 |
|
|
- `max_steps`: -1 |
|
|
- `lr_scheduler_type`: linear |
|
|
- `lr_scheduler_kwargs`: {} |
|
|
- `warmup_ratio`: 0.0 |
|
|
- `warmup_steps`: 0 |
|
|
- `log_level`: passive |
|
|
- `log_level_replica`: warning |
|
|
- `log_on_each_node`: True |
|
|
- `logging_nan_inf_filter`: True |
|
|
- `save_safetensors`: True |
|
|
- `save_on_each_node`: False |
|
|
- `save_only_model`: False |
|
|
- `restore_callback_states_from_checkpoint`: False |
|
|
- `no_cuda`: False |
|
|
- `use_cpu`: False |
|
|
- `use_mps_device`: False |
|
|
- `seed`: 42 |
|
|
- `data_seed`: None |
|
|
- `jit_mode_eval`: False |
|
|
- `use_ipex`: False |
|
|
- `bf16`: False |
|
|
- `fp16`: False |
|
|
- `fp16_opt_level`: O1 |
|
|
- `half_precision_backend`: auto |
|
|
- `bf16_full_eval`: False |
|
|
- `fp16_full_eval`: False |
|
|
- `tf32`: None |
|
|
- `local_rank`: 0 |
|
|
- `ddp_backend`: None |
|
|
- `tpu_num_cores`: None |
|
|
- `tpu_metrics_debug`: False |
|
|
- `debug`: [] |
|
|
- `dataloader_drop_last`: False |
|
|
- `dataloader_num_workers`: 0 |
|
|
- `dataloader_prefetch_factor`: None |
|
|
- `past_index`: -1 |
|
|
- `disable_tqdm`: False |
|
|
- `remove_unused_columns`: True |
|
|
- `label_names`: None |
|
|
- `load_best_model_at_end`: False |
|
|
- `ignore_data_skip`: False |
|
|
- `fsdp`: [] |
|
|
- `fsdp_min_num_params`: 0 |
|
|
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} |
|
|
- `fsdp_transformer_layer_cls_to_wrap`: None |
|
|
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} |
|
|
- `parallelism_config`: None |
|
|
- `deepspeed`: None |
|
|
- `label_smoothing_factor`: 0.0 |
|
|
- `optim`: adamw_torch_fused |
|
|
- `optim_args`: None |
|
|
- `adafactor`: False |
|
|
- `group_by_length`: False |
|
|
- `length_column_name`: length |
|
|
- `ddp_find_unused_parameters`: None |
|
|
- `ddp_bucket_cap_mb`: None |
|
|
- `ddp_broadcast_buffers`: False |
|
|
- `dataloader_pin_memory`: True |
|
|
- `dataloader_persistent_workers`: False |
|
|
- `skip_memory_metrics`: True |
|
|
- `use_legacy_prediction_loop`: False |
|
|
- `push_to_hub`: False |
|
|
- `resume_from_checkpoint`: None |
|
|
- `hub_model_id`: None |
|
|
- `hub_strategy`: every_save |
|
|
- `hub_private_repo`: None |
|
|
- `hub_always_push`: False |
|
|
- `hub_revision`: None |
|
|
- `gradient_checkpointing`: False |
|
|
- `gradient_checkpointing_kwargs`: None |
|
|
- `include_inputs_for_metrics`: False |
|
|
- `include_for_metrics`: [] |
|
|
- `eval_do_concat_batches`: True |
|
|
- `fp16_backend`: auto |
|
|
- `push_to_hub_model_id`: None |
|
|
- `push_to_hub_organization`: None |
|
|
- `mp_parameters`: |
|
|
- `auto_find_batch_size`: False |
|
|
- `full_determinism`: False |
|
|
- `torchdynamo`: None |
|
|
- `ray_scope`: last |
|
|
- `ddp_timeout`: 1800 |
|
|
- `torch_compile`: False |
|
|
- `torch_compile_backend`: None |
|
|
- `torch_compile_mode`: None |
|
|
- `include_tokens_per_second`: False |
|
|
- `include_num_input_tokens_seen`: False |
|
|
- `neftune_noise_alpha`: None |
|
|
- `optim_target_modules`: None |
|
|
- `batch_eval_metrics`: False |
|
|
- `eval_on_start`: False |
|
|
- `use_liger_kernel`: False |
|
|
- `liger_kernel_config`: None |
|
|
- `eval_use_gather_object`: False |
|
|
- `average_tokens_across_devices`: False |
|
|
- `prompts`: None |
|
|
- `batch_sampler`: batch_sampler |
|
|
- `multi_dataset_batch_sampler`: round_robin |
|
|
- `router_mapping`: {} |
|
|
- `learning_rate_mapping`: {} |
|
|
|
|
|
</details> |
|
|
|
|
|
### Framework Versions |
|
|
- Python: 3.12.6 |
|
|
- Sentence Transformers: 5.1.1 |
|
|
- Transformers: 4.56.0 |
|
|
- PyTorch: 2.8.0+cu129 |
|
|
- Accelerate: 1.10.1 |
|
|
- Datasets: 4.1.1 |
|
|
- Tokenizers: 0.22.0 |
|
|
|
|
|
## Citation |
|
|
|
|
|
### BibTeX |
|
|
|
|
|
#### Sentence Transformers |
|
|
```bibtex |
|
|
@inproceedings{reimers-2019-sentence-bert, |
|
|
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", |
|
|
author = "Reimers, Nils and Gurevych, Iryna", |
|
|
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", |
|
|
month = "11", |
|
|
year = "2019", |
|
|
publisher = "Association for Computational Linguistics", |
|
|
url = "https://arxiv.org/abs/1908.10084", |
|
|
} |
|
|
``` |
|
|
|
|
|
#### BatchHardTripletLoss |
|
|
```bibtex |
|
|
@misc{hermans2017defense, |
|
|
title={In Defense of the Triplet Loss for Person Re-Identification}, |
|
|
author={Alexander Hermans and Lucas Beyer and Bastian Leibe}, |
|
|
year={2017}, |
|
|
eprint={1703.07737}, |
|
|
archivePrefix={arXiv}, |
|
|
primaryClass={cs.CV} |
|
|
} |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
## Glossary |
|
|
|
|
|
*Clearly define terms in order to be accessible across audiences.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Authors |
|
|
|
|
|
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Contact |
|
|
|
|
|
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.* |
|
|
--> |