OpenAssistant
/

reward-model-electra-large-discriminator

Text Classification

Model card Files Files and versions

Update README.md

#2

by linoUCV - opened Jul 5, 2023

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

Files changed (1) hide show

README.md +17 -0

README.md CHANGED Viewed

@@ -4,14 +4,31 @@ datasets:
 - openai/webgpt_comparisons
 - openai/summarize_from_feedback
 - Dahoas/instruct-synthetic-prompt-responses
 language:
 - en
 metrics:
 - accuracy
 tags:
 - reward-model
 - reward_model
 - RLHF
 ---
 # Reward model trained from human feedback

 - openai/webgpt_comparisons
 - openai/summarize_from_feedback
 - Dahoas/instruct-synthetic-prompt-responses
+- Open-Orca/OpenOrca
+- OpenAssistant/oasst1
+- openchat/openchat_sharegpt4_dataset
+- fka/awesome-chatgpt-prompts
 language:
 - en
+- es
+- kr
+- lo
+- ko
+- ja
 metrics:
 - accuracy
+- character
 tags:
 - reward-model
 - reward_model
 - RLHF
+- art
+- code
+- finance
+- chemistry
+- biology
+library_name: diffusers
+pipeline_tag: token-classification
 ---
 # Reward model trained from human feedback