Agent RL数据集和环境
yuchuqing
rain2sun
AI & ML interests
None yet
Recent Activity
liked a model 11 days ago
deepseek-ai/DeepSeek-V4-Flash liked a model 11 days ago
deepseek-ai/DeepSeek-V4-Pro liked a model 14 days ago
moonshotai/Kimi-K2.6Organizations
None yet
Benchmark
评估集
RL-Datasets
Math-Code-Reason
可规则验证数据集,要求带标准答案
Open-LLM
全链路开源模型:至少包括模型(可能包括checkpoint)和数据
Pretrain-Datasets
预训练使用的超大规模开源数据集
Agent RL
Agent RL数据集和环境
mBase LLM
中小模型,作为优化任务后训练起点
Benchmark
评估集
NLP
NLP is more than LLM
RL-Datasets
Distilled
蒸馏数据集
Math-Code-Reason
可规则验证数据集,要求带标准答案
Code-IFT-Datasets
代码指令数据集
Open-LLM
全链路开源模型:至少包括模型(可能包括checkpoint)和数据
High-Quality-Datasets
高质量数据集,包含高密度的知识
Pretrain-Datasets
预训练使用的超大规模开源数据集
IFT-Datasets
用于LLM微调的数据集