Jie Liu's picture

3 5 5

Jie Liu

jieliu

·

yifan123

AI & ML interests

Reinforcement Learning, Large Language Model

Organizations

Papers 5

arxiv:2407.16154

arxiv:2406.11817

arxiv:2402.12343

arxiv:2310.03708

models 7

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-chat-noval-beta0.5-bs24

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-chat-math-noval-beta0.5-bs24

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-longqa-beta0.5-bs24-seq2048

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-longqa-beta0.5-bs24

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-longqa-beta0.5

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-beta0.5

jieliu/Storm-7B

Text Generation • Updated Jun 18 • 19 • 40

datasets

None public yet