我想训练一个特定领域的大模型,在rlhf阶段的数据需要自己重新构建吗
rlhf 的数据是告诉模型多个正确的,有差异的答案,你如果有类似数据是不需要重构的和领域没有太多关系
· Sign up or log in to comment