Paper - a Chair-D Collection

Chair-D 's Collections

Paper

RL

Model Architecture

Paper

updated Jun 5

OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement

Paper • 2402.14658 • Published Feb 22 • 82
KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30 • 108
Understanding the performance gap between online and offline alignment algorithms

Paper • 2405.08448 • Published May 14 • 14
NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models

Paper • 2405.17428 • Published May 27 • 17
2BP: 2-Stage Backpropagation

Paper • 2405.18047 • Published May 28 • 23
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections

Paper • 2405.17991 • Published May 28 • 11
Show, Don't Tell: Aligning Language Models with Demonstrated Feedback

Paper • 2406.00888 • Published Jun 2 • 30
Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning

Paper • 2406.00392 • Published Jun 1 • 12