Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2308.07633

Model Compression & Inference Survey Papers

A Survey on Model Compression for Large Language Models

Paper • 2308.07633 • Published Aug 15, 2023 • 3
A Survey on Efficient Inference for Large Language Models

Paper • 2404.14294 • Published Apr 22 • 2
Model Compression and Efficient Inference for Large Language Models: A Survey

Paper • 2402.09748 • Published Feb 15 • 1

Towards an Understanding of Large Language Models in Software Engineering Tasks

Paper • 2308.11396 • Published Aug 22, 2023 • 1
Several categories of Large Language Models (LLMs): A Short Survey

Paper • 2307.10188 • Published Jul 5, 2023 • 1
Large Language Models for Generative Recommendation: A Survey and Visionary Discussions

Paper • 2309.01157 • Published Sep 3, 2023 • 1
A Survey on Large Language Models for Recommendation

Paper • 2305.19860 • Published May 31, 2023 • 1

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Paper • 2310.17157 • Published Oct 26, 2023 • 11
Dynamic Context Pruning for Efficient and Interpretable Autoregressive Transformers

Paper • 2305.15805 • Published May 25, 2023 • 1
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt

Paper • 2305.11186 • Published May 17, 2023 • 1
Composable Sparse Fine-Tuning for Cross-Lingual Transfer

Paper • 2110.07560 • Published Oct 14, 2021 • 1

LoftQ: LoRA-Fine-Tuning-Aware Quantization for Large Language Models

Paper • 2310.08659 • Published Oct 12, 2023 • 22
QA-LoRA: Quantization-Aware Low-Rank Adaptation of Large Language Models

Paper • 2309.14717 • Published Sep 26, 2023 • 44
Norm Tweaking: High-performance Low-bit Quantization of Large Language Models

Paper • 2309.02784 • Published Sep 6, 2023 • 1
ModuLoRA: Finetuning 3-Bit LLMs on Consumer GPUs by Integrating with Modular Quantizers

Paper • 2309.16119 • Published Sep 28, 2023 • 1

Knowledge distillation

Democratizing Reasoning Ability: Tailored Learning from Large Language Model

Paper • 2310.13332 • Published Oct 20, 2023 • 14
Teaching Language Models to Self-Improve through Interactive Demonstrations

Paper • 2310.13522 • Published Oct 20, 2023 • 11
Self-Convinced Prompting: Few-Shot Question Answering with Repeated Introspection

Paper • 2310.05035 • Published Oct 8, 2023 • 1
Tuna: Instruction Tuning using Feedback from Large Language Models

Paper • 2310.13385 • Published Oct 20, 2023 • 10

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs