Someman (Samman)

upvoted a paper 6 months ago

KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30 • 108

upvoted 3 papers 7 months ago

upvoted 2 papers 8 months ago

The Unreasonable Ineffectiveness of the Deeper Layers

Paper • 2403.17887 • Published Mar 26 • 78

LLM Agent Operating System

Paper • 2403.16971 • Published Mar 25 • 65

upvoted a collection 8 months ago

Similarity search

Collection

2 items • Updated Jun 4 • 1

upvoted a paper 8 months ago

PERL: Parameter Efficient Reinforcement Learning from Human Feedback

Paper • 2403.10704 • Published Mar 15 • 57

upvoted a collection 8 months ago

Navarasa 2.0 Models

Collection

Collection of models Navarasa 2.0 Models finetuned with Gemma on 15 Indian languages • 5 items • Updated Mar 18 • 15

upvoted 2 papers 8 months ago

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96

GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection

Paper • 2403.03507 • Published Mar 6 • 182

upvoted 4 papers 9 months ago

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 138

PALO: A Polyglot Large Multimodal Model for 5B People

Paper • 2402.14818 • Published Feb 22 • 23

Multilingual E5 Text Embeddings: A Technical Report

Paper • 2402.05672 • Published Feb 8 • 20

More Agents Is All You Need

Paper • 2402.05120 • Published Feb 3 • 51

upvoted 2 papers 10 months ago

Tuning Language Models by Proxy

Paper • 2401.08565 • Published Jan 16 • 20

Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM

Paper • 2401.02994 • Published Jan 4 • 47

Samman

AI & ML interests

Organizations

Someman's activity