melisa (Melisa Russak)

upvoted 2 papers 10 days ago

Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse

Paper • 2410.21333 • Published 13 days ago • 9

Bielik 7B v0.1: A Polish Language Model -- Development, Insights, and Evaluation

Paper • 2410.18565 • Published 17 days ago • 42

upvoted a paper 23 days ago

Movie Gen: A Cast of Media Foundation Models

Paper • 2410.13720 • Published 23 days ago • 86

upvoted a paper about 1 month ago

Law of the Weakest Link: Cross Capabilities of Large Language Models

Paper • 2409.19951 • Published Sep 30 • 53

upvoted 5 papers 2 months ago

upvoted an article 3 months ago

Article

Using Writer Framework with Hugging Face Spaces

By

•

Aug 20

• 30

upvoted 2 papers 5 months ago

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Paper • 2406.14491 • Published Jun 20 • 85

Block Transformer: Global-to-Local Language Modeling for Fast Inference

Paper • 2406.02657 • Published Jun 4 • 36

upvoted 3 papers 6 months ago

Zamba: A Compact 7B SSM Hybrid Model

Paper • 2405.16712 • Published May 26 • 21

An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 85

Evolutionary Optimization of Model Merging Recipes

Paper • 2403.13187 • Published Mar 19 • 50

upvoted a collection 6 months ago

Phi-3

Collection

Phi-3 family of small language and multi-modal models. Language models are available in short- and long-context lengths. • 27 items • Updated 10 days ago • 489

upvoted a paper 6 months ago

LoRA Learns Less and Forgets Less

Paper • 2405.09673 • Published May 15 • 87

upvoted 2 papers 7 months ago

OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments

Paper • 2404.07972 • Published Apr 11 • 44

RecurrentGemma: Moving Past Transformers for Efficient Open Language Models

Paper • 2404.07839 • Published Apr 11 • 41

upvoted a paper 9 months ago

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

Paper • 2402.17553 • Published Feb 27 • 21

Melisa Russak

AI & ML interests

Organizations

melisa's activity