ondevicellm
/

tinyllama_moe_sft_ultrachat_v2_ep3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_sft_ultrachat_v2_ep3

1 contributor

History: 2 commits

hushell's picture

Training in progress, step 100

622ca02 verified 10 months ago

runs
Training in progress, step 100 10 months ago
.gitattributes

1.52 kB

initial commit 10 months ago
config.json

838 Bytes

Training in progress, step 100 10 months ago
special_tokens_map.json

550 Bytes

Training in progress, step 100 10 months ago
tokenizer.json

1.84 MB

Training in progress, step 100 10 months ago
tokenizer.model

500 kB
LFS

Training in progress, step 100 10 months ago
tokenizer_config.json

1.42 kB

Training in progress, step 100 10 months ago
training_args.bin
Detected Pickle imports (11)
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.utils.dataclasses.DistributedType",
- "configs.SFTConfig",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "torch.bfloat16"
How to fix it?
5.31 kB
LFS

Training in progress, step 100 10 months ago