OrionStarAI
/

Orion-14B-Chat

Text Generation

Inference Endpoints

Model card Files Files and versions Community

DachengZhang commited on Apr 11

Commit

7aa75f1

•

1 Parent(s): b8385c9

Update modeling_orion.py

Files changed (1) hide show

modeling_orion.py +2 -2

modeling_orion.py CHANGED Viewed

@@ -25,7 +25,7 @@ from transformers.pytorch_utils import ALL_LAYERNORM_LAYERS
 from transformers.utils import (
     add_start_docstrings,
     add_start_docstrings_to_model_forward,
-    is_flash_attn_available,
     logging,
     replace_return_docstrings,
 )
@@ -33,7 +33,7 @@ from .generation_utils import build_chat_input, TextIterStreamer
 from transformers.generation.utils import GenerationConfig
 from threading import Thread
-if is_flash_attn_available():
     from flash_attn import flash_attn_func, flash_attn_varlen_func
     from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa

 from transformers.utils import (
     add_start_docstrings,
     add_start_docstrings_to_model_forward,
+    is_flash_attn_2_available,
     logging,
     replace_return_docstrings,
 )
 from transformers.generation.utils import GenerationConfig
 from threading import Thread
+if is_flash_attn_2_available():
     from flash_attn import flash_attn_func, flash_attn_varlen_func
     from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa