padmalcom
/

wav2vec2-large-nonverbalvocalization-classification

Audio Classification

Inference Endpoints

Model card Files Files and versions Community

wav2vec2-large-nonverbalvocalization-classification / README.md

padmalcom's picture

Create README.md

e8883a7 over 1 year ago

|

413 Bytes

	This language indendent wav2vec2 classification model is based on (this dataset)[https://github.com/deeplyinc/Nonverbal-Vocalization-Dataset]

	Sound classes are:
	- teeth-chattering
	- teeth-grinding
	- tongue-clicking
	- nose-blowing
	- coughing
	- yawning
	- throat clearing
	- sighing
	- lip-popping
	- lip-smacking
	- panting
	- crying
	- laughing
	- sneezing
	- moaning
	- screaming

	Inference can be seen in inference.py.