Spaces:

teticio
/

audio-diffusion

Runtime error

teticio commited on Sep 17, 2022

Commit

f30bb70

•

1 Parent(s): 58b27cd

Skip completely silent slices

Files changed (1) hide show

audio_to_images.py CHANGED Viewed

@@ -1,14 +1,19 @@
 import os
 import re
 import io
 import argparse
 import pandas as pd
 from tqdm.auto import tqdm
 from datasets import Dataset, DatasetDict, Features, Image, Value
 from audiodiffusion.mel import Mel
 def main(args):
     mel = Mel(x_res=args.resolution,
@@ -32,6 +37,11 @@ def main(args):
                 image = mel.audio_slice_to_image(slice)
                 assert (image.width == args.resolution
                         and image.height == args.resolution)
                 with io.BytesIO() as output:
                     image.save(output, format="PNG")
                     bytes = output.getvalue()
@@ -43,6 +53,9 @@ def main(args):
                     "slice": slice,
                 }])
     finally:
         ds = Dataset.from_pandas(
             pd.DataFrame(examples),
             features=Features({

 import os
 import re
 import io
+import logging
 import argparse
+import numpy as np
 import pandas as pd
 from tqdm.auto import tqdm
 from datasets import Dataset, DatasetDict, Features, Image, Value
 from audiodiffusion.mel import Mel
+logging.basicConfig(level=logging.WARN)
+logger = logging.getLogger('audio_to_images')
 def main(args):
     mel = Mel(x_res=args.resolution,
                 image = mel.audio_slice_to_image(slice)
                 assert (image.width == args.resolution
                         and image.height == args.resolution)
+                # skip completely silent slices
+                if all(np.frombuffer(image.tobytes(), dtype=np.uint8) == 255):
+                    logger.warn('File %s slice %d is completely silent',
+                                audio_file, slice)
+                    continue
                 with io.BytesIO() as output:
                     image.save(output, format="PNG")
                     bytes = output.getvalue()
                     "slice": slice,
                 }])
     finally:
+        if len(examples) == 0:
+            logger.warn('No valid audio files were found.')
+            return
         ds = Dataset.from_pandas(
             pd.DataFrame(examples),
             features=Features({