Add dataset

2020-05-26 20:48:12 +02:00 · 2020-05-26 20:48:12 +02:00 · 7c2485ce9b
commit 7c2485ce9b
parent 965839ee00
85 changed files with 81 additions and 1 deletions
--- a/.gitignore
+++ b/.gitignore
@ -139,3 +139,10 @@ cython_debug/

 # Generated docs
 *.pdf
+
+/dataset/wav/
+!/dataset/wav/.gitkeep
+/dataset/processed/
+!/dataset/processed/.gitkeep
+/dataset/manifest.csv
+/eval/
--- a/3
+++ b/3
@ -17,4 +17,7 @@ RUN curl https://raw.githubusercontent.com/tensorflow/magenta/master/magenta/too
    sed 's/sudo //' -i /tmp/magenta-install.sh && \
    bash --login /tmp/magenta-install.sh

+# install fluidsynth for MIDI to WAV conversion
+RUN apt-get install fluidsynth fluid-soundfont-gm --no-install-recommends
+
 RUN echo "conda activate magenta" >> /root/.bashrc
--- a/README.md
+++ b/README.md
@ -15,8 +15,34 @@ $ make image # wywołuje docker build . --tag transcription:latest

 W ten sposób zostanie zbudowany obraz `transcription:latest`. Teraz możemy go wykorzystać:
 ```
-$ docker run -v "$(pwd):/root/experiment" -it transcription:latest
+$ docker run -v "$(pwd):/root/experiment" -p 6006:6006 -it transcription:latest
 ```

 W ten sposób powinniśmy znaleźć się wewnątrz kontenera z skonfigurowanym środowiskiem i pobranym checkpointem. Katalog
 w którym się znajdujemy powinien być zamontowany w obrazie jako `~/experiment`.
+
+## Dataset
+Pliki midi zaczerpnięte z http://www.piano-midi.de/midi_files.htm stworzone przez Bernda Kruegera, udostępniane na licencji CC BY-SA 3.0. 
+
+Do przygotowania datasetu z załączonych plików `midi` należy skorzystać ze skryptu `prepare_dataset`. Pomoc i opis argumentów można uzyskać z pomocą argumentu `-h`.
+
+Przykładowe wywołanie:
+```
+python prepare_dataset.py -n 5
+```
+
+Wygeneruje dataset z pierwszych 5 plików midi w folderze `./dataset/midi`.
+
+Następnie należy przygotować dataset do działania z siecią:
+```
+python /opt/conda/envs/magenta/lib/python3.7/site-packages/magenta/models/onsets_frames_transcription/onsets_frames_transcription_create_tfrecords.py --csv="./dataset/manifest.csv" --output_directory="./dataset/processed" --wav_dir="./dataset/wav" --midi_dir="./dataset/midi" --expected_splits="test"
+```
+
+Niestety, w tej wersji jest błąd przez co alias `onsets_frames_transcription_create_tfrecords` nie działa i trzeba się ratować pełną ścieżką.
+
+Konwersję i testy możemy przeprowadzić komendą:
+```
+onsets_frames_transcription_infer --model_dir="${MODEL_DIR}" --output_dir="./eval/" --examples_path=./dataset/processed/test.tfrecord* --hparams="use_cudnn=false" --preprocess_examples=True
+```
+
+Parametr `--hparams="use_cudnn=false"` można pominąć jeżeli dysponujemy GPU z CUDA.
--- a/dataset/midi/chp_op18.mid
+++ b/dataset/midi/chp_op18.mid
--- a/dataset/midi/chp_op31.mid
+++ b/dataset/midi/chp_op31.mid
--- a/dataset/midi/chpn-p1.mid
+++ b/dataset/midi/chpn-p1.mid
--- a/dataset/midi/chpn-p10.mid
+++ b/dataset/midi/chpn-p10.mid
--- a/dataset/midi/chpn-p11.mid
+++ b/dataset/midi/chpn-p11.mid
--- a/dataset/midi/chpn-p12.mid
+++ b/dataset/midi/chpn-p12.mid
--- a/dataset/midi/chpn-p13.mid
+++ b/dataset/midi/chpn-p13.mid
--- a/dataset/midi/chpn-p14.mid
+++ b/dataset/midi/chpn-p14.mid
--- a/dataset/midi/chpn-p15.mid
+++ b/dataset/midi/chpn-p15.mid
--- a/dataset/midi/chpn-p16.mid
+++ b/dataset/midi/chpn-p16.mid
--- a/dataset/midi/chpn-p17.mid
+++ b/dataset/midi/chpn-p17.mid
--- a/dataset/midi/chpn-p18.mid
+++ b/dataset/midi/chpn-p18.mid
--- a/dataset/midi/chpn-p19.mid
+++ b/dataset/midi/chpn-p19.mid
--- a/dataset/midi/chpn-p2.mid
+++ b/dataset/midi/chpn-p2.mid
--- a/dataset/midi/chpn-p20.mid
+++ b/dataset/midi/chpn-p20.mid
--- a/dataset/midi/chpn-p21.mid
+++ b/dataset/midi/chpn-p21.mid
--- a/dataset/midi/chpn-p22.mid
+++ b/dataset/midi/chpn-p22.mid
--- a/dataset/midi/chpn-p23.mid
+++ b/dataset/midi/chpn-p23.mid
--- a/dataset/midi/chpn-p24.mid
+++ b/dataset/midi/chpn-p24.mid
--- a/dataset/midi/chpn-p3.mid
+++ b/dataset/midi/chpn-p3.mid
--- a/dataset/midi/chpn-p4.mid
+++ b/dataset/midi/chpn-p4.mid
--- a/dataset/midi/chpn-p5.mid
+++ b/dataset/midi/chpn-p5.mid
--- a/dataset/midi/chpn-p6.mid
+++ b/dataset/midi/chpn-p6.mid
--- a/dataset/midi/chpn-p7.mid
+++ b/dataset/midi/chpn-p7.mid
--- a/dataset/midi/chpn-p8.mid
+++ b/dataset/midi/chpn-p8.mid
--- a/dataset/midi/chpn-p9.mid
+++ b/dataset/midi/chpn-p9.mid
--- a/dataset/midi/chpn_op10_e01.mid
+++ b/dataset/midi/chpn_op10_e01.mid
--- a/dataset/midi/chpn_op10_e05.mid
+++ b/dataset/midi/chpn_op10_e05.mid
--- a/dataset/midi/chpn_op10_e12.mid
+++ b/dataset/midi/chpn_op10_e12.mid
--- a/dataset/midi/chpn_op23.mid
+++ b/dataset/midi/chpn_op23.mid
--- a/dataset/midi/chpn_op25_e1.mid
+++ b/dataset/midi/chpn_op25_e1.mid
--- a/dataset/midi/chpn_op25_e11.mid
+++ b/dataset/midi/chpn_op25_e11.mid
--- a/dataset/midi/chpn_op25_e12.mid
+++ b/dataset/midi/chpn_op25_e12.mid
--- a/dataset/midi/chpn_op25_e2.mid
+++ b/dataset/midi/chpn_op25_e2.mid
--- a/dataset/midi/chpn_op25_e3.mid
+++ b/dataset/midi/chpn_op25_e3.mid
--- a/dataset/midi/chpn_op25_e4.mid
+++ b/dataset/midi/chpn_op25_e4.mid
--- a/dataset/midi/chpn_op27_1.mid
+++ b/dataset/midi/chpn_op27_1.mid
--- a/dataset/midi/chpn_op27_2.mid
+++ b/dataset/midi/chpn_op27_2.mid
--- a/dataset/midi/chpn_op33_2.mid
+++ b/dataset/midi/chpn_op33_2.mid
--- a/dataset/midi/chpn_op33_4.mid
+++ b/dataset/midi/chpn_op33_4.mid
--- a/dataset/midi/chpn_op35_1.mid
+++ b/dataset/midi/chpn_op35_1.mid
--- a/dataset/midi/chpn_op35_2.mid
+++ b/dataset/midi/chpn_op35_2.mid
--- a/dataset/midi/chpn_op35_3.mid
+++ b/dataset/midi/chpn_op35_3.mid
--- a/dataset/midi/chpn_op35_4.mid
+++ b/dataset/midi/chpn_op35_4.mid
--- a/dataset/midi/chpn_op53.mid
+++ b/dataset/midi/chpn_op53.mid
--- a/dataset/midi/chpn_op66.mid
+++ b/dataset/midi/chpn_op66.mid
--- a/dataset/midi/chpn_op7_1.mid
+++ b/dataset/midi/chpn_op7_1.mid
--- a/dataset/midi/chpn_op7_2.mid
+++ b/dataset/midi/chpn_op7_2.mid
--- a/dataset/midi/mz_311_1.mid
+++ b/dataset/midi/mz_311_1.mid
--- a/dataset/midi/mz_311_2.mid
+++ b/dataset/midi/mz_311_2.mid
--- a/dataset/midi/mz_311_3.mid
+++ b/dataset/midi/mz_311_3.mid
--- a/dataset/midi/mz_330_1.mid
+++ b/dataset/midi/mz_330_1.mid
--- a/dataset/midi/mz_330_2.mid
+++ b/dataset/midi/mz_330_2.mid
--- a/dataset/midi/mz_330_3.mid
+++ b/dataset/midi/mz_330_3.mid
--- a/dataset/midi/mz_331_1.mid
+++ b/dataset/midi/mz_331_1.mid
--- a/dataset/midi/mz_331_2.mid
+++ b/dataset/midi/mz_331_2.mid
--- a/dataset/midi/mz_331_3.mid
+++ b/dataset/midi/mz_331_3.mid
--- a/dataset/midi/mz_332_1.mid
+++ b/dataset/midi/mz_332_1.mid
--- a/dataset/midi/mz_332_2.mid
+++ b/dataset/midi/mz_332_2.mid
--- a/dataset/midi/mz_332_3.mid
+++ b/dataset/midi/mz_332_3.mid
--- a/dataset/midi/mz_333_1.mid
+++ b/dataset/midi/mz_333_1.mid
--- a/dataset/midi/mz_333_2.mid
+++ b/dataset/midi/mz_333_2.mid
--- a/dataset/midi/mz_333_3.mid
+++ b/dataset/midi/mz_333_3.mid
--- a/dataset/midi/mz_545_1.mid
+++ b/dataset/midi/mz_545_1.mid
--- a/dataset/midi/mz_545_2.mid
+++ b/dataset/midi/mz_545_2.mid
--- a/dataset/midi/mz_545_3.mid
+++ b/dataset/midi/mz_545_3.mid
--- a/dataset/midi/mz_570_1.mid
+++ b/dataset/midi/mz_570_1.mid
--- a/dataset/midi/mz_570_2.mid
+++ b/dataset/midi/mz_570_2.mid
--- a/dataset/midi/mz_570_3.mid
+++ b/dataset/midi/mz_570_3.mid
--- a/dataset/midi/ty_april.mid
+++ b/dataset/midi/ty_april.mid
--- a/dataset/midi/ty_august.mid
+++ b/dataset/midi/ty_august.mid
--- a/dataset/midi/ty_dezember.mid
+++ b/dataset/midi/ty_dezember.mid
--- a/dataset/midi/ty_februar.mid
+++ b/dataset/midi/ty_februar.mid
--- a/dataset/midi/ty_januar.mid
+++ b/dataset/midi/ty_januar.mid
--- a/dataset/midi/ty_juli.mid
+++ b/dataset/midi/ty_juli.mid
--- a/dataset/midi/ty_juni.mid
+++ b/dataset/midi/ty_juni.mid
--- a/dataset/midi/ty_maerz.mid
+++ b/dataset/midi/ty_maerz.mid
--- a/dataset/midi/ty_mai.mid
+++ b/dataset/midi/ty_mai.mid
--- a/dataset/midi/ty_november.mid
+++ b/dataset/midi/ty_november.mid
--- a/dataset/midi/ty_oktober.mid
+++ b/dataset/midi/ty_oktober.mid
--- a/dataset/midi/ty_september.mid
+++ b/dataset/midi/ty_september.mid
--- a/prepare_dataset.py
+++ b/prepare_dataset.py
@ -0,0 +1,44 @@
+from glob import glob
+from argparse import ArgumentParser
+from os import system, path
+import csv
+
+
+parser = ArgumentParser(description="Prepare dataset from midi files for later use in onsets and frames.")
+parser.add_argument('--dry', '-d', dest='dry', action='store_true', help="Dry run, print commands instead of executing them")
+parser.add_argument('--no-convert', '-m', dest='no_convert', action='store_true', help="Only create manifest.")
+parser.add_argument('--soundfont', '-f', default='/usr/share/sounds/sf2/FluidR3_GM.sf2', help="Path to soundfont.")
+parser.add_argument('-n', type=int, help="Max midi files to process")
+
+args = parser.parse_args()
+
+execute = print if args.dry else system
+
+processed = 0
+if not args.no_convert:
+    for midi in glob("dataset/midi/*.mid"):
+        wav = midi.replace('.mid', '.wav').replace('/midi/', '/wav/')
+
+        processed = processed + 1
+        if 'n' in args and processed > args.n:
+            break
+
+        if path.isfile(wav):
+            continue
+
+        print(f"Converting {midi} to {wav}")
+        execute(f"fluidsynth -nli -r 48000 -T wav -F {wav} {args.soundfont} {midi} > /dev/null")
+
+
+manifest = []
+for wav in glob("dataset/wav/*.wav"):
+    midi = wav.replace('.wav', '.mid').replace('/wav/', '/midi/')
+
+    if path.isfile(midi):
+        manifest.append((path.basename(wav), path.basename(midi), 'test'))
+
+
+with open('dataset/manifest.csv', 'w') as manifest_file:
+    writer = csv.writer(manifest_file)
+    writer.writerow(('audio_filename', 'midi_filename', 'split'))
+    writer.writerows(manifest)