Randomize clip location for speed scan.

Signed-off-by: Stefan Westerfeld <stefan@space.twc.de>

Randomize clip location for speed scan.
Signed-off-by: Stefan Westerfeld <stefan@space.twc.de>
9e3838ff · Stefan Westerfeld · dd5749ea · 9e3838ff · 9e3838ff · 9e3838ff
Commit 9e3838ff authored Nov 30, 2020 by Stefan Westerfeld
Hide whitespace changes
Inline Side-by-side

Showing with 44 additions and 2 deletions

random.cc src/random.cc +8 -0

random.hh src/random.hh +2 -1

wmspeed.cc src/wmspeed.cc +34 -1

No files found.
--- a/src/random.cc
+++ b/src/random.cc
@@ -245,3 +245,11 @@ Random::gen_key()
  gcry_randomize (&key[0], 16, /* long term key material strength */ GCRY_VERY_STRONG_RANDOM);
  return vec_to_hex_str (key);
 }
+
+uint64_t
+Random::seed_from_hash (const vector<float>& floats)
+{
+  unsigned char hash[20];
+  gcry_md_hash_buffer (GCRY_MD_SHA1, hash, &floats[0], floats.size() * sizeof (float));
+  return uint64_from_buffer (hash);
+}
--- a/src/random.hh
+++ b/src/random.hh
@@ -30,7 +30,7 @@ public:
  enum class Stream {
    data_up_down = 1,
    sync_up_down = 2,
-    pad_up_down = 3,   /* unused */
+    speed_clip = 3,
    mix = 4,
    bit_order = 5,
    frame_position = 6
@@ -73,6 +73,7 @@ public:
  static void        set_global_test_key (uint64_t seed);
  static void        load_global_key (const std::string& key_file);
  static std::string gen_key();
+  static uint64_t    seed_from_hash (const std::vector<float>& floats);
 };

 #endif /* AUDIOWMARK_RANDOM_HH */
--- a/src/wmspeed.cc
+++ b/src/wmspeed.cc
@@ -366,6 +366,36 @@ SpeedSync::compare (double relative_speed, double center)
  return best_score;
 }

+WavData
+get_speed_clip (const WavData& in_data, double clip_seconds)
+{
+  Random rng (0, Random::Stream::speed_clip);
+
+  /* to improve performance, we don't hash all samples but just a few */
+  const vector<float>& samples = in_data.samples();
+  vector<float> xsamples;
+  for (size_t p = 0; p < samples.size(); p += rng() % 1000)
+    xsamples.push_back (samples[p]);
+
+  rng.seed (Random::seed_from_hash (xsamples), Random::Stream::speed_clip);
+
+  double end_sec = double (in_data.n_frames()) / in_data.sample_rate();
+  double start_sec = (double (rng()) / UINT64_MAX) * (end_sec - clip_seconds);
+  if (start_sec < 0)
+    start_sec = 0;
+
+  size_t start_point = start_sec * in_data.sample_rate();
+  size_t end_point = std::min<size_t> (start_point + clip_seconds * in_data.sample_rate(), in_data.n_frames());
+#if 0
+  printf ("[%f %f] l%f\n", double (start_point) / in_data.sample_rate(), double (end_point) / in_data.sample_rate(),
+                           double (end_point - start_point) / in_data.sample_rate());
+#endif
+  vector<float> out_signal (in_data.samples().begin() + start_point * in_data.n_channels(),
+                            in_data.samples().begin() + end_point * in_data.n_channels());
+  WavData clip_data (out_signal, in_data.n_channels(), in_data.sample_rate(), in_data.bit_depth());
+  return clip_data;
+}
+
 double
 detect_speed (const WavData& in_data)
 {
@@ -383,8 +413,11 @@ detect_speed (const WavData& in_data)
    }
  else /* better performance, less accurate */
    {
+      /* speed is between 0.8 and 1.25, so we use a clip seconds factor of 1.3 to provide enough samples */
+      WavData in_clip = get_speed_clip (in_data, 21 * 1.3);
+
      /* first pass:  find approximation for speed */
-      speed = speed_scan (in_data);
+      speed = speed_scan (in_clip);

      /* second pass: fast refine (not always perfect) */
      SpeedSync speed_sync;