ESPHome: /opt/build/esphome/esphome/components/resampler/speaker/resampler_speaker.cpp Source File

 #include "resampler_speaker.h"

 #ifdef USE_ESP32

 #include "esphome/components/audio/audio_resampler.h"

 #include "esphome/core/helpers.h"
 #include "esphome/core/log.h"

 #include <algorithm>
 #include <cstring>

 namespace esphome {
 namespace resampler {

 static const UBaseType_t RESAMPLER_TASK_PRIORITY = 1;

 static const uint32_t TRANSFER_BUFFER_DURATION_MS = 50;

 static const uint32_t TASK_DELAY_MS = 20;
 static const uint32_t TASK_STACK_SIZE = 3072;

 static const char *const TAG = "resampler_speaker";

 enum ResamplingEventGroupBits : uint32_t {
   COMMAND_STOP = (1 << 0),  // stops the resampler task
   STATE_STARTING = (1 << 10),
   STATE_RUNNING = (1 << 11),
   STATE_STOPPING = (1 << 12),
   STATE_STOPPED = (1 << 13),
   ERR_ESP_NO_MEM = (1 << 19),
   ERR_ESP_NOT_SUPPORTED = (1 << 20),
   ERR_ESP_FAIL = (1 << 21),
   ALL_BITS = 0x00FFFFFF,  // All valid FreeRTOS event group bits
 };

 void ResamplerSpeaker::setup() {
   this->event_group_ = xEventGroupCreate();

   if (this->event_group_ == nullptr) {
     ESP_LOGE(TAG, "Failed to create event group");
     this->mark_failed();
     return;
   }

   this->output_speaker_->add_audio_output_callback(
       [this](uint32_t new_playback_ms, uint32_t remainder_us, uint32_t pending_ms, uint32_t write_timestamp) {
         int32_t adjustment = this->playback_differential_ms_;
         this->playback_differential_ms_ -= adjustment;
         int32_t adjusted_playback_ms = static_cast<int32_t>(new_playback_ms) + adjustment;
         this->audio_output_callback_(adjusted_playback_ms, remainder_us, pending_ms, write_timestamp);
       });
 }

 void ResamplerSpeaker::loop() {
   uint32_t event_group_bits = xEventGroupGetBits(this->event_group_);

   if (event_group_bits & ResamplingEventGroupBits::STATE_STARTING) {
     ESP_LOGD(TAG, "Starting resampler task");
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::STATE_STARTING);
   }

   if (event_group_bits & ResamplingEventGroupBits::ERR_ESP_NO_MEM) {
     this->status_set_error("Resampler task failed to allocate the internal buffers");
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::ERR_ESP_NO_MEM);
     this->state_ = speaker::STATE_STOPPING;
   }
   if (event_group_bits & ResamplingEventGroupBits::ERR_ESP_NOT_SUPPORTED) {
     this->status_set_error("Cannot resample due to an unsupported audio stream");
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::ERR_ESP_NOT_SUPPORTED);
     this->state_ = speaker::STATE_STOPPING;
   }
   if (event_group_bits & ResamplingEventGroupBits::ERR_ESP_FAIL) {
     this->status_set_error("Resampler task failed");
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::ERR_ESP_FAIL);
     this->state_ = speaker::STATE_STOPPING;
   }

   if (event_group_bits & ResamplingEventGroupBits::STATE_RUNNING) {
     ESP_LOGD(TAG, "Started resampler task");
     this->status_clear_error();
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::STATE_RUNNING);
   }
   if (event_group_bits & ResamplingEventGroupBits::STATE_STOPPING) {
     ESP_LOGD(TAG, "Stopping resampler task");
     xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::STATE_STOPPING);
   }
   if (event_group_bits & ResamplingEventGroupBits::STATE_STOPPED) {
     if (this->delete_task_() == ESP_OK) {
       ESP_LOGD(TAG, "Stopped resampler task");
       xEventGroupClearBits(this->event_group_, ResamplingEventGroupBits::ALL_BITS);
     }
   }

   switch (this->state_) {
     case speaker::STATE_STARTING: {
       esp_err_t err = this->start_();
       if (err == ESP_OK) {
         this->status_clear_error();
         this->state_ = speaker::STATE_RUNNING;
       } else {
         switch (err) {
           case ESP_ERR_INVALID_STATE:
             this->status_set_error("Failed to start resampler: resampler task failed to start");
             break;
           case ESP_ERR_NO_MEM:
             this->status_set_error("Failed to start resampler: not enough memory for task stack");
           default:
             this->status_set_error("Failed to start resampler");
             break;
         }

         this->state_ = speaker::STATE_STOPPING;
       }
       break;
     }
     case speaker::STATE_RUNNING:
       if (this->output_speaker_->is_stopped()) {
         this->state_ = speaker::STATE_STOPPING;
       }

       break;
     case speaker::STATE_STOPPING:
       this->stop_();
       this->state_ = speaker::STATE_STOPPED;
       break;
     case speaker::STATE_STOPPED:
       break;
   }
 }

 size_t ResamplerSpeaker::play(const uint8_t *data, size_t length, TickType_t ticks_to_wait) {
   if (this->is_stopped()) {
     this->start();
   }

   size_t bytes_written = 0;
   if ((this->output_speaker_->is_running()) && (!this->requires_resampling_())) {
     bytes_written = this->output_speaker_->play(data, length, ticks_to_wait);
   } else {
     if (this->ring_buffer_.use_count() == 1) {
       std::shared_ptr<RingBuffer> temp_ring_buffer = this->ring_buffer_.lock();
       bytes_written = temp_ring_buffer->write_without_replacement(data, length, ticks_to_wait);
     }
   }

   return bytes_written;
 }

 void ResamplerSpeaker::start() { this->state_ = speaker::STATE_STARTING; }

 esp_err_t ResamplerSpeaker::start_() {
   this->target_stream_info_ = audio::AudioStreamInfo(
       this->target_bits_per_sample_, this->audio_stream_info_.get_channels(), this->target_sample_rate_);

   this->output_speaker_->set_audio_stream_info(this->target_stream_info_);
   this->output_speaker_->start();

   if (this->requires_resampling_()) {
     // Start the resampler task to handle converting sample rates
     return this->start_task_();
   }

   return ESP_OK;
 }

 esp_err_t ResamplerSpeaker::start_task_() {
   if (this->task_stack_buffer_ == nullptr) {
     if (this->task_stack_in_psram_) {
       RAMAllocator<StackType_t> stack_allocator(RAMAllocator<StackType_t>::ALLOC_EXTERNAL);
       this->task_stack_buffer_ = stack_allocator.allocate(TASK_STACK_SIZE);
     } else {
       RAMAllocator<StackType_t> stack_allocator(RAMAllocator<StackType_t>::ALLOC_INTERNAL);
       this->task_stack_buffer_ = stack_allocator.allocate(TASK_STACK_SIZE);
     }
   }

   if (this->task_stack_buffer_ == nullptr) {
     return ESP_ERR_NO_MEM;
   }

   if (this->task_handle_ == nullptr) {
     this->task_handle_ = xTaskCreateStatic(resample_task, "sample", TASK_STACK_SIZE, (void *) this,
                                            RESAMPLER_TASK_PRIORITY, this->task_stack_buffer_, &this->task_stack_);
   }

   if (this->task_handle_ == nullptr) {
     return ESP_ERR_INVALID_STATE;
   }

   return ESP_OK;
 }

 void ResamplerSpeaker::stop() { this->state_ = speaker::STATE_STOPPING; }

 void ResamplerSpeaker::stop_() {
   if (this->task_handle_ != nullptr) {
     xEventGroupSetBits(this->event_group_, ResamplingEventGroupBits::COMMAND_STOP);
   }
   this->output_speaker_->stop();
 }

 esp_err_t ResamplerSpeaker::delete_task_() {
   if (!this->task_created_) {
     this->task_handle_ = nullptr;

     if (this->task_stack_buffer_ != nullptr) {
       if (this->task_stack_in_psram_) {
         RAMAllocator<StackType_t> stack_allocator(RAMAllocator<StackType_t>::ALLOC_EXTERNAL);
         stack_allocator.deallocate(this->task_stack_buffer_, TASK_STACK_SIZE);
       } else {
         RAMAllocator<StackType_t> stack_allocator(RAMAllocator<StackType_t>::ALLOC_INTERNAL);
         stack_allocator.deallocate(this->task_stack_buffer_, TASK_STACK_SIZE);
       }

       this->task_stack_buffer_ = nullptr;
     }

     return ESP_OK;
   }

   return ESP_ERR_INVALID_STATE;
 }

 void ResamplerSpeaker::finish() { this->output_speaker_->finish(); }

 bool ResamplerSpeaker::has_buffered_data() const {
   bool has_ring_buffer_data = false;
   if (this->requires_resampling_() && (this->ring_buffer_.use_count() > 0)) {
     has_ring_buffer_data = (this->ring_buffer_.lock()->available() > 0);
   }
   return (has_ring_buffer_data || this->output_speaker_->has_buffered_data());
 }

 void ResamplerSpeaker::set_mute_state(bool mute_state) {
   this->mute_state_ = mute_state;
   this->output_speaker_->set_mute_state(mute_state);
 }

 void ResamplerSpeaker::set_volume(float volume) {
   this->volume_ = volume;
   this->output_speaker_->set_volume(volume);
 }

 bool ResamplerSpeaker::requires_resampling_() const {
   return (this->audio_stream_info_.get_sample_rate() != this->target_sample_rate_) ||
          (this->audio_stream_info_.get_bits_per_sample() != this->target_bits_per_sample_);
 }

 void ResamplerSpeaker::resample_task(void *params) {
   ResamplerSpeaker *this_resampler = (ResamplerSpeaker *) params;

   this_resampler->task_created_ = true;
   xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::STATE_STARTING);

   std::unique_ptr<audio::AudioResampler> resampler =
       make_unique<audio::AudioResampler>(this_resampler->audio_stream_info_.ms_to_bytes(TRANSFER_BUFFER_DURATION_MS),
                                          this_resampler->target_stream_info_.ms_to_bytes(TRANSFER_BUFFER_DURATION_MS));

   esp_err_t err = resampler->start(this_resampler->audio_stream_info_, this_resampler->target_stream_info_,
                                    this_resampler->taps_, this_resampler->filters_);

   if (err == ESP_OK) {
     std::shared_ptr<RingBuffer> temp_ring_buffer =
         RingBuffer::create(this_resampler->audio_stream_info_.ms_to_bytes(this_resampler->buffer_duration_ms_));

     if (temp_ring_buffer.use_count() == 0) {
       err = ESP_ERR_NO_MEM;
     } else {
       this_resampler->ring_buffer_ = temp_ring_buffer;
       resampler->add_source(this_resampler->ring_buffer_);

       this_resampler->output_speaker_->set_audio_stream_info(this_resampler->target_stream_info_);
       resampler->add_sink(this_resampler->output_speaker_);
     }
   }

   if (err == ESP_OK) {
     xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::STATE_RUNNING);
   } else if (err == ESP_ERR_NO_MEM) {
     xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::ERR_ESP_NO_MEM);
   } else if (err == ESP_ERR_NOT_SUPPORTED) {
     xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::ERR_ESP_NOT_SUPPORTED);
   }

   this_resampler->playback_differential_ms_ = 0;
   while (err == ESP_OK) {
     uint32_t event_bits = xEventGroupGetBits(this_resampler->event_group_);

     if (event_bits & ResamplingEventGroupBits::COMMAND_STOP) {
       break;
     }

     // Stop gracefully if the decoder is done
     int32_t ms_differential = 0;
     audio::AudioResamplerState resampler_state = resampler->resample(false, &ms_differential);

     this_resampler->playback_differential_ms_ += ms_differential;

     if (resampler_state == audio::AudioResamplerState::FINISHED) {
       break;
     } else if (resampler_state == audio::AudioResamplerState::FAILED) {
       xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::ERR_ESP_FAIL);
       break;
     }
   }

   xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::STATE_STOPPING);
   resampler.reset();
   xEventGroupSetBits(this_resampler->event_group_, ResamplingEventGroupBits::STATE_STOPPED);
   this_resampler->task_created_ = false;
   vTaskDelete(nullptr);
 }

 }  // namespace resampler
 }  // namespace esphome

 #endif
esphome::speaker::Speaker::is_running
bool is_running() const
Definition: speaker.h:66

esphome::speaker::Speaker::state_
State state_
Definition: speaker.h:117

esphome::speaker::Speaker::mute_state_
bool mute_state_
Definition: speaker.h:120

esphome::speaker::STATE_STOPPED
Definition: speaker.h:23

esphome::speaker::Speaker::set_volume
virtual void set_volume(float volume)
Definition: speaker.h:71

esphome::audio::AudioStreamInfo::get_channels
uint8_t get_channels() const
Definition: audio.h:29

esphome::speaker::Speaker::add_audio_output_callback
void add_audio_output_callback(std::function< void(uint32_t, uint32_t, uint32_t, uint32_t)> &&callback)
Callback function for sending the duration of the audio written to the speaker since the last callbac...
Definition: speaker.h:112

esphome::resampler::ResamplerSpeaker::loop
void loop() override
Definition: resampler_speaker.cpp:55

esphome::resampler::ResamplerSpeaker::task_created_
bool task_created_
Definition: resampler_speaker.h:85

esphome::audio::AudioStreamInfo::get_bits_per_sample
uint8_t get_bits_per_sample() const
Definition: audio.h:28

esphome::RAMAllocator::allocate
T * allocate(size_t n)
Definition: helpers.h:703

esphome::resampler::ERR_ESP_NOT_SUPPORTED
Definition: resampler_speaker.cpp:32

esphome::resampler::ResamplerSpeaker::set_volume
void set_volume(float volume) override
Volume state changes are passed to the parent&#39;s output speaker.
Definition: resampler_speaker.cpp:240

esphome::speaker::Speaker::finish
virtual void finish()
Definition: speaker.h:58

esphome::resampler::ResamplerSpeaker::has_buffered_data
bool has_buffered_data() const override
Definition: resampler_speaker.cpp:227

esphome::resampler::STATE_RUNNING
Definition: resampler_speaker.cpp:28

esphome::resampler::ResamplerSpeaker::target_bits_per_sample_
uint8_t target_bits_per_sample_
Definition: resampler_speaker.h:96

esphome::speaker::Speaker::has_buffered_data
virtual bool has_buffered_data() const =0

esphome::resampler::ResamplerSpeaker::stop
void stop() override
Definition: resampler_speaker.cpp:194

esphome::resampler::ResamplerSpeaker::start_
esp_err_t start_()
Starts the output speaker after setting the resampled stream info.
Definition: resampler_speaker.cpp:152

esphome::resampler::ResamplerSpeaker::requires_resampling_
bool requires_resampling_() const
Definition: resampler_speaker.cpp:245

esphome::speaker::Speaker::audio_output_callback_
CallbackManager< void(uint32_t, uint32_t, uint32_t, uint32_t)> audio_output_callback_
Definition: speaker.h:126

esphome::speaker::Speaker::is_stopped
bool is_stopped() const
Definition: speaker.h:67

esphome::resampler::STATE_STARTING
Definition: resampler_speaker.cpp:27

esphome::resampler::ERR_ESP_NO_MEM
Definition: resampler_speaker.cpp:31

esphome::resampler::ResamplerSpeaker::task_stack_in_psram_
bool task_stack_in_psram_
Definition: resampler_speaker.h:84

esphome::resampler::ResamplerSpeaker::playback_differential_ms_
int32_t playback_differential_ms_
Definition: resampler_speaker.h:101

esphome::audio::AudioStreamInfo
Definition: audio.h:11

esphome::speaker::Speaker::volume_
float volume_
Definition: speaker.h:119

esphome::resampler::ResamplerSpeaker
Definition: resampler_speaker.h:17

esphome::resampler::ResamplerSpeaker::stop_
void stop_()
Stops the output speaker. If the resampling task is running, it sends the stop command.
Definition: resampler_speaker.cpp:196

esphome::resampler::ResamplerSpeaker::task_stack_buffer_
StackType_t * task_stack_buffer_
Definition: resampler_speaker.h:89

esphome::speaker::Speaker::set_audio_stream_info
void set_audio_stream_info(const audio::AudioStreamInfo &audio_stream_info)
Definition: speaker.h:99

esphome::Component::status_set_error
void status_set_error(const char *message="unspecified")
Definition: component.cpp:159

esphome::resampler::ResamplerSpeaker::setup
void setup() override
Definition: resampler_speaker.cpp:37

esphome::resampler::ResamplerSpeaker::resample_task
static void resample_task(void *params)
Definition: resampler_speaker.cpp:250

esphome::resampler::COMMAND_STOP
Definition: resampler_speaker.cpp:26

esphome::resampler::STATE_STOPPING
Definition: resampler_speaker.cpp:29

esphome::resampler::ResamplerSpeaker::event_group_
EventGroupHandle_t event_group_
Definition: resampler_speaker.h:78

esphome::resampler::ResamplerSpeaker::filters_
uint16_t filters_
Definition: resampler_speaker.h:94

esphome::speaker::STATE_STARTING
Definition: speaker.h:24

esphome::resampler::ResamplerSpeaker::task_stack_
StaticTask_t task_stack_
Definition: resampler_speaker.h:88

esphome::resampler::ResamplerSpeaker::start
void start() override
Definition: resampler_speaker.cpp:150

esphome::audio::AudioStreamInfo::get_sample_rate
uint32_t get_sample_rate() const
Definition: audio.h:30

esphome::resampler::STATE_STOPPED
Definition: resampler_speaker.cpp:30

esphome::audio::AudioStreamInfo::ms_to_bytes
size_t ms_to_bytes(uint32_t ms) const
Converts duration to bytes.
Definition: audio.h:73

esphome::audio::AudioResamplerState::FAILED

esphome::resampler::ResamplerSpeaker::delete_task_
esp_err_t delete_task_()
Deallocates the task stack and resets the pointers.
Definition: resampler_speaker.cpp:203

esphome::RAMAllocator::deallocate
void deallocate(T *p, size_t n)
Definition: helpers.h:720

esphome::resampler::ResamplerSpeaker::set_mute_state
void set_mute_state(bool mute_state) override
Mute state changes are passed to the parent&#39;s output speaker.
Definition: resampler_speaker.cpp:235

esphome::Component::status_clear_error
void status_clear_error()
Definition: component.cpp:172

esphome::resampler::ResamplerSpeaker::taps_
uint16_t taps_
Definition: resampler_speaker.h:93

esphome::resampler::ResamplingEventGroupBits
ResamplingEventGroupBits
Definition: resampler_speaker.cpp:25

esphome::speaker::STATE_STOPPING
Definition: speaker.h:26

esphome::speaker::Speaker::start
virtual void start()=0

esphome::resampler::ResamplerSpeaker::buffer_duration_ms_
uint32_t buffer_duration_ms_
Definition: resampler_speaker.h:99

esphome::Component::mark_failed
virtual void mark_failed()
Mark this component as failed.
Definition: component.cpp:118

length
uint16_t length
Definition: tt21100.cpp:12

esphome::resampler::ERR_ESP_FAIL
Definition: resampler_speaker.cpp:33

esphome::audio::AudioDecoderState::FINISHED

esphome
Implementation of SPI Controller mode.
Definition: a01nyub.cpp:7

esphome::resampler::ResamplerSpeaker::target_stream_info_
audio::AudioStreamInfo target_stream_info_
Definition: resampler_speaker.h:91

audio_resampler.h

esphome::resampler::ResamplerSpeaker::target_sample_rate_
uint32_t target_sample_rate_
Definition: resampler_speaker.h:97

esphome::speaker::STATE_RUNNING
Definition: speaker.h:25

esphome::audio::AudioResamplerState
AudioResamplerState
Definition: audio_resampler.h:22

helpers.h

esphome::resampler::ResamplerSpeaker::task_handle_
TaskHandle_t task_handle_
Definition: resampler_speaker.h:87

esphome::resampler::ResamplerSpeaker::start_task_
esp_err_t start_task_()
Starts the resampler task after allocating the task stack.
Definition: resampler_speaker.cpp:167

esphome::resampler::ResamplerSpeaker::ring_buffer_
std::weak_ptr< RingBuffer > ring_buffer_
Definition: resampler_speaker.h:80

log.h

esphome::speaker::Speaker::play
virtual size_t play(const uint8_t *data, size_t length, TickType_t ticks_to_wait)
Plays the provided audio data.
Definition: speaker.h:38

esphome::RAMAllocator
An STL allocator that uses SPI or internal RAM.
Definition: helpers.h:683

resampler_speaker.h

esphome::RingBuffer::create
static std::unique_ptr< RingBuffer > create(size_t len)
Definition: ring_buffer.cpp:22

esphome::resampler::ResamplerSpeaker::finish
void finish() override
Definition: resampler_speaker.cpp:225

esphome::resampler::ALL_BITS
Definition: resampler_speaker.cpp:34

esphome::speaker::Speaker::stop
virtual void stop()=0

esphome::speaker::Speaker::audio_stream_info_
audio::AudioStreamInfo audio_stream_info_
Definition: speaker.h:118

esphome::resampler::ResamplerSpeaker::output_speaker_
speaker::Speaker * output_speaker_
Definition: resampler_speaker.h:82

esphome::speaker::Speaker::set_mute_state
virtual void set_mute_state(bool mute_state)
Definition: speaker.h:81

esphome::resampler::ResamplerSpeaker::play
size_t play(const uint8_t *data, size_t length, TickType_t ticks_to_wait) override
Definition: resampler_speaker.cpp:132