-
Effective Pre-Training of Audio Transformers for Sound Event Detection
Schmid, F., Morocutti, T., Foscarin, F., Schlüter, J., Primus, P. & Widmer, G., 07 März 2025, Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2025). 1 Aufl. 5 S. (ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings).Publikation: Beitrag in Buch/Bericht/Konferenzband › Konferenzbeitrag › Begutachtung
-
Low-Complexity Acoustic Scene Classification with Device Information in the DCASE 2025 Challenge
Schmid, F., Primus, P., Martín-Morató, I., Heittola, T., Widmer, G. & Mesaros, A., 2025, Proceedings of the 10th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2025). 1 Aufl.Publikation: Beitrag in Buch/Bericht/Konferenzband › Konferenzbeitrag › Begutachtung
-
On Temporal Guidance and Iterative Refinement in Audio Source Separation
Morocutti, T., Greif, J., Primus, P., Schmid, F. & Widmer, G., 23 Juli 2025, 5 S. (arXiv.org; Nr. 2507.17297).Publikation: Preprints, Working Paper und Forschungsberichte › Vorabpublikation
Open Access -
On Temporal Guidance and Iterative Refinement in Audio Source Separation
Morocutti, T., Greif, J., Primus, P., Schmid, F. & Widmer, G., 2025, Proceedings of the 10th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2025): 30–31 October 2025, Barcelona, Spain. 1 Aufl. 5 S.Publikation: Beitrag in Buch/Bericht/Konferenzband › Konferenzbeitrag › Begutachtung
-
TACOS: Temporally-aligned Audio CaptiOnS for Language-Audio Pretraining
Primus, P., Schmid, F. & Widmer, G., 14 Okt. 2025, 2025 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA. 1 Aufl. 5 S. (IEEE Workshop on Applications of Signal Processing to Audio and Acoustics).Publikation: Beitrag in Buch/Bericht/Konferenzband › Konferenzbeitrag › Begutachtung
-
Adversarial Robustness in Data Augmentation
Zellinger, W. (Vortragende*r), Koutini, K. (Vortragende*r), Praher, V. (Vortragende*r), Primus, P. (Vortragende*r), Lewandowski, M. (Vortragende*r), Widmer, G. (Vortragende*r) & Eghbal-Zadeh, H. (Vortragende*r)
26 Apr. 2020Aktivität: Vortrag oder Präsentation › Anderer Vortrag oder Präsentation › Science-to-science
-
Exploiting Parallel Audio Recordings to Enforce Device Invariance in CNN-based Acoustic Scene Classification
Primus, P. (Vortragende*r)
25 Okt. 2019Aktivität: Vortrag oder Präsentation › Vortrag nach Bewerbung und Auswahl › Science-to-science