Ingo Siegert
Jun.-Prof. Dr.-Ing. Ingo Siegert
Institut für Informations- und Kommunikationstechnik (IIKT)
Vitae
since 11/2018 | Assistant Professor for Mobile Dialogsystems at the Institute for Information Technology and Communications University Magdeburg |
04/2015 - 10/2018 | Post-doctoral researcher at the Cognitive Systems Group |
03/2015 | Graduation (Dr.-Ing.) Title of PhD-Thesis: Emotional and User-Specific Cues for Improved Analysis of Naturalistic Interactions Otto-von-Guericke-Universität Magdeburg |
07/2009-03/2015 | Research asistant at the Cognitive Systems Group within the project SFB/TRR 62 |
05/2009 | Diploma in Engineering Sciences title of Diploma thesis: Implementierung einer Sprecherverifikation für ein generisches Telefon-Dialogsystem |
9/2006 - 05/2009 |
Student Assistant at the Cognitive Systems Group |
10/2007 - 03/2008 |
Internship at IBM Deutschland Entwicklung GmbH Department WebSphere VoiceServer Language Development |
10/2003-05/2009 |
Study of information technology at the Otto-von-Guericke-University Magdeburg Beginn des Studiums der Informationstechnologie an der Otto-von-Guericke-Universität Magdeburg |
06/2003 | Acquisition of the general higher education entrance qualification at the Gymnasium Stadtfeld Wernigerode |
Dissertation
Emotional and User-Specific Cues for Improved Analysis of Naturalistic Interactions. Otto-von-Guericke-Universität Magdeburg, 2015
Research Interests
Speech-Processing, Addressee-detection, Dialog-design, Speech-signal processing, Speech coding, Human-Machine-Interaction, Modelling of User's mood or intention, speakergroups and emotions
Memberships
Institute of Electrical and Electronics Engineers (IEEE)
Usability in Germany (UiG)
2024
Abstract
Students’ readiness to adopt GenAI in their learning and ethical considerations – An international comparative study
Dettmer, Sandra; Eisenbardt, Monika; Eisenbardt, Tomasz; Gafni, Ruti; Gal, Eran; Kurtz, Gila; Leiba, Moshe; Mullins, Roisin; Siegert, Ingo
In: KM Conference 2024 - International Institute for Applied Knowledge Management, S. 28 [Konferenz: KM Conference 2024, Warsaw, Poland, 03.-06. July 2024]
Voice interaction in motion - eaasy vui and physical exertion
Busch, Matthias; Long, Nguyen; Siegert, Ingo
In: 2. Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : 5. März, 2024, Regensburg - Regensburg : OTH ; Baumann, Timo, S. 20-21 [Workshop: 2. ITG-Workshop Sprachassistenten – Anwendungen, Implikationen, Entwicklungen, Regensburg, 5. März 2024]
First steps into aspire - a pilot study on automated speech analysis regarding psychotherapeutic alliance in psychotherapies
Schubert, Martha; Schenk, Michael; Krüger, Julia; Elgner, Melanie; Junne, Florian; Siegert, Ingo
In: 2. Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : 5. März, 2024, Regensburg - Regensburg : OTH ; Baumann, Timo, S. 22-23 [Workshop: 2. ITG-Workshop Sprachassistenten – Anwendungen, Implikationen, Entwicklungen, Regensburg, 5. März 2024]
Book chapter
Anonymising elderly and pathological speech - voice conversion using DDSP and query-by-example
Ghosh, Suhita; Jouaiti, Melanie; Das, Arnab; Sinha, Yamini; Polzehl, Tim; Siegert, Ingo; Stober, Sebastian
In: Interspeech 2024 - International Speech and Communication Association, S. 4438-4442 [Konferenz: Interspeech 2024, Kos, Greece, 1-5 September 2024]
Challenges of German speech recognition - a study on multi-ethnolectal speech among adolescents
Schubert, Martha; Duran, Daniel; Siegert, Ingo
In: Interspeech 2024 - International Speech and Communication Association, S. 3045-3049 [Konferenz: Interspeech 2024, Kos, Greece, 1-5 September 2024]
Development of an automated, rule-based measurement method for easy language and its application to aI-generated texts
Siegert, Ingo; Al-Hamad, Ahmad; Pongratz, Katharina Maria; Busch, Matthias
In: HCI International 2024 Posters , 1st ed. 2024. - Cham : Springer Nature Switzerland ; Stephanidis, Constantine, S. 234-244 - (Communications in computer and information science; volume 2120) [Konferenz: 26th International Conference on Human-Computer Interaction, HCII 2024, Washington, DC, USA, June 29 – July 4, 2024]
Embarking on inclusive voice user interfaces - initial steps in exploring technology integration within the Seminar ‘AI and Educational Sciences’
BUsch, Matthias; Ibs, Robin; Siegert, Ingo
In: Universal Access in Human-Computer Interaction , 1st ed. 2024. - Cham : Springer Nature Switzerland ; Antona, Margherita, S. 35-50 - (Lecture notes in computer science; volume 14696) [Konferenz: 18th International Conference on Universal Access in Human-Computer Interaction, UAHCI 2024, Washington, DC, USA, June 29 – July 4, 2024]
Safeguarding speech content style - enhancing privacy beyond speaker identity
Sinha, Yamini; Raivakhovskyi, Mykola; Schubert, Martha; Siegert, Ingo
In: 4th Symposium on Security and Privacy in Speech Communication - Kos, Greece, 6 September 2024 - International Speech Communication Association ; Siegert, Ingo, S. 92-101 [Symposium: 4th Symposium on Security and Privacy in Speech Communication, Kos, Greece, 6 September 2024]
Review of usage and potentials of conversational interfaces at universities and in students' daily lives
Kisser, Lea; Busch, Matthias; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2024 / Rue , Mitch - Dresden : TUDpress ; Rue, Mitch, S. 38-45 - (Studientexte zur Sprachkommunikation; 107) [Konferenz: 35. Konferenz „Elektronische Sprachsignalverarbeitung”, Regensburg, 6.-8. März 2024]
Speech recognition errors in ASR engines and their impact on linguistic analysis in psychotherapies
Schubert, Martha; Sinha, Yamini; Krüger, Julia; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2024 / Rue , Mitch - Dresden : TUDpress ; Rue, Mitch, S. 203-210 - (Studientexte zur Sprachkommunikation; 107) [Konferenz: 35. Konferenz „Elektronische Sprachsignalverarbeitung”, Regensburg, 6.-8. März 2024]
Evaluation of audio deepfakes - systematic review
Sinha, Yamini; Hintz, Jan; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2024 / Rue , Mitch - Dresden : TUDpress ; Rue, Mitch, S. 181-187 - (Studientexte zur Sprachkommunikation; 107) [Konferenz: 35. Konferenz „Elektronische Sprachsignalverarbeitung”, Regensburg, 6.-8. März 2024]
AnonEmoFace - emotion preserving facial anonymization
Hintz, Jan; Rühe, Jacob; Siegert, Ingo
In: Proceedings of the 10th International Conference on Information Systems Security and Privacy, Volume 1 - Setúbal : SciTePress - Science and Technology Publications, Lda. ; Lenzini, Gabriele . - 2024, S. 785-788 [Konferenz: 10th International Conference on Information Systems Security and Privacy, Rome, Italy, February 26-28, 2024]
CommonBench - a larger scale speaker verification benchmark
Hintz, Jan; Siegert, Ingo
In: 4th Symposium on Security and Privacy in Speech Communication - Kos, Greece, 6 September 2024 - International Speech Communication Association ; Siegert, Ingo, S. 17-20 [Symposium: 4th Symposium on Security and Privacy in Speech Communication, Kos, Greece, 6 September 2024]
Editor
2. Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : 5. März, 2024, Regensburg
Baumann, Timo; Siegert, Ingo
In: Regensburg: OTH, 2024, 1 Online Ressource (IV, 28 Seiten) Kongress: ITG-Workshop "Sprachassistenten : Anwendungen, Implikationen, Entwicklungen" 2 Regensburg 2024.04.11
4th Symposium on Security and Privacy in Speech Communication - Kos, Greece, 6 September 2024
Siegert, Ingo; Williams, Jennifer; Das, Sneha; Tomashenko, Natalia
In: International Speech Communication Association, 2024, 1 Online-Ressource Kongress: ISCA Symposium on Security and Privacy in Speech Communication 4 Kos, Greece 2024.09.06
2023
Abstract
Emotionswahrnehmung sprachkodierter Sätze bei Nutzern von Cochlea-Implantaten
Koyutürk, Ece; Siegert, Ingo; Verhey, Jesko L.; Böckmann-Barthel, Martin
In: 25. Jahrestagung der Deutschen Gesellschaft für Audiologie / Deutsche Gesellschaft für Audiologie , 2023 - German Medical Science, GMS, insges. 2 S. [Tagung: 25. Jahrestagung der Deutschen Gesellschaft für Audiologie, Köln, 01.03. - 03.03.2023]
Other materials
Evaluating state-of-the-art speech recognition systems with focus on low resource languages
Sinha, Yamini; Silber-Varod, Yered; Siegert, Ingo
In: KM Conference 2023 - International Institute for Applied Knowledge Management , 2023, S. 41
Book chapter
AI Engineering als interdisziplinäres Einführungsmodul zwischen Künstlicher Intelligenz und Ingenieurwesen
Lang, Sebastian; Siegert, Ingo; Artiushenko, Viktor; Schleiss, Johannes
In: Informatik 2023 - Berlin : Gesellschaft für Informatik e.V. ; Klein, Maike, S. 381-384 - (GI-Edition. Proceedings; volume P-337) [Tagung: Informatik 2023, Berlin, 26. - 29. September 2023]
Cross-reliability benchmark test for preserving emotional content in speech-synthesis related datasets
Hintz, Jan; Wendemuth, Andreas; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2023 / Konferenz Elektronische Sprachsignalverarbeitung , 2023 - Dresden : TUDpress ; Draxler, Christoph *1960-*, S. 64-72 - (Studientexte zur Sprachkommunikation; 105)
Die Chatbot-Challenge - spielend mit KI von der Idee zum Dialogsystem
Siegert, Ingo; Hillmann, Stefan; Kowol, Philline T.; Busch, Matthias; Nehring, Jan; Klinge, Xenia
In: Informatik 2023 - Berlin : Gesellschaft für Informatik e.V. ; Klein, Maike, S. 377-380 - (GI-Edition. Proceedings; volume P-337)
Presenting a German dataset of wake words - first analyses and comparison of different solutions for speech-based activation techniques
Busch, Matthias; Sinha, Yamini; Hintz, Jan; Wendemuth, Andreas; Siegert, Ingo
In: DAGA 2023 - Berlin : Deutsche Gesellschaft für Akustik e.V., S. 1478-1481
Radlogistik als Anwendungsgebiet für Digitale Sprachassistenten - ein Diskussionsbeitrag
Busch, Matthias; Kania, Malte; Assmann, Tom; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2023 / Konferenz Elektronische Sprachsignalverarbeitung , 2023 - Dresden : TUDpress ; Draxler, Christoph *1960-*, S. 223-230 - (Studientexte zur Sprachkommunikation; 105)
Anonymization of stuttered speech - removing speaker information while preserving the utterance
Hintz, Jan; Bayerl, Sebastian; Sinha, Yamini; Ghosh, Suhita; Schubert, Martha; Stober, Sebastian; Riedhammer, Korbinian; Siegert, Ingo
In: 3rd Symposium on Security and Privacy in Speech Communication - Internatinal Speech Communication Association ; Siegert, Ingo . - 2023, S. 41-45 [Symposium: 3rd Symposium on Security and Privacy in Speech Communication, Dublin, Ireland, 19 August 2023]
Voice assistants for therapeutic support - a literature review
Siegert, Ingo; Busch, Matthias; Metzner, Susanne; Krüger, Julia
In: Design, Operation and Evaluation of Mobile Communications , 1st ed. 2023. - Cham : Springer Nature Switzerland ; Salvendy, Gavriel, S. 221-239 - (Lecture notes in computer science; volume 14052)
User perspective on anonymity in voice assistants
Haase, Matthias; Krüger, Julia; Siegert, Ingo
In: Design, Operation and Evaluation of Mobile Communications , 1st ed. 2023. - Cham : Springer Nature Switzerland ; Salvendy, Gavriel, S. 156-166 - (Lecture notes in computer science; volume 14052)
“What can I study at OVGU?” - an analysis of the applicability of conversational voice assistants in student advisory service
Busch, Matthias; Böhm, Felix; Siegert, Ingo
In: Design, Operation and Evaluation of Mobile Communications , 1st ed. 2023. - Cham : Springer Nature Switzerland ; Salvendy, Gavriel, S. 144-155 - (Lecture notes in computer science; volume 14052)
Improving voice conversion for dissimilar speakers using perceptual losses
Gosh, Suhita; Sinha, Yamini; Siegert, Ingo; Stober, Sebastian
In: DAGA 2023 , 2023 - Berlin : Deutsche Gesellschaft für Akustik e.V., S. 1358-1361 [Tagung: 49. Jahrestagung für Akustik, DAGA 2023, Hamburg, 06. - 09. März 2023]
Impact of pathological speech on speaker anonymization - a proof of concept
Hintz, Jan; Sinha, Yamini; Bayerl, Sebastian P.; Riedhammer, Korbinian; Siegert, Ingo
In: DAGA 2023 - Berlin : Deutsche Gesellschaft für Akustik e.V., S. 1470-1473
Peer-reviewed journal article
Emo-StarGAN - a semi-supervised any-to-many non-parallel emotion-preserving voice conversion
Ghosh, Suhita; Das, Arnab; Sinha, Yamini; Siegert, Ingo; Polzehl, Tim; Stober, Sebastian
In: Interspeech 2023 - International Speech and Communication Association ; Harte, Naomi, S. 2093-2097 [Konferenz: INTERSPEECH 2023, Dublin, Ireland, 20-24 August 2023]
A digital ”flat affect”? - popular speech compression codecs and their effects on emotional prosody
Siegert, Ingo; Niebuhr, Oliver
In: Frontiers in communication - Lausanne : Frontiers Media, Bd. 8 (2023), Artikel 972182
Editor
3rd Symposium on Security and Privacy in Speech Communication - Dublin, Ireland, 19 August 2023
Siegert, Ingo; Williams, Jennifer L.; Das, Sneha
In: International Speech Communication Association, 2023, 1 Online Ressource Kongress: ISCA Symposium on Security and Privacy in Speech Communication 3 Dublin, Ireland 2023.08.19
2022
Abstract
Der sprachliche Emotionsausdruck von Patient*innen mit Anorexia nervosa - eine systematische Literaturrecherche
Korbanka, Tatjana A.; Siegert, Ingo; Junne, Florian; Krüger, Julia
In: Zeitschrift für psychosomatische Medizin und Psychotherapie - Göttingen: Vandenhoeck & Ruprecht, 1999, Bd. 68 (2022), 2, S. 180-181
A preliminary study on voice-assisted interfaces in the German public administration
Jokisch, Oliver; Brauner, Kurt; Siegert, Ingo
In: Konferenz: KM Conference 2022, Ljubljana, Slovenia, 29 June - 2 July 2022, KM Conference 2022 - International Institute for Applied Knowledge Management, S. 42
Book chapter
The influence of different room acoustics and microphone distances on charismatic prosodic parameters
Siegert, Ingo; Niebuhr, Oliver
In: Fortschritte der Akustik - DAGA 2022 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2022, S. 1193-1196
DyCoDa - a multi-modal data collection of multi-user remote survival game recordings
Dresvyanskiy, Denis; Sinha, Yamini; Busch, Matthias; Siegert, Ingo; Karpov, Alexey; Minker, Wolfgang
In: Konferenz: 24th International Conference on Speech and Computer, SPECOM 2022, Gurugram, India, November 14-16, 2022, Speech and Computer - Cham: Springer International Publishing; Prasanna, S. R. Mahadeva . - 2022, S. 163-177 - (Lecture notes in computer science; volume 13721)
Voice Privacy - leveraging multi-scale blocks with ECAPA-TDNN SE-Res2NeXt extension for speaker anonymization
Khamsehashari, Razieh; Sinha, Yamini; Hintz, Jan; Ghosh, Suhita; Polzehl, Tim; Franzreb, Carlos; Stober, Sebastian; Siegert, Ingo
In: 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022 - Internatinal Speech Communication Association ; Siegert, Ingo, S. 43-48 [Symposium: 2nd Symposium on Security and Privacy in Speech Communication, Incheon, Korea, 23-24 September 2022]
Why Eli Roth should not use TTS-Systems for anonymization
Sinha, Yamini; Hintz, Jan; Busch, Matthias; Polzehl, Tim; Haase, Matthias; Wendemuth, Andreas; Siegert, Ingo
In: 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022 - Internatinal Speech Communication Association ; Siegert, Ingo, S. 17-22
Music-guided imagination and digital voice assistant - study design and first results on the application of voice assistants for music-guided stress reduction
Siegert, Ingo; Busch, Matthias; Metzner, Susanne; Junne, Florian; Krüger, Julia
In: Konferenz: 24th International Conference on Human-Computer Interaction, HCII 2022, Virtual Event, June 26 July 1, 2022, Design, Operation and Evaluation of Mobile Communications - Cham: Springer International Publishing; Salvendy, Gavriel . - 2022, S. 347-362 - (Lecture notes in computer science; volume 13337)
Performance and quality evaluation of a McAdams speaker anonymization for spontaneous German speech
Sinha, Yamini; Siegert, Ingo
In: Fortschritte der Akustik - DAGA 2022 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2022, S. 1185-1188
The effect of room acoustics and channel coding on affective computing in far field speech interaction
Siegert, Ingo; Niebuhr, Oliver; Gottschalk, Martin; Jokisch, Oliver
In: DAGA 2022 - Berlin : Deutsche Gesellschaft für Akustik e.V., S. 74-77
Emotion preservation for one-shot speaker anonymization using McAdams
Sinha, Yamini; Wendemuth, Andreas; Siegert, Ingo
In: Konferenz: 33. Konferenz "Elektronische Sprachsignalverarbeitung", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022 - Dresden: TUDpress; Weston, Heather . - 2022, S. 235-242 - (Studientexte zur Sprachkommunikation; 103)
"High on emotion"? - how audio codecs interfere with the perceived charisma and emotional states of men and women
Niebuhr, Oliver; Siegert, Ingo
In: Konferenz: 33. Konferenz "Elektronische Sprachsignalverarbeitung", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022/ Konferenz Elektronische Sprachsignalverarbeitung - Dresden: TUDpress; Weston, Heather . - 2022, S. 243-252 - (Studientexte zur Sprachkommunikation; 103)
Erroneous reactions of voice assistants "In the Wild" - first analyses
Kisser, Lea; Siegert, Ingo
In: Konferenz: 33. Konferenz "Elektronische Sprachsignalverarbeitung", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022 - Dresden: TUDpress; Weston, Heather . - 2022, S. 113-120 - (Studientexte zur Sprachkommunikation; 103)
Improving the accuracy for voice-assistant conversations in German by combining different online ASR-API outputs
Sinha, Yamini; Siegert, Ingo
In: Konferenz: Human Perspectives on Spoken Human-Machine Interaction, Freiburg im Breisgau (online), 15.-17. November 2021, Proceedings of the conference Human Perspectives on Spoken Human-Machine Interaction - Freiburg: FRIAS, Freiburg Institute for Advanced Studies, Albert-Ludwigs-Universität; Warchhold, Sarah *1994-* . - 2022, S. 11-16
Peer-reviewed journal article
Acoustic-based automatic addressee detection for technical systems - a review
Siegert, Ingo; Weißkirchen, Norman; Wendemuth, Andreas
In: Frontiers in computer science - Lausanne : Frontiers Media, Bd. 4 (2022), Artikel 831784, insges. 20 S.
Künstliche Intelligenz für die Sprachanalyse in der Psychotherapie - Chancen und Risiken - Artificial intelligence for speech analysis in psychotherapy - chances and risks
Krüger, Julia; Siegert, Ingo; Junne, Florian
In: Psychotherapie, Psychosomatik, medizinische Psychologie - Stuttgart [u.a.]: Thieme, Bd. 72 (2022), 9/10, S. 395-396
Handling of unknown unknowns - classification of 3D geometries from CAD open set datasets using Convolutional Neural Networks
Schmidt, Georg; Stüring, Stefan; Richnow, Norman; Siegert, Ingo
In: The Online Journal of Applied Knowledge Management - [S.l.]: [s.n.], Bd. 10 (2022), 1, S. 62-76
Editor
Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022)
Rigault, Mickael; Arranz, Victoria; Siegert, Ingo
In: Paris: European Language Resources Association (ELRA), 2022, 1 Online-RessourceKongress: Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (Marseille : 2022.06.20)
2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022
Siegert, Ingo; Tomashenko, Natalia; Williams, Jennifer
In: Internatinal Speech Communication Association, 2022, 1 Online-RessourceKongress: ISCA Symposium on Security and Privacy in Speech Communication 2 (virtual : 2022.09.23-24)
Article in conference proceedings
Pseudonymisation of speech data as an alternative approach to GDPR aompliance
Kamocki, Pawel; Siegert, Ingo
In: Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022) - Paris: European Language Resources Association (ELRA); Rigault, Mickaël . - 2022, S. 17-21
Public interactions with voice assistant - discussion of different one-shot solutions to preserve speaker privacy
Siegert, Ingo; Sinha, Yamini; Winkelmann, Gino; Jokisch, Oliver; Wendemuth, Andreas
In: Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022) - Paris : European Language Resources Association (ELRA) ; Rigault, Mickaël, S. 44-47
2021
Book chapter
Audio and Video Processing of UAV-Based Signals in the Harmonic Project
Jokisch, Oliver; Strutz, Tilo; Leipnitz, Alexander; Siegert, Ingo; Ronzhin, Abdrey
In: Elektronische Sprachsignalverarbeitung 2021 / Konferenz Elektronische Sprachsignalverarbeitung , 2021 - Dresden : TUDpress, S. 77-86 [32. Konferenz Elektrische Sprachsignalverarbeitung 2021, Berlin, 3. - 5. März 2021]
Speech melody and speech content didnt fit together - differences in speech behavior for device directed and human directed interactions
Siegert, Ingo; Krüger, Julia
In: Advances in Data Science: Methodologies and Applications - Cham: Springer International Publishing; Phillips-Wren, Gloria . - 2021, S. 65-95 - (Intelligent Systems Reference Library; volume 189)
Introduction to the workshop
Carolus, Astrid; Wienrich, Carolin; Siegert, Ingo
In: 1st AI-DEbate Workshop: workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021/ AI-Debate Workshop - Magdeburg: Universitätsbibliothek; Carolus, Astrid *1982-* . - 2021, S. 9-11
Engagement recognition using audio channel only
Dresvyanskiy, Denis; Siegert, Ingo; Karpov, Alexei; Minker, Wolfgang
In: 1st AI-DEbate Workshop: workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021/ AI-Debate Workshop - Magdeburg: Universitätsbibliothek; Carolus, Astrid *1982-* . - 2021, S. 19-22
Effects of prosodic variations on accidental triggers of a commercial voice assistant
Siegert, Ingo
In: Interspeech 2021: Brno, Czechia, 30 August - 3 September 2021$dGeneral chairs: Hynek Heřmanský, Honza Černocký : Technical chairs: Lukáš Burget, Lori Lamel, Odette Scharenborg, Petr Motlicek - International Speech and Communication Association; Heřmanský, Hynek . - 2021, S. 1674-1678
Studie zur Lösbarkeit des Problems starker Pegelschwankungen im Home-Entertainment
Schmidt, Georg; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2021 / Konferenz Elektronische Sprachsignalverarbeitung , 2021 - Dresden : TUDpress, S. 303-310 [32. Konferenz Elektrische Sprachsignalverarbeitung 2021, Berlin, 3. - 5. März 2021]
Speech Signal Compression Deteriorates Acoustic Cues to Perceived Speaker Charisma
Siegert, Ingo; Niebuhr, Oliver
In: Elektronische Sprachsignalverarbeitung 2021 / Konferenz Elektronische Sprachsignalverarbeitung , 2021 - Dresden : TUDpress, S. 1-10 [32. Konferenz Elektrische Sprachsignalverarbeitung 2021, Berlin, 3. - 5. März 2021]
Peer-reviewed journal article
Admitting the addressee detection faultiness of voice assistants to improve the activation performance using a continuous learning framework
Siegert, Ingo; Weißkirchen, Norman; Krüger, Julia; Akhtiamov, Oleg; Wendemuth, Andreas
In: Cognitive systems research - Amsterdam [u.a.] : Elsevier Science, Bd. 70 (2021), S. 65-79
Case report: women, be aware that your vocal charisma can dwindle in remote meetings
Siegert, Ingo; Niebuhr, Oliver
In: Frontiers in communication - Lausanne : Frontiers Media - Volume 5(2021), article 611555, 7 Seiten
A cross-language study of speech recognition systems for English, German, and Hebrew
Silber Varod, Vered; Siegert, Ingo; Jokisch, Oliver; Sinha, Yamini; Geri, Nitza
In: The Online Journal of Applied Knowledge Management - [Erscheinungsort nicht ermittelbar] : [Verlag nicht ermittelbar], Bd. 9 (2021), Heft 1, insges. 15 S.
Editor
Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication
Siegert, Ingo; Markert, Karla
In: Internatinal Speech Communication Association, 2021, 1 Online-Ressource (88 Seiten)Kongress: ISCA Symposium on Security and Privacy in Speech Communication 1 (virtual : 2021.11.10-12)
1st AI-DEbate Workshop - workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021
Carolus, Astrid; Wienrich, Carolin; Siegert, Ingo
In: Magdeburg: Universitätsbibliothek, 2021, 1 Online-Ressource (42 Seiten, 1,03 MB)Kongress: AI-Debate Workshop 1 (Magdeburg : 2021.09.27)
Article in conference proceedings
Experience with an online assessment in a lecture about fundamentals of electrical engineering
Magdowski, Mathias; Siegert, Ingo
In: Higher Education 2021 - Bari: Higher Education . - 2021, insges. 5 S.
How to collect speech data with human rights in mind - workshop at the SPSC
Backstrom, Tom; Nautsch, Andreas; Markert, Karla; Siegert, Ingo
In: Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication - Internatinal Speech Communication Association; Siegert, Ingo . - 2021, S. 80-82
Speaker anonymization solution for public voice-assistant interactions - presentation of a work in progress development
Siegert, Ingo
In: Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication - Internatinal Speech Communication Association . - 2021, S. 80-82
2020
Abstract
Intelligent LSF-answering system - an Alexa Skill
Kuzhipathalil, Adarsh; Thomas, Anto; Chand, Keerthana; Siegert, Ingo
In: Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]: Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]/ Workshop Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook] - Anwendungen, Implikationen, Entwicklungen - Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020; Siegert, Ingo . - 2020, S. 39
das ist schon gruselig so dieses Belauschtwerden - subjektives Erleben von Interaktionen mit Sprachassistenzsystemen zum Zwecke der Individualisierung
Krüger, Julia; Siegert, Ingo
In: Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]/ Workshop Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook] - Anwendungen, Implikationen, Entwicklungen - Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020; Siegert, Ingo . - 2020, S. 29
Book chapter
Utilizing computer vision algorithms to detect and describe local features in images for emotion recognition from speech
Weißkirchen, Norman; Reddy, Mainampati Vasudeva; Wendemuth, Andreas; Siegert, Ingo
In: Proceedings of the 2020 IEEE International Conference on Human-Machine Systems (ICHMS): Sept 7-9, 2020, Rome, Italy/ IEEE International Conference on Human-Machine Systems - [Piscataway, NJ]: IEEE; Weibkirchen, Norman . - 2020, insges. 6 S.
Advances in sound and speech signal processing at the presence of drones
Jokisch, Oliver; Siegert, Ingo
In: Quiet Drones , 2020 - INCE Europe ; Quiet Drones (Veranstaltung:2020), insges. 17 S.
Alexa in the wild - collecting unconstrained conversations with a modern voice assistant in a public environment
Siegert, Ingo
In: LREC 2020 / International Conference on Language Resources and Evaluation , 2020 - Paris : European Language Resources Association, ELRA ; Calzolari, Nicoletta, S. 608-612
Reduction of aircraft noise in UAV-based speech signal recordings by quantile based noise estimation
Lösch, Enrico; Jokisch, Oliver; Leipnitz, Alexander; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2020 - Dresden : TUDpress, S. 149-156 - (Studientexte zur Sprachkommunikation; 95)
Emergency Service - Sprachbasierte Klassifikation eingehender Anrufe in Ausnahmesituationen
Petersen, Marcus; Niedrist, Karl-Heinz; Busch, Matthias; Marquardt, Florian; Siegert, Ingo
In: Konferenz: 31. Konferenz "Elektronische Sprachsignalverarbeitung", Magdeburg, 4.-6. März 2020, Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress; Wendemuth, Andreas . - 2020, S. 206-213 - (Studientexte zur Sprachkommunikation; 95)
Does users' system evaluation influence speech behavior in HCI? - first insights from the engineering and psychological perspective
Siegert, Ingo; Busch, Matthias; Krüger, Julia
In: Konferenz: 31. Konferenz "Elektronische Sprachsignalverarbeitung", Magdeburg, 4.-6. März 2020, Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress . - 2020, S. 241-248 - (Studientexte zur Sprachkommunikation; 95)
Recognition performance of selected speech recognition APIs - a longitudinal study
Siegert, Ingo; Sinha, Yamini; Jokisch, Oliver; Wendemuth, Andreas
In: Speech and Computer - Cham : Springer ; Karpov, Alexey . - 2020, S. 520-529 - ( Lecture notes in computer science; 12335)
Improving automatic speech recognition utilizing audio-codecs for data augmentation
Hailu, Nirayo; Siegert, Ingo; Nürnberger, Andreas
In: IEEE 22nd International Workshop on Multimedia Signal Processing / IEEE International Workshop on Multimedia Signal Processing , 2020 - [Piscataway, NJ] : IEEE [Workshop: IEEE 22nd International Workshop on Multimedia Signal Processing, MMSP, Tampere, Finland, 21-24 Sept. 2020]
GDPR - a game changer for acoustic interaction analyses
Siegert, Ingo; Silber-Varod, Vered; Kamocki, Pawel
In: Proceedings of the LREC 2020 Workshop on Legal and Ethical Issues in Human Language Technologies (LEGAL2020) - proceedings: proceedings - Paris: European Language Resources Association (ELRA); Choukri, Khalid . - 2020, S. 1-3
Prosodic addressee-detection - ensuring privacy in always-on spoken dialog systems
Baumann, Timo; Siegert, Ingo
In: Mensch und Computer 2020 - Tagungsband - New York, New York: The Association for Computing Machinery, Inc. . - 2020, S. 195-198
Filtering-based analysis of spectral and temporal effects of room modes on low-level descriptors of emotionally coloured speech
Gottschalk, Martin; Höbel-Müller, Juliane; Siegert, Ingo; Verhey, Jesko L.; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2020 - Dresden : TUDpress ; Wendemuth, Andreas, S. 219-226 - (Studientexte zur Sprachkommunikation; 95) [Konferenz: 31. Konferenz "Elektronische Sprachsignalverarbeitung", Magdeburg, 4.-6. März 2020]
Investigation of the influence of standing waves on distant speech emotion recognition
Höbel-Müller, Juliane; Siegert, Ingo; Gottschalk, Martin; Heinemann, Ralph; Wendemuth, Andreas
In: Fortschritte der Akustik - DAGA 2020 - Berlin : Deutsche Gesellschaft für Akustik e.V. (DEGA), S. 822-825 [Konferenz: DAGA 2020, Hannover, 16.-19. März 2020]
Speech communication at the presence of unmanned aerial vehicles
Jokisch, Oliver; Lösch, Enrico; Siegert, Ingo
In: Fortschritte der Akustik - DAGA 2020 - Berlin : Deutsche Gesellschaft für Akustik e.V. (DEGA), S. 952-955
An analysis of the applicability of VoiceXML as basis for a dialog control flow in industrial interaction management
Böhm, Felix; Siegert, Ingo; Belyaev, Alexander; Diedrich, Christian
In: 2020 25th IEEE International Conference on Emerging Technologies and Factory Automation (ETFA): proceedings : Vienna, Austria - hybrid, 08-11 September, 2020/ IEEE International Conference on Emerging Technologies and Factory Automation - Piscataway, NJ: IEEE; IEEE International Conference on Emerging Technologies and Factory Automation (25.:2020) . - 2020, S. 30-37
Peer-reviewed journal article
Using complexity-identical human- and machine-directed utterances to investigate addressee detection for spoken dialogue systems
Akhtiamov, Oleg; Siegert, Ingo; Karpov, Alexey; Minker, Wolfgang
In: Sensors - Basel: MDPI, Volume 20(2020), issue 9, article 2740, 15 Seiten
Personal data protection and academia: GDPR issues and multi-modal data-collections "in the wild"
Siegert, Ingo; Silber-Varod, Vered; Carmi, Nehoray; Kamocki, Pawel
In: The Online Journal of Applied Knowledge Management: OJAKM - [S.l.], Bd. 8 (2020), 1, S. 16-31
Editor
Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020
Wendemuth, Andreas; Böck, Ronald; Siegert, Ingo
In: Dresden: TUDpress, 2020, XI, 288 Seiten, Illustrationen, Diagramme, 24 cm x 17 cm - (Studientexte zur Sprachkommunikation; Band 95)
Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]
Siegert, Ingo; Möller, Sebastian
In: Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020, 1 Online-Ressource (39 Seiten, 0,3 MB)Kongress: ITG-Workshop "Sprachassistenten : Anwendungen, Implikationen, Entwicklungen" (Magdeburg : 2020.03.03)
Proceedings of the LREC 2020 Workshop on Legal and Ethical Issues in Human Language Technologies (LEGAL2020) - proceedings
Choukri, Khalid; Linden, Kirster; Rigault, Mickael; Siegert, Ingo
In: Paris: European Language Resources Association (ELRA), 2020, 1 Elektronische RessourceKongress: Workshop on Legal and Ethical Issues in Human Language Technologies 12 (Marseille : 2020.05.11)
2019
Abstract
Admitting the addressee-detection faultiness to improve the performance using a continous learning framework
Siegert, Ingo; Weißkirchen, Norman; Wendemuth, Andreas
In: 8. Interdisziplinärer Workshop Kognitive Systeme: Verstehen, Beschreiben und Gestalten Kognitiver (Technischer) Systeme - Duisburg: Universität Duisburg-Essen, S. 38-39, 2019
Book chapter
Anticipating the user - acoustic disposition recognition in intelligent interactions
Böck, Ronald; Egorow, Olga; Höbel-Müller, Juliane; Requardt, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Innovations in big data mining and embedded knowledge - Cham, Switzerland: Springer, 2019; Esposito, Anna . - 2019, S. 203-233 - (Intelligent systems reference library; volume 159)
Analysis of the influence of different room acoustics on acoustic emotion features and emotion recognition performance
Höbel-Müller, Juliane; Siegert, Ingo; Heinemann, Ralph; Requardt, Alicia Flores; Tornow, Michael; Wendemuth, Andreas
In: Tagungsband - DAGA 2019 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA), 2019 . - 2019, S. 886-889[Tagung: 45. Jahrestagung für Akustik, DAGA 2019, 18.-21. März 2019, Rostock]
Threes a crowd? - effects of a second human on vocal accommodation with a voice assistant
Raveh, Eran; Siegert, Ingo; Steiner, Ingmar; Gessinger, Iona; Möbius, Bernd
In: Interspeech 2019 - International Speech and Communication Association; Kubin, Gernot . - 2019, S. 4005-4009
Cross-corpus data augmentation for acoustic addressee detection
Akhtiamov, Oleg; Siegert, Ingo; Karpov, Alexey; Minker, Wolfgang
In: 20th Annual Meeting of the Special Interest Group on Discourse and Dialogue/ Association for Computational Linguistics - Stroudsburg, PA: Association for Computational Linguistics (ACL); Nakamura, Satoshi . - 2019, S. 274-283
Don’t talk to noisy drones - acoustic interaction with unmanned aerial vehicles
Jokisch, Oliver; Siegert, Ingo; Maruschke, Michael; Strutz, Tilo; Ronzhin, Andrey
In: Speech and Computer / SPECOM , 2019 - Cham : Springer, S. 180-190 - (Lecture notes in artificial intelligence; 11658)
Analysis of the influence of different room acoustics on acoustic emotion features
Höbel-Müller, Juliane; Siegert, Ingo; Heinemann, Ralph; Requardt, Alicia Flores; Tornow, Michael; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.): Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2019 . - 2019, S. 156-163 - (Studientexte zur Sprachkommunikation; 93)[Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.), Dresden, 6.-8. März 2019]
The Restaurant Booking Corpus - content-identical comparative human-human and human-computer simulated telephone conversations
Siegert, Ingo; Nietzold, Jannik; Heinemann, Ralph; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2019 - Dresden: TUDpress, S. 126-133 - (Studientexte zur Sprachkommunikation; 93)[Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019, Dresden, 6.-8. März 2019]
Comparing phonetic changes in computer-directed and human-directed speech
Raveh, Eran; Steiner, Ingmar; Siegert, Ingo; Gessinger, Iona; Möbius, Bernd
In: Elektronische Sprachsignalverarbeitung 2019 - Dresden: TUDpress, S. 42-49 - (Studientexte zur Sprachkommunikation; 93)[Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019, Dresden, 6.-8. März 2019]
2018
Book chapter
Voice Assistant Conversation Corpus (VACC) - a multi-scenario dataset for addressee detection in human-computer-interaction using Amazon's ALEXA
Siegert, Ingo; Krüger, Julia; Egorow, Olga; Nietzold, Jannik; Heinemann, Ralph; Lotz, Alicia Flores
In: Proceedings of the LREC 2018 Workshop LB-ILR2018 and MMC2018 Joint Workshop, 7 May 2018, Miyazaki, Japan - Paris: European Language Resources Association, ELRA, 2018; Koiso, Hanae . - 2018, S. 51-54[Workshop: LREC 2018 Workshop LB-ILR2018 and MMC2018 Joint Workshop, Miyazaki, Japan, 7 May 2018]
Emotion recognition from disturbed speech - towards affective computing in real-world in-car environments
Lotz, Alicia Flores; Faller, Fabian; Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz "Elektronische Sprachsignalverarbeitung"- Dresden: TUDpress, 2018, S. 208-215[Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 214-215]
Improving emotion recognition performance by random-forest-based feature selection
Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Speech and computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018 : proceedings/ SPECOM - Cham: Springer, 2018 . - 2018, S. 134-144 - (Lecture notes in computer science; 11096; Lecture notes in artificial intelligence)[Konferenz: 20th International Conference Speech and Computer, SPECOM 2018, Leipzig, Germany, September 18-22, 2018]
Utilizing psychoacoustic modeling to improve speech-based emotion recognition
Siegert, Ingo; Lotz, Alicia Flores; Egorow, Olga; Wolff, Susann
In: Speech and computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018 : proceedings/ SPECOM - Cham: Springer, 2018 . - 2018, S. 625-635 - (Lecture notes in computer science; 11096; Lecture notes in artificial intelligence)[Konferenz: 20th International Conference Speech and Computer, SPECOM 2018, Leipzig, Germany, September 18-22, 2018]
Acoustic addressee-detection - analysing the impact of age, sex and technical knowledge
Siegert, Ingo; Tang, Shuran; Lotz, Alicia Flores
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018 / André Berton, Udo Haiber, Wolfgang Minker (Hrsg.) : Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2018 - Dresden : TUDpress , 2018, S. 113-120, Illustrations [Literaturverzeichnis: Seite 118-120; Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März]
Peer-reviewed journal article
An experimental paradigm for inducing emotions in a real world driving scenario evidence from self-report, annotation of speech data and peripheral physiology
Requardt, Alicia Flores; Wilbrink, Marc; Siegert, Ingo; Jipp, Meike; Wendemuth, Andreas; Ihme, Klas
In: Kognitive Systeme - Duisburg : DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen . - 2018, Heft 1, insges. 12 S.
Using a PCA-based dataset similarity measure to improve cross-corpus emotion recogniton
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Computer speech and language - London: Academic Press, 1986 . - 2018, insges. 31 S.
Using category theory to structure the OCC theory of emotions
Trujillo, Michael Olmos; Adamatti, Diana F.; Siegert, Ingo
In: Congreso Argentino de Ciencias de la Informática y Desarrollos de Investigación (CACIDI): 28 de noviembre al 30 de noviembre de 2018 - Piscataway, NJ: IEEE[Kongress: 2018 Congreso Argentino de Ciencias de la Informática y Desarrollos de Investigación, CACIDI, Ciudad Autónoma de Buenos Aires, Argentina, 28-30 November 2018]
How do we speak with ALEXA - subjective and objective assessments of changes in speaking style between HC and HH conversations
Siegert, Ingo; Krüger, Julia
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2018, 1, insges. 11 S.
2017
Book chapter
ikannotate2 - a tool supporting annotation of emotions in audio-visual data
Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 17-24[Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
Accelerating manual annotation of filled pauses by automatic pre-selection
Egorow, Olga; Lotz, Alicia Flores; Siegert, Ingo; Böck, Ronald; Krüger, Julia; Wendemuth, Andreas
In: 2017 International Conference on Companion Technology (ICCT): 11-13 Sept. 2017/ International Conference on Companion Technology - [Piscataway, NJ]: IEEE, 2017; International Conference on Companion Technology (2.:2017) . - 2017, insges. 6 S.[Konferenz: 2017 International Conference on Companion Technology (ICCT), Ulm, Germany, 11.-13. September 2017]
Modeling aspects in human-computer interaction - adaptivity, user characteristics and evaluation
Gossen, Tatiana; Siegert, Ingo; Nürnberger, Andreas; Hartmann, Kim; Kotzyba, Michael; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 57-58
Multi-modal information processing in companion-systems - a ticket purchase system
Siegert, Ingo; Schüssel, Felix; Schmidt, Miriam; Reuter, Stephan; Meudt, Sascha; Layher, Georg; Krell, Gerald; Hörnle, Thilo; Handrich, Sebastian; Al-Hamadi, Ayoub; Dietmayer, Klaus; Neumann, Heiko; Palm, Günther; Schwenker, Friedhelm; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 493-500
Comparative study on normalisation in emotion recognition from speech
Böck, Ronald; Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Intelligent human computer interaction / IHCI , 2017 - Cham : Springer ; Horain, Patrick, S. 189-201 - (Lecture Notes in Computer Science; 10688)
The last minute corpus as a research resource - from signal processing to behavioral analyses in user-companion interactions
Rösner, Dietmar; Frommer, Jörg; Wendemuth, Andreas; Bauer, Thomas; Günther, Stephan; Haase, Matthias; Siegert, Ingo
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 277-299
Multimodal affect recognition in the context of human-computer interaction for companion-systems
Schwenker, Friedhelm; Böck, Ronald; Schels, Martin; Meudt, Sascha; Siegert, Ingo; Glodek, Michael; Kächele, Markus; Schmidt-Wack, Miriam; Thiam, Patrick; Wendemuth, Andreas; Krell, Gerald
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 387-408
Emotion recognition from speech
Wendemuth, Andreas; Vlasenko, Bogdan; Siegert, Ingo; Böck, Ronald; Schwenker, Friedhelm; Palm, Günther
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 409-428
Audio compression and its impact on emotion recognition in affective computing
Lotz, Alicia Flores; Siegert, Ingo; Maruschke, Michael; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 1-8[Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
Improving speech-based emotion recognition by using psychoacoustic modeling and analysis-by-synthesis
Siegert, Ingo; Lotz, Alicia Flores; Egorow, Olga; Wendemuth, Andreas
In: Speech and Computer: 19th International Conference, SPECOM 2017, Hatfield, UK, September 12-16, 2017, Proceedings - Cham: Springer, 2017; Potapova, Rodmonga . - 2017, S. 445-455 - (Lecture Notes in Computer Science; 10458)[Konferenz: 19th International Conference Speech and Computer, SPECOM 2017, Hatfield, UK, September 12-16, 2017]
Acoustic cues for the perceptual assessment of surround sound
Siegert, Ingo; Jokisch, Oliver; Lotz, Alicia Flores; Trojahn, Franziska; Meszaros, Martin; Maruschke, Michael
In: Speech and Computer - Cham : Springer ; Potapova, Rodmonga . - 2017, S. 65-75 - (Lecture Notes in Computer Science; 10458)
Peer-reviewed journal article
Prediction of user satisfaction in naturalistic human-computer interaction
Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2017, 1, insges. 9 S.
2016
Book chapter
Discourse particles in human-human and human-computer interaction - Analysis and evaluation
Siegert, Ingo; Krüger, Julia; Haase, Matthias; Lotz, Alicia Flores; Günther, Stephan; Frommer, Jörg; Rösner, Dietmar; Wendemuth, Andreas
In: Human-Computer Interaction. Theory, Design, Development and Practice - Cham : Springer International Publishing ; Kurosu, Masaaki . - 2016, S. 105-117
Akustische Marker für eine verbesserte Situations- und Intentionserkennung von technischen Assistenzsystemen
Siegert, Ingo; Lotz, Alicia Flores; Egorow, Olga; Böck, Ronald; Schega, Lutz; Tornow, Michael; Thiers, Angelina; Wendemuth, Andreas
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen: Zweite Transdisziplinäre Konferenz : Hamburg 2016 - Hamburg: Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität$, S. 465-474[Kongress: 2. Transdisziplinäre Konferenz "Technische Unterstützungssysteme, die die Menschen wirklich wollen", Hamburg, 2016]
Kennzeichnung von Nutzerprofilen zur Interaktionssteuerung beim Gehen
Thiers, Angelina; Hamacher, Dennis; Tornow, Michael; Heinemann, Ralph; Siegert, Ingo; Wendemuth, Andreas; Schega, Lutz
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen / Transdisziplinäre Konferenz Technische Unterstützungssysteme, die die Menschen Wirklich Wollen , 2016 - Hamburg : Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität, S. 475-484
ERM4CT 2016: 2nd international workshop on emotion representations and modelling for companion systems (workshop summary)
Hartmann, Kim; Siegert, Ingo; Salah, Ali Albert; Truong, Khiet P.
In: Proceedings of the 18th ACM International Conference on Multimodal Interaction: November 12 - 16, 2016, Tokyo, Japan - New York, NY: ACM, S. 593-595[Kongress: 18th ACM International Conference on Multimodal Interaction, Tokyo, Japan, 12. - 16. November , 2016]
Emotion intelligibility within codec-compressed and reduced bandwidth speech
Siegert, Ingo; Lotz, Alicia Flores; Maruschke, Michael; Jokisch, Oliver; Wendemuth, Andreas
In: Speech communication / ITG-Fachtagung Sprachkommunikation , 2016 - Berlin : VDE Verlag, S. 215-219
Classification of functional-meanings of non-isolated discourse particles in human-human-interaction
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Human-Computer Interaction. Theory, Design, Development and Practice - Cham : Springer International Publishing ; Kurosu, Masaaki . - 2016, S. 53-64 - (Lecture Notes in Computer Science; 9731)
Multimodal information processing - the ticket purchase : a demonstration scenario of the SFB/TRR-62
Siegert, Ingo; Reuter, Stephan; Schüssel, Felix; Layer, Georg; Hörnle, Thilo; Meudt, Sascha; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2016; Jokisch, Oliver . - 2016, S. 111-118 - (Studientexte zur Sprachkommunikation; Band 81)[Kongress: 27. Konferenz Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch, Leipzig, 2. - 4. März 2016]
Measuring the impact of audio compression on the spectral quality of speech data
Siegert, Ingo; Lotz, Alicia Flores; Doung, Linh Linda; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2016 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2016 - Dresden : TUDpress, S. 229-236 - (Studientexte zur Sprachkommunikation; Band 81)
Peer-reviewed journal article
Comparison of different modeling techniques for robust prototype matching of speech pitch-contours
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, 1, insges. 10 S., 2016
Emotional and user-specific acoustic cues for improved analysis of naturalistic interactions
Siegert, Ingo
In: Künstliche Intelligenz: KI : Forschung, Entwicklung, Erfahrungen : Organ des Fachbereichs 1 Künstliche Intelligenz der Gesellschaft für Informatik e.V., GI - Berlin: Springer, Bd. 30.2016, 1, S. 93-94
Article in conference proceedings
Integrated health and fitness (iGF)-corpus - ten-modal highly synchronized subject-dispositional and emotional human machine interactions
Tornow, Michael; Krippl, Martin; Bade, Svea; Thiers, Angelina; Siegert, Ingo; Handrich, Sebastian; Krüger, Julia; Schega, Lutz; Wendemuth, Andreas
In: Kongress: MMC 2016, Portorož, 2016.05.24, Multimodal Corpora: Computer vision and language processing (MMC 2016) - ELRA, S. 21-24
2015
Book chapter
ERM4CT 2015: Workshop on Emotion Representations and Modelling for Companion Systems
Hartmann, Kim; Siegert, Ingo; Schuller, Björn; Morency, Louis-Philippe; Salah, Albert Ali; Böck, Ronald
In: Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies - New York, NY: ACM, 2015; Hartmann, Kim . - 2015, S. 1-2Kongress: ERM4CT'15 17 (Seattle, USA : 2015.11.09-13)
ERM4CT chairs' welcome
Hartmann, Kim; Siegert, Ingo; Schuller, Björn; Morency, Louis-Philippe; Salah, Albert Ali; Böck, Ronald
In: Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies - New York, NY : ACM ; Hartmann, Kim . - 2015, S. III
Emotion and disposition detection in medical machines - chances and challenges
Hartmann, Kim; Siegert, Ingo; Prylipko, Dmytro
In: Machine Medical Ethics - Cham: Springer, 2015; van Rysewyk, Simon Peter . - 2015, S. 317-339
Ein Datenset zur Untersuchung emotionaler Sprache in Kundenbindungsdialogen
Siegert, Ingo; Philippou-Hübner, David; Tornow, Michael; Heinemann, Ralph; Wendemuth, Andreas; Ohnemus, Kerstin; Fischer, Sarah; Schreiber, Gerald
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, S. 180-187 - (Studientexte zur Sprachkommunikation; 78)Kongress: Konferenz "Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
Automatic differentiation of form-function-relations of the discourse particle "hm" in a naturalistic human-computer interaction
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 / [26. Konferenz "Elektronische Sprachsignalverarbeitung"]. Günther Wirsching (Hrsg.). [Mitw. Förderverein Elektronische Sprachsignalverarbeitung e.V. Tagungsort Katholische Universität Eichstätt-Ingolstadt. Tagungsorganisation Katholische Universität Eichstätt-Ingolstadt, Lehrstuhl für Mathematik-Statistik]: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, 2015 . - 2015, S. 172-179 - (Studientexte zur Sprachkommunikation; 78)Kongress: Konferenz "Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
Recognising emotional evolution from speech
Böck, Ronald; Siegert, Ingo
In: Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies - New York, NY: ACM, 2015; Hartmann, Kim . - 2015, S. 13-18Kongress: ERM4CT'15 17 (Seattle, USA : 2015.11.09-13)
Overlapping speech, utterance duration and affective content in HHI and HCI - an comparison
Siegert, Ingo; Böck, Ronald; Vlasenko, Bogdan; Ohnemus, Kerstin; Wendemuth, Andreas
In: CogInfoCom 2015 , 2015 - [Piscataway, NJ] : IEEE ; CogInfoCom (6.:2015), S. 83-88
Peer-reviewed journal article
Probabilistic breadth as an evaluation measure of gaussian mixture models used for acoustic emotion states
Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2015, 2, insges. 8 S.
Exploratory voice-controlled search for young users - Challenges & Potential Benefits
Kotzyba, Michael; Siegert, Ingo; Gossen, Tatiana; Wendemuth, Andreas; Nürnberger, Andreas
In: Kognitive Systeme - Duisburg : DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen . - 2015, Heft 1, insges. 10 S.
Dissertation
Emotional and user-specific cues for improved analysis of naturalistic interactions
Siegert, Ingo; Wendemuth, Andreas; Diedrich, Christian
In: Magdeburg, Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2015, XIX, 266 S.
Editor
Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies
Hartmann, Kim; Siegert, Ingo; Schuller, Björn; Morency, Louis-Philippe; Sala, Albert Ali; Böck, Ronald
In: New York, NY: ACM, 2015, Online Ressource (PDF-Datei)Kongress: International Workshop on Emotion Representations and Modelling for Companion Technologies 17 (Seattle, USA : 2015.11.09-13)
Article in conference proceedings
Exploring dataset similarities using PCA-based feature selection
Siegert, Ingo; Böck, Ronald; Vlasenko, Bogdan; Wendemuth, Andreas
In: 2015 International Conference on Affective Computing and Intelligent Interaction (ACII): 21 - 24 Sept. 2015, Xi'an - Piscataway, NJ: IEEE, 2015 . - 2015, S. 387-393
Probabilistic breadth used in evaluation of resulting gaussian mixture models
Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: 4. Interdisziplinärer Workshop Kognitive Systeme 2015: Mensch, Teams, Systeme und Automaten: proceedings - Bielefeld, 2015 . - 2015, insges. 8 S.Kongress: Interdisziplinärer Workshop Kognitive Systeme 4 (Bielefeld : 2015.03.23-25)
A new dataset of telephone-based human-human call-center interaction with emotional evaluation
Siegert, Ingo; Ohnemus, Kerstin
In: Proceedings of the 1st International Symposium on Companion-Technology (ISCT 2015): September 23rd - 25th, Ulm University, Germany, S. 143-148Kongress: International Symposium on Companion-Technology, ISCT 1 (Ulm : 2015.09.23-25)
2014
Book chapter
Investigating the form-function-relation of the discourse particle “hm” in a naturalistic human-computer interaction
Siegert, Ingo; Prylipko, Dmytro; Hartmann, Kim; Böck, Ronald; Wendemuth, Andreas
In: Recent Advances of Neural Network Models and Applications / Bassis , Simone - Cham : Springer International Publishing ; Bassis, Simone . - 2014, S. 387-394 - (Smart Innovation, Systems and Technologies; 26)
Discourse particles and user characteristics in naturalistic human-computer interaction
Siegert, Ingo; Haase, Matthias; Prylipko, Dmytro; Wendemuth, Andreas
In: Human-Computer Interaction. Advanced Interaction Modalities and Techniques / Kurosu , Masaaki - Cham [u.a.] : Springer ; Kurosu, Masaaki . - 2014, S. 492-501 - (Lecture notes in computer science; 8511) Kongress: HCI International 16 Heraklion, Crete 2014.06.22-27
Peer-reviewed journal article
Analysis of significant dialog events in realistic human-computer interaction
Prylipko, Dmytro; Rösner, Dietmar; Siegert, Ingo; Günther, Stephan; Friesen, Rafael; Haase, Matthias; Vlasenko, Bogdan; Wendemuth, Andreas
In: Journal on multimodal user interfaces - Berlin: Springer, 2007, Bd. 8.2014, 1, S. 75-86
Investigation of speaker group-dependent modelling for recognition of affective states from speech
Siegert, Ingo; Philippou-Hübner, David; Hartmann, Kim; Böck, Ronald; Wendemuth, Andreas
In: Cognitive Computation - New York, NY: Springer, 2009, Bd. 6.2014, 4, S. 892-913
Article in conference proceedings
Application of image processing methods to filled pauses detection from spontaneous speech
Prylipko, Dmytro; Egorow, O.; Siegert, Ingo; Wendemuth, Andreas
In: 15th annual conference of the International Speech Communication Association, INTERSPEECH: Singapore, 14 - 18 September 2014 - International Speech and Communication Association, S. 1816-1820Kongress: INTERSPEECH 15 (Singapore : 2014.09.14-18)
2013
Book chapter
Fusion of fragmentary classifier decisions for affective state recognition
Krell, Gerald; Glodek, Michael; Panning, Axel; Siegert, Ingo; Michaelis, Bernd; Wendemuth, Andreas; Schwenker, Friedhelm
In: Multimodal pattern recognition of social signals in human-computer-interaction : first IAPR TC3 workshop, MPRSS 2012, Tsukuba, Japan, November 11, 2012 ; revised selected papers. - Berlin [u.a.] : Springer, S. 116-130, 2013 - (Lecture notes in computer science; 7742)Kongress: MPRSS; 1 (Tsukuba) : 2012.11.11
Emotion detection in HCI - from speech features to emotion space?
Hartmann, Kim; Siegert, Ingo; Philippou-Hübner, David; Wendemuth, Andreas
In: 7th IFAC Conference on Manufacturing Modelling, Management, and Control, 2013. - IFAC, S. 288-295Kongress: IFAC Conference on Manufacturing Modelling, Management, and Control; 7 (Saint Petersburg) : 2013.06.19-21
Human behaviour in HCI - complex emotion detection through sparse speech features
Siegert, Ingo; Hartmann, Kim; Philippou-Hübner, David; Wendemuth, Andreas
In: Human Behavior Understanding / Salah , Albert Ali - Cham [u.a.] : Springer ; Salah, Albert Ali . - 2013, S. 246-257 - (Lecture notes in computer science; 8212) Kongress: HBU 4 Barcelona 2013.10.22
Annotation and classification of changes of involvement in group conversation
Böck, Ronald; Glüge, Stefan; Siegert, Ingo; Wendemuth, Andreas
In: Humaine Association Conference on Affective Computing and Intelligent Interaction (ACII), 2013 - Piscataway, NJ : IEEE, S. 803-808
Using speaker group dependent modelling to improve fusion of fragmentary classifier decisions
Siegert, Ingo; Glodek, Michael; Panning, Axel; Krell, Gerald; Schwenker, Friedhelm; Al-Hamadi, Ayoub; Wendemuth, Andreas
In: Proceedings of the 2013 IEEE International Conference on Cybernetics (CYBCONF 2013) : Lausanne, Switzerland, 13-15 June, 2013. - IEEE, S. 132-137Kongress: CYBCONF; (Lausanne, Switzerland) : 2013.06.13-15
The influence of context knowledge for multi-modal affective annotation
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 381-390 - (Lecture notes in computer science; 8008)Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Audio-based pre-classification for semi-automatic facial expression coding
Böck, Ronald; Limbrecht-Ecklundt, Kerstin; Siegert, Ingo; Walter, Steffen; Wendemuth, Andreas
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 301-309 - (Lecture notes in computer science; 8008)Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Characterization of Lamb wave attenuation mechanisms
Schmidt, Daniel; Sadri, Hossein; Szewieczek, Artur; Sinapius, Michael; Wierach, Peter; Siegert, Ingo; Wendemuth, Andreas
In: Health monitoring of structural and biological systems 2013 : 11 - 14 March 2013, San Diego, California, United States ; [part of SPIE smart structures/NDE]. - Bellingham, Wash. : SPIE - (Proceedings of SPIE; 8695)Kongress: Conference on Health Monitoring of Structural and Biological Systems; (San Diego, Calif.) : 2013.03.11-14
Peer-reviewed journal article
Inter-rater reliability for emotion annotation in human-computer interaction - comparison and methodological improvements
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Journal on multimodal user interfaces - Berlin: Springer, 2007 . - 2013
Modelling of emotional development within human-computer-interaction
Siegert, Ingo; Hartmann, Kim; Glüge, Stefan; Wendemuth, Andreas
In: Kognitive Systeme. - Duisburg : DuEPublico, 1, insges. 8 S., 2013
Editor
Joint proceedings of the 2013th T2CT and CCGL workshops
Böck, Ronald; Degens, Nick; Heylen, Dirk; Louchart, Sandy; Minker, Wolfgang; Morency, Louis-Philippe; Nazir, Asad; Schwenker, Friedhelm; Siegert, Ingo
In: Magdeburg: Otto von Guericke University Magdeburg, 2013, 1 CD-R, 12 cmKongress: Workshop "Techniques Towards Companion Technologies", T2CT 13 (Edinburgh, UK : 2013.08.28)
2012
Abstract
Emotion detection by event evaluation using fuzzy sets as appraisal variables
Kotzyba, Michael; Deml, Barbara; Neumann, Hendrik; Glüge, Stefan; Hartmann, Kim; Siegert, Ingo; Wendemuth, Andreas; Traue, Harald; Walter, Steffen
In: Proceedings of ICCM 2012 : 11th International Conference on Cognitive Modeling. - Berlin : Universitätsverl. der TU Berlin, S. 123-124
Book chapter
Towards emotion and affect detection in the multimodal LAST MINUTE corpus
Frommer, Jörg; Michaelis, Bernd; Rösner, Dietmar; Wendemuth, Andreas; Friesen, Rafael; Haase, Matthias; Kunze, Manuela; Andrich, Rico; Krüger, Julia; Panning, Axel; Siegert, Ingo
In: Proceedings of the 8th International Conference on Language Resources and Evaluation: May 23-25, 2012 / eds. Nicoletta Calzolari: May 23-25, 2012 - ELRA, 2012; Calzolari, Nicoletta . - 2012, S. 3064-3069Kongress: LREC 2010 8 (Istanbul, Turkey : 2012.05.23-25)
The Influence of Context Knowledge for Multimodal Annotation
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Joint proceedings of the IVA 2012 workshops - Santa Cruz, California, September 15, 2012 - Magdeburg: Univ. . - 2012, S. 25-31Kongress: IVA 12 (Santa Cruz, Calif. : 2012.09.12-15)
Investigation of hierarchical classification for simultaneous gender and age recognition
Siegert, Ingo; Böck, Ronald; Philippou-Hübner, David; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 58 - (Studientexte zur Sprachkommunikation; 64)Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Combining mimic and prosodic analyses for user disposition classification
Böck, Ronald; Limbrecht, Kerstin; Siegert, Ingo; Glüge, Stefan; Walter, Steffen; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 220 - (Studientexte zur Sprachkommunikation; 64)Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Modeling users' mood state to improve human-machine-interaction
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Cognitive behavioural systems - Berlin [u.a.]: Springer; Esposito, Anna . - 2012, S. 273-279 - (Lecture Notes in Computer Science; 7403)Kongress: COST Dresden : 2011.02.21-26
Multimodal affect recognition in spontaneous HCI environment
Panning, Axel; Siegert, Ingo; Al-Hamadi, Ayoub; Wendemuth, Andreas; Rösner, Dietmar; Frommer, Jörg; Krell, Gerald; Michaelis, Bernd
In: 2012 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC 2012) : Hong Kong, China, 12-15 August 2012 ; proceedings. - Piscataway, NJ : IEEE, insges. 6 S.Kongress: ICSPCC; (Hong Kong) : 2012.08.12-15
Describing human emotions through mathematical modelling
Hartmann, Kim; Siegert, Ingo; Glüge, Stefan; Wendemuth, Andreas; Kotzyba, Michael; Deml, Barbara
In: Preprints MATHMOD 2012 Vienna : abstract volume. - Vienna : ARGESIM, ARGE Simulation News, Vienna Univ. of Technology, insges. 6 S. - (ARGESIM report; 38)Kongress: MATHMOD; 7 (Vienna) : 2012.02.15-17
2011
Abstract
Incorporation of a mood-model to improve user-disposition prediction from emotion recognition
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Program and abstracts of the COST 2102 Final Conference: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany / Technische Universität Dresden, Institut für Akustik und Sprachkommunikation. [Ed. by Anna Esposito ...]: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany - Dresden: Techn. Univ., Inst. für Akustik und Sprachkommunikation, 2011; Esposito, Anna . - 2011, S. 34[Kongress: COST 2102 Final Conference, Dresden, Germany, February 21 - 25, 2011]
Book chapter
A processing tool for emotionally coloured speech
Böck, Ronald; Siegert, Ingo; Vlasenko, Bogdan; Wendemuth, Andreas; Haase, Matthias; Lange, Julia
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 895, insgesamt 1 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
Ikannotate - a tool for labelling, transcription, and annotation of emotionally coloured speech
Böck, Ronald; Siegert, Ingo; Haase, Matthias; Lange, Julia; Wendemuth, Andreas
In: Affective computing and intelligent interaction ; Pt. 1 - Heidelberg [u.a.]: Springer, 2011; Pt. 1 . - 2011, S. 25-34 - (Lecture notes in computer science; 6974)Kongress: ACII 4 (Memphis, TN : 2011.10.09-12)
Vowels formants analysis allows straightforward detection of high arousal emotions
Vlasenko, Bogdan; Philippou-Hübner, David; Prylipko, Dmytro; Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 631, insgesamt 6 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
Appropriate emotional labelling of non-acted speech using basic emotions, geneva emotion wheel and self assessment manikins
Siegert, Ingo; Böck, Ronald; Philippou-Hübner, David; Vlasenko, Bogdan; Wendemuth, Andreas
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 419, insgesamt 6 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
2010
Book chapter
Developing an expressive speech labeling tool incorporating the temporal characteristics of emotion
Scherer, Stefan; Siegert, Ingo; Bigalke, Lutz; Meudt, Sascha
In: Proceedings of the 7th International Conference on Language Resources and Evaluation - Paris : ELRA . - 2010, S. 1172-1175 Kongress: LREC 2010 7 Vallette, Malta 2010.05.17-23
the following publications are accepted but not yet published
Ingo Siegert & Julia Krüger: “Speech melody and speech content didn’t fit together” – Differences in Speech Behavior for Device Directed and Human Directed Interactions.
Advances in Data Science: Methodologies and Applications, in print.
Ingo Siegert. Alicia Flores Lotz, Andreas Wendemuth: Emotionserkennung für eine nutzerzentrierte Fahrerassistenz – Affective Computing im realem Fahrzeugkontext
11. Symposium "Motor- und Aggregateakustik" (accepted)
Oliver Jokisch, Enrico Lösch and Ingo Siegert Advances in sound and speech signal processing at the presence of drones
Accepted for Quiet Drones - A Symposium on Noise from UASs/UAVs
Ingo Siegert “Alexa in the wild” – Collecting unconstrained conversations with a modern voice assistant in a public environment
Accepted for LREC 2020
Norman Weißkirchen, Mainampati Vasudeva Reddy, Andreas Wendemuth and Ingo Siegert. Utilizing Computer Vision Algorithms to Detect and Describe Local Features in Images for Emotion Recognition from Speech. Accepted for ICHMS 2020.
Organiser
Conferences
ESSV 2020, 31. Konferenz Elektronische Sprachverarbeitung, 4-6 März, 2020, Magdeburg, Co-Organisator
SPECOM 2018, 20th International Conference on Speech and Computer, 18-22 September, 2018, Leipzig, Germany, Local Organizing Committee – Special Session Chair
Summer Schools
International Summer School on Companion Technology (ISSCT 2017) - Theory and Application
In conjunction with the IEEE International Conference on Companion Technology, Ulm, Germany
September 9-13, 2017
Workshops
LREC Workshop Legal and Ethical Issues Workshop, Mai 2020, Co-Organisator
ITG-Workshop Sprachassistenten: Anwendungen, Implikationen, Entwicklungen, 3 März 2020, Magdeburg, Co-Organisator
For further information: click here
2nd International Workshop on Emotion Representations and Modelling for Companion Technologies (ERM4CT 2016),
Workshop at ICMI 2016 (18th ACM International Conference on Multimodal Interaction),
Seattle, USA, November 16th, 2016
For further information: click here
International Workshop on Emotion Representations and Modelling for Companion Technologies (ERM4CT 2015),
Workshop at ICMI 2015 (17th ACM International Conference on Multimodal Interaction),
Seattle, USA, November 13th, 2015
For further information: click here
1st International Workshop on Techniques Towards Companion Technologies (T2CT 2013)
Workshop at IVA 2013 (International Conference on Intelligent Virtual Agents), Edinburgh, UK
August 28, 2013
For further information: click here
Editorships
Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg, 4. - 6. März 2020.
Eds.: Andreas Wendemuth, Ronald Böck, Ingo Siegert.
Dresden: TUDpress, 2020
Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020. Abstractbook.
Eds.: Ingo Siegert, Sebastian Möller
Unibibliothek Magdeburg
ERM4CT '16: Proceedings of the 2nd International Workshop on Emotion Representations and Modelling for Companion Technologies.
Eds.: Kim Hartmann, Ingo Siegert, Ali Albert Salah and Khiet P. Truong.
ACM, New York, NY, USA, 2016
Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies.
Eds: Kim Hartmann, Ingo Siegert, Björn Schuller, Louis-Philippe Morency, Albert Ali Salah and Ronald Böck
ACM, New York, NY, USA, 2015
Joint Proceedings of the 2013th T2CT and CCGL Workshops,
Eds: Ronald Böck, Nick Degens, Dirk Heylen, Sandy Louchart, Wolfgang Minker, Louis-Philippe Morency, Asad Nazir, Friedhelm Schwenker, Ingo Siegert
Edinburgh, UK, August 28, 2013
Publisher: Otto von Guericke University Magdeburg,
ISBN: 978-3-940961-99-0.
invited Talks
2020 -- Siri, Alexa & Co: Wie können Dialoge mit Sprachassistenten natürlicher werden und warum können diese mir nicht einfach mal meine Fragen beantworten?
Vortrag im Rahmen der Vortragsreihe "Wissenschaft im Rathaus" Magdeburg
2020 -- Differences in Speech Behavior for Human-Directed and Device Directed Speech for the application of Addressee-Detection
Kolloqium an der Universität des Saarlandes Fachrichtung Sprachwissenschaft und Sprachtechnologie, Saarbrücken
2019 -- Wie finden wir es, wenn Maschinen uns Persönliches fragen?
Mitmachwerkstatt auf der KI&Wir Convention Magdeburg
2019 -- Rendezvous mit Mr(s) Robot - Liebe auf das erste BYTE? Ein Blick auf die aktuelle Forschung im Bericht der Mensch-Maschine-Interaktion.
Filmgespräch im Rahmen des SILBERSALZ Science & Media Festival 2019
2019 -- Speech Technology for Human-Machine-Interaction
Vortrag auf dem KI@OVGU Symposium in Magdeburg
2019 -- Meet the Scientist Magdeburg "Der (in-)kompetente Helfer" im Rahmen der Wissenschaftsausstellung auf der MS Wissenschaft
Wie Menschen mit einem digitalen Sprachassistenten sprechen müssen, damit er sie versteht.
2018 -- Smarte Systeme vermitteln (Bachelor) - Smarte Ingenieure für die Industrie
Co-Speaker, NI Technologie- und Anwenderkongress VIP 2018
2017 – Freud und Leid am Ticketautomaten – Situations- und Dispositionserkennende Companiontechnologie,
Gastvortrag an der Hochschule für Telekommunikation, Leipzig
2015 – Situations- und Dispositionserkennende Companiontechnologie – Vortrag im Rahmen der Auszeichnung „Deutschland Land der Ideen“ an den SFB/TRR-62
2013 – Companion-Technology – The Future of Cognitive Technical Systems, Introduction talk at the 1st International Workshop on Techniques Towards Companion
Technologies
Awards
Ronald Böck, Olga Egorow, Ingo Siegert und Andreas Wendemuth. “Comparative Study on Normalisation in Emotion Recognition from Speech”. In: Proceedings
of the 9th International Conference on Intelligent Human Computer Interaction (IHCI 2017). Hrsg. von Patrick Horain, Catherine Achard und Malik Mallem. Cham: Springer International Publishing, 2017, S. 189–201, Best Paper Award.
Current projects
Medinym - KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen
Duration: 15.12.2022 bis 14.12.2025
Motivation
Die fortschreitende wissenschaftliche Weiterentwicklung von Technologien auf Basis Künstlicher Intelligenz (KI) befördert medizinische Anwendungspotenziale. Einer reellen Nutzung dieser Technologien durch eine Vielzahl an Anwendern wie Bürgerinnen und Bürger, Behörden, Mitarbeitenden des Gesundheitswesens und kleinen sowie mittelständischen Unternehmen steht die Schwierigkeit des datensicheren und datengeschützten Umgangs gegenüber. Gerade bei der automatisierten Verarbeitung von medizinischen Daten können oftmals innovative Technologien nicht eingesetzt werden, da aufgrund der sensiblen Inhalte, der Schutz der Identität zu Recht einen hohen Stellenwert einnimmt. Die Schutzwürdigkeit klinischer Daten und der dadurch erschwerte Zugang damit führt auch dazu, dass Maschinelle Lernverfahren (ML), beispielsweise für klinische Diagnosen, Prognosen sowie Therapie- oder Entscheidungsunterstützung nicht ohne größere Hürden entwickelt werden können.
Ziele und Vorgehen
Das Projekt "KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen" (Medinym) untersucht die Möglichkeit der Weiterverwertung sensibler Daten durch das Entfernen der empfindlichen Informationen mittels Anonymisierung. Im Projekt werden zwei medizinische Anwendungsfälle, textbasierte Daten aus der elektronischen Patientenakte sowie Sprachdaten aus diagnostischen Ärztin-Patient-Gesprächen, exemplarisch umgesetzt. Dazu werden im Projekt offene Technologien zur Anonymisierung untersucht, weiterentwickelt und auf reale Daten angewandt. Außerdem untersuchen die Forschenden, wie die Aussagekraft solch anonymisierter Daten für die weitere Nutzung erhalten werden kann. Zusätzlich sollen Methoden betrachtet werden, die einen Missbrauch der Technologie außerhalb des beabsichtigten Anwendungsfalls verhindern oder erschweren.
Innovationen und Perspektiven
Durch die informationserhaltende Anonymisierung soll es möglich werden, klinische Daten weiterzuverarbeiten, da eine De-Anonymisierung nicht mehr möglich ist. Diese Datensätze können dann dazu dienen, KI-Modelle auf klinischen Daten datenschutzkonform zu trainieren oder auf andere Kohorten ausgedehnt werden. Damit wäre eine kumulative Sammlung entsprechender Datenmengen auch für kleine und mittelständische Unternehmen möglich. Denn so könnten sensible Daten über mehrere Anwendungszwecke hinweg zusammengefasst und für KI-Trainingsroutinen verwendet werden; eine entsprechende Anonymisierung stets vorausgesetzt. Die angestrebte Anonymisierung soll zudem die Bereitschaft von Patientinnen und Patienten steigern, in die Teilnahme an Studien, Datenanalysen sowie allgemeinen Spenden von Gesundheitsdaten einzuwilligen. Schlussendlich erlaubt die Informationserhaltene Anonymisierung die Integration der Technologie in gängige Entwicklungsmethoden und Diagnostiksysteme und stärkt damit den Wissenschafts- und Wirtschaftsstandort Deutschland in den Bereichen Diagnostik, Behandlung und damit allgemein der Gesundheitsversorgung.
Förderung
Finanziert von der Europäischen Union - NextGenerationEU
AI Engineering - Ein interdisziplinärer, projektorientierter Studiengang mit Ausbildungsschwerpunkt auf Künstlicher Intelligenz und Ingenieurwissenschaften
Duration: 01.12.2021 bis 30.11.2025
AI Engineering (AiEng) umfasst die systematische Konzeption, Entwicklung, Integration und den Betrieb von auf Künstlicher Intelligenz (KI) basierenden Lösungen nach Vorbild ingenieurwissenschaftlicher Methoden. Gleichzeitig schlägt AiEng eine Brücke zwischen der Grundlagenforschung zu KI-Methoden und den Ingenieurwissenschaften und macht dort den Einsatz von KI systematisch zugänglich und verfügbar. Das Projektvorhaben konzentriert sich auf die landesweite Entwicklung eines Bachelorstudiengangs «AI Engineering», welcher die Ausbildung von Methoden, Modellen und Technologien der KI mit denen der Ingenieurwissenschaften vereint. AiEng soll als Kooperationsstudiengang der Otto-von-Guericke-Universität (OVGU) Magdeburg mit den vier sachsen-anhaltischen Hochschulen HS Anhalt, HS Harz, HS Magdeburg-Stendal und HS Merseburg gestaltet werden. Der fächerübergreifende Studiengang wird Studierende befähigen, KI-Systeme und -Services im industriellen Umfeld und darüber hinaus zu entwickeln und den damit einhergehenden Engineering-Prozess - von der Problemanalyse bis zur Inbetriebnahme und Wartung / Instandhaltung - ganzheitlich zu begleiten. Das AiEng-Curriculum vermittelt eine umfassende KI-Ausbildung, ergänzt durch eine grundlegende Ingenieurausbildung und eine vertiefende Ausbildung in einer gewählten Anwendungsdomäne. Um eine Symbiose von KI- und ingenieurwissenschaftlicher Lehre zu erreichen, wird ein neuer handlungsorientierter Rahmen entwickelt und gelehrt, welcher den vollständigen Engineering-Prozess von KI-Lösungen beschreibt und alle Phasen methodisch unterstützt. AIEng zeichnet sich durch eine modulübergreifende Verzahnung von Lehr- und Lerninhalten innerhalb eines Semesters sowie durch ein fakultäts- und hochschulübergreifendes Tandem-Lehrkonzept aus und verfolgt ein studierendenzentriertes Didaktikkonzept, welches durch viele praxisorientierte (Team-)Projekte und ein großes Angebot an Open Educational Resources (OERs) mit (E)-Tutorenprogramm getragen wird.
Automatisierte akustisch-prosodische Sprachanalyse für die Psychotherapieforschung und die Entwicklung von e-companion enhancement in der Psychotherapie (ASPIRE)
Duration: 01.06.2023 bis 31.05.2025
Automatisierte KI-gestützte Sprachanalyse, die potenziell in Echtzeit (intra-session) relevante Konstrukt-Marker erfassen und deren Auswertung ermöglichen kann, hat das Potenzial zur evidenzbasierten situativen Interventionsgestaltung in der Präzisionspsychotherapie beizutragen und als digitale enhancement-Technologie (e-companion) wirksam zu werden (Kučera & Mehl, 2022; Chekroud et al., 2021; Krüger, Siegert & Junne, 2022).
Ziel des Vorhabens ist im Rahmen eines proof-of-concept-Ansatzes die Entwicklung eines validen Prädiktionsmodells für den zentralen Wirkfaktor therapeutische Beziehung (als Modellkonstrukt) auf Basis von sprachinhaltlichen und prosodisch-akustischen Sprachdaten. Dies ermöglicht automatisierte Marker-Identifikation als Basis für die künftige Rückmeldung an PsychotherapeutInnen zur weiteren gezielten Interventionsgestaltung. Auf Basis von automatisierten Diskursanalysen und validierten Ratingsystemen, sollen Querschnittsanalysen zur interpersonalen Robustheit inhaltsanalytischer und akustisch-prosodischer Marker sowie Längsschnittanalysen individueller Beziehungsverläufe ermöglicht werden. In der Datenanalyse erfolgt eine automatische Extraktion der sprachinhaltlichen und der prosodisch-akustischen Marker aus Audiodaten (insb. solche, die im Zusammenhang mit Pitch, Energie, Voice Quality und Rhythmus stehen). Parallel werden KI-basierte State-of-the-Art Anonymisierungsmethoden für den Erhalt der sprachinhaltlichen und prosodisch-akustischen Marker angepasst und es wird analysiert, inwieweit die anonymisierten Daten für die Bewertung der therapeutischen Beziehung reliabel sind.
Eaasy System - Electric Adaptive Autonomous Smart Delivery System
Duration: 01.02.2022 bis 31.01.2025
Das Projekt Eaasy System verfolgt das Ziel, elektrische Lastenräder mit automatisierten Fahrfunktionen zu entwickeln, die eine umweltfreundliche Zustellung von Gütern für den Einsatz in der sogenannten "letzten Meile"-Logistik ermöglichen. Mit dieser Neuentwicklung soll die Flexibilität konventioneller Lastenräder mit den ergonomischen Vorteilen und schlanken Zustellprozessen von Zustellrobotern (Follow-Me) verbunden werden. Die Fahrfunktionen der automatisierten Lastenräder werden dafür auf unstrukturierte Verkehrssituationen ausgerichtet und mit einer sogenannten Come-With-Me Funktion ausgestattet - eine intuitive Sprachsteuerung, über die Zusteller das Fahrzeug dirigieren können. Damit soll die Logistik insgesamt nachhaltiger werden, die körperliche Belastung der Zusteller sinken und die Zustellung von Gütern deutlich beschleunigt werden.
AnonymPrevent - AI-based Improvement of Anonymity for Remote Assessment, Treatment and Prevention against Child Sexual Abuse
Duration: 01.12.2021 bis 30.11.2024
AnonymPrevent investigates both the use and improvement of innovative AI-based anonymization techniques for initial counseling and preventive remote treatment of people who are sexually attracted to children. We aim to anonymize the identity of a patient (given by voice and way of speaking), but at the same time we retain clinical-diagnostic information of, e.g., emotional and personality-related expression. Anonymization of telephone-based contacts, as well as for follow-up therapy possibly supplemented by video transmission, are implemented using latest neural models such as Variational Autoencoder with Differential Digital Signal Processing and avatar-based communication respectively. Since 2005 the Institute of Sexology and Sexual Medicine of Berlin’s Charité, here acting as both practical and research partner, has been leading nationally and internationally growing projects offering treatment to people with pedophilic or hebephilic inclination. Since these sexual inclinations are societally connotated with a high degree of shame and stigmatization, the topic child sexual abuse prevention proofs highly relevant. Ultimately, the project investigates whether and to what extent anonymization of verbal and visual communication channels can lead to increased acceptance of a preventive treatment offer and at the same time does not have an unfavorable influence on communication within the therapy, possibly even promotes open exchange.
Completed projects
Emonymous -Sprecheranonymisierung unter Erhalt der emotionalen Ausdruckswirkung
Duration: 01.08.2021 bis 31.12.2023
Durch die technologischen Fortschritte im Bereich der Künstlichen Intelligenz (KI), halten auch interaktive und intelligente Sprachassistenten mehr und mehr Einzug in den gesellschaftlichen Alltag. Aus datenschutzrechtlichen Gründen ist deren Einsatz jedoch meist auf Anwendungen im privaten Bereich beschränkt. Insbesondere die Möglichkeit Sprechende auf Basis einer Vielzahl an erhobenen Daten zu identifizieren, verhindert einen effektiven Einsatz von Sprachassistenten in datenschutzrechtlich sensiblen Bereichen wie beispielsweise dem Gesundheitssektor oder der Lernunterstützung. Für viele Anwendungen ist die Identität der Sprechenden jedoch nicht zwangsläufig relevant, sondern es ist lediglich erforderlich zu wissen, was genau gesagt wurde. Dabei enthält Sprache neben dem Inhalt des Gesagten auch weitere Indikatoren, wie beispielsweise die Emotionalität oder die Ausdrucksweise. Der Erhalt dieser sprachlichen Feinheiten nach einer Anonymisierung der Sprechenden ist für die Interpretation und ein umfassendes Verständnis des Gesagten in vielen Anwendungsbereichen jedoch sehr wichtig (z.B. um den Gesundheitszustand eines Patienten richtig einzuschätzen).
MusIAs - Musik-geleitete Imagination und Digitaler Sprachassistent - eine Pilotstudie
Duration: 01.01.2021 bis 30.06.2023
Die Musik-geleitete Imagination ist eine ressourcenorientierte musiktherapeutische Technik, die neben der Musikrezeption das therapeutische Gespräch über die Bedeutung innerer Bilder für die Bewältigung psychischer Belastungen beinhaltet. Zwischen Therapiesitzungen unterstützt gezieltes Musikhören Selbstregulationsprozesse. Diese Pilotstudie untersucht, inwieweit ein gängiger Sprachassistent die Musikauswahl für eine Musik-geleitete Imagination unterstützen sowie die Reflektion innerer Prozesse anregen kann und damit die musikgestützte Selbstfürsorge fördert. Hierfür wird ein Skill für Amazons‘ Alexa entwickeltet, welcher an die sog. Kurze Musikreise (KMR) angelehnt ist und die Module "Befindenserfassung", "Musikauswahl", "Entspannungsanleitung" und "Reflektion" umfasst. In einer Pilotstudie werden im Vergleich zu einer Kontrollbedingung die Akzeptanz und das subjektive Erleben des Skills sowie Veränderungen im Stresserleben mithilfe eines mixed-methods-Ansatzes erforscht, in dem quantifizierende Maße, Erlebensberichte und die Sprachprosodie der Nutzenden analysiert werden. Wird ein Sprachassistent zur musik-geleiteten Imagination als hilfreich erlebt, eröffnen sich bei sorgfältiger Risiken-Nutzen-Abwägung ggfs. klinische Anwendungen, z.B. technikgestützte Überbrückungen von Versorgungslücken oder inter-session-Anwendungen in laufenden Therapien.
MusIAs - Musik-geleitete Imagination und Digitaler Sprachassistent - eine Pilotstudie …
Duration: 01.01.2021 bis 30.06.2023
Die Musik-geleitete Imagination ist eine ressourcenorientierte musiktherapeutische Technik, die neben der Musikrezeption das therapeutische Gespräch über die Bedeutung innerer Bilder für die Bewältigung psychischer Belastungen beinhaltet. Zwischen Therapiesitzungen unterstützt gezieltes Musikhören Selbstregulationsprozesse. Diese Pilotstudie untersucht, inwieweit ein gängiger Sprachassistent die Musikauswahl für eine Musik-geleitete Imagination unterstützen sowie die Reflektion innerer Prozesse anregen kann und damit die musikgestützte Selbstfürsorge fördert. Hierfür wird ein Skill für Amazons‘ Alexa entwickeltet, welcher an die sog. Kurze Musikreise (KMR) angelehnt ist und die Module "Befindenserfassung", "Musikauswahl", "Entspannungsanleitung" und "Reflektion" umfasst. In einer Pilotstudie werden im Vergleich zu einer Kontrollbedingung die Akzeptanz und das subjektive Erleben des Skills sowie Veränderungen im Stresserleben mithilfe eines mixed-methods-Ansatzes erforscht, in dem quantifizierende Maße, Erlebensberichte und die Sprachprosodie der Nutzenden analysiert werden. Wird ein Sprachassistent zur musik-geleiteten Imagination als hilfreich erlebt, eröffnen sich bei sorgfältiger Risiken-Nutzen-Abwägung ggfs. klinische Anwendungen, z.B. technikgestützte Überbrückungen von Versorgungslücken oder inter-session-Anwendungen in laufenden Therapien.
Wahrnehmung der paraverbalen Information in datenreduzierter gesprochener Sprache bei Nutzern von Cochlea-Implantaten
Duration: 15.08.2020 bis 28.02.2022
Datenreduktion ist nicht nur bei synthetisierten Ansagen, sondern auch bei Sprache-produzierenden Kommunikationssystemen (z.B. Siri, Alexa, VoIP, mobile Navigationssyteme) und bei der Übertragung von Telefonie (Voice over IP, VoIP) elementar. Nutzer eines Cochlea-Implantats sind mit einer starken Beeinträchtigung spektraler Information im Schall konfrontiert, die vor allem die exakte Wahrnehmung von Tonhöhe einschränkt. Das Projekt untersucht, inwieweit insbesondere Emotion in gesprochener Sprache wahrgenommen wird und wie sich eine zusätzliche Beeinträchtigung durch Datenreduktion auswirkt.
Differences in users' speech behaviour between human-machine and human-human interactions ("Alexa studies")
Duration: 01.11.2018 bis 30.06.2021
This interdisciplinary project deals with fundamental research on the speech behaviour of people with technical systems from an engineering and a psychological perspective. In particular, it is investigated to what extent the speech behaviour of humans in interpersonal interactions differs from the speech behaviour of humans in interactions with technical systems. For this purpose, several studies will be carried out using the specially developed data corpus, the Voice Assistant Conversation Corpus (VACC), which is based on interactions with Amazon's Alexa. Different interaction situations (formal vs. informal, dyadic vs. triadic) are investigated and comparisons between objective measurements of acoustic and lexical speech characteristics, user self-reports and external ratings are made. The major goal is to identify a set of distinctive speech features that will enable voice-controlled technical systems to detect whether they are addressed by the user or not. In addition, it will be investigated how the user's experience of the technical system (attributed more to human or more to technical characteristics and abilities) influences the user's speech behaviour.
"Finde deinen Studiengang" - Eine sprachgeführte Hilfe zur Studieninformation an der OvGU
Duration: 01.02.2020 bis 28.02.2021
Studienberatung in Distanz? Wie kann das gehen, wenn Interessierte zu Hause sind? Hier soll das aktuelle Projekt eine Antwort geben. Mittels weniger Fragen soll dem Studieninteressierten eine passende Auswahl von Studiengängen präsentiert werden, die seinen Interessen entsprechen und an der Uni Magdeburg angeboten werden.
ADAS&ME : Adaptive Advanced Driver Assistance Systems to support incapacitated drivers and Mitigate Effectively risks through tailor made Human Machine Interaction under automation
Duration: 01.09.2016 bis 28.02.2020
ADAS&ME will develop adapted Advanced Driver Assistance Systems that incorporate driver/rider state, situational/environmental context, and adaptive interaction to automatically transfer control between vehicle and driver/rider and thus ensure safer and more efficient road usage. The work is based around 7 Use Cases, covering a large proportion of driving on European roads. Experimental research will be carried out on algorithms for driver state monitoring as well as on Human-Machine-Interaction and automation transitions. Robust detection/prediction algorithms will be developed for driver/rider state monitoring towards different driver states, such as fatigue, sleepiness, stress, inattention and impairing emotions, employing existing and novel sensing technologies, taking into account traffic and weather conditions and personalizing them to individual driver s physiology and driving behavior. Further, the core development includes multimodal and adaptive warning and intervention strategies based on current driver state and severity of scenarios. The final outcome is a driver/rider state monitoring system, integrated within vehicle automation. The system will be validated with a wide pool of drivers/riders under simulated and real road conditions and under different driver/rider states. This challenging task has been undertaken by a multidisciplinary European Consortium of 30 Partners, including an original equipment manufacturer per vehicle type and 7 direct suppliers.
The Cognitive Systems Group at Otto-von-Guericke-University will contribute to this consortium by providing analysis of emotional content of acoustic utterances in the car. We will also engage in information fusion of data from various modalities (acoustic, video, and others) and analyzing this data for identifying markers for detecting drowsiness or a loss of control state of the driver, thus contributing to driver assistance in several use cases, such as cars, busses, trucks, and motorcycles.
Emotion -based support for interactive applications in call centers
Duration: 15.04.2014 bis 28.11.2015
The application-oriented research in the field " emotion -based support for interactive applications in call centers " will be further developed. Here is the phone dialogue ,
in which the call center operator is supported in his conversation design through feedback on the
emotional state (control , valence ).
Model for localisation of moods and personality traits in valence-pleasure-arousal-space
Duration: 01.01.2013 bis 31.12.2013
A Model for localisation of moods and personality traits in valence-pleasure-arousal-space is developed. Experimental trals are located in this space and a trajectory is modelled, which is mood- and personality dependent.
I had the honor to sipervise the following students
2017
Mainampati Vasudeva Reddy
Overview and Comparison of Computer Vision Algorithms to Detect and Describe Local Features in Images'
Non-Technical Project Report
Tang Shuran
Analysis of acoustic features and automatic recognition experiments for conversation addressee detection
Masterarbeit
2016
Thomas Aab
Datenvorverarbeitung und Klassifizierung von Kopfdrehungen und Kopfbeschleunigung mittels MEMS Sensorik
Bachelorarbeit
Srinivasa Rao Peddi
Implementation and Investigations of Broad Phoneme Recognisers for Discourse Particle Detection
Masterarbeit
Linh Linda Duong
Untersuchung des Einflusses unterschiedlicher Audiospeicherformate und Kompressionsformate auf die Audioqualität
Bachelorarbeit (Betreuung als Kooperation mit Alicia Lotz)
Somtapa Bhattacharya
Implementation of improved Methods for Voice Activity Detection
Technical Project
Somtapa Bhattacharya
Evolution of Speech Processing
Non-technical Project
Daile Vera Poungue Wetoumdu
Überlappung in der Mensch-Maschine-Interaktion
Forschungsprojekt
2015
Fengjie Zhang
Comparison of Speech Emotion Recognition using Neural Networks and Deep Belief Networks having limited data material
Master Thesis
Yu Bi
Investigations on Wuality Asessment for Emotion Speech Data
Master Thesis
Bharath Bhat
Overlapping Speech
Non-technical Project
2014
Alicia Flores Lotz
Differentiation von Form-Funktions-Verläufen des Diskurspartikels "hm" über unterschiedliche mathematische Herangehensweisen
Masterarbeit
René Kallweit
Sprachsteuerung eines Roboters über eine Raspberry Pi bzw. Arduino Plattform
Masterarbeit
2012
Thomas Willner
Zerstörungsfreie Werkstoffprüfung von PMMA-Scheiben mit Hilfe von Lambwellen und digitalen Filtern
Studienarbeit
Christian Sporleder
Zerstörungsfreie Werkstoffprüfung von PMMA-Scheiben mit Hilfe von Lambwellen zur Detektion von Beschädigungen
Studienarbeit
Daniel Hellge-Theune
Erstellung und Evaluierung einer parametrisierbaren Onlineabfrage für ein Phonemlexikon der deutschen Sprache
Forschungsprojekt
- Charité – Universitätsmedizin Berlin, Institut für Sexualwissenschaft und Sexualmedizin, Prof. Dr. Dr. Klaus Beier
- DFKI Berlin Speech and Language Technology (SLT), Berlin
- Hochschule Anhalt
- Hochschule für Telekommunikation (HfTL), Leipzig, Prof. Dr. Oliver Jokisch
- Hochschule Harz
- Hochschule Magdeburg-Stendal
- Hochschule Merseburg
- Ludwig-Maximilians-Universität München, Department Psychologie, Lehrstuhl psychologische Methodenlehre und Diagnostik
- NDR Kultur, Michael Becker
- Otto-von-Guericke-Universität, AiLab, Prof. Sebastian Stober
- Otto-von-Guericke-Universität, Arbeitsgruppe Logistische Systeme, Dr. Tobias Reggelin
- Otto von Guericke Universität, Hochschulforschung und Professionalisierung der akademischen Lehre, Prof. Philipp Pohlenz
- Otto von Guericke Universität, Institut für Strömungstechnik und Thermodynamik, apl. Prof. Gabor Janiga
- Otto-von-Guericke-Universität Magdeburg Medizinische Fakultät Universitätsklinik für Hals-, Nasen- und Ohrenheilkunde, Kopf- und Halschirurgie Abteilung für Experimentelle Audiologie, Prof. Dr. Jesko Verhey
- Prof. Dr. Katrin Giel, Sektion Translationale Psychotherapieforschung, Universitätsklinikum Tübingen
- Prof. Dr. Susanne Metzner, Wiss. Leitung Studien- und Forschungsbereich Musiktherapie, Leopold-Mozart-Zentrum, Universität Augsburg
- regiocom SE
- Technische Universität Berlin, Quality and Usability Labs
- Universitätsklinik für Psychosomatische Medizin und Psychotherapie, Dr. Julia Krüger, Prof. Dr. Jörg Frommer
- University of Southern Queensland, Toowoomba, Australien, Dr. Rajib Rana