German (Germany) Call Center Speech Dataset for Telecom

The audio dataset comprises call center conversations for the Telecom domain, featuring native German speakers from Germany. It includes speech data, detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

Jun 2024

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

Introduction

Welcome to the German Call Center Speech Dataset for the Telecom domain designed to enhance the development of call center speech recognition models specifically for the Telecom industry. This dataset is meticulously curated to support advanced speech recognition, natural language processing, conversational AI, and generative voice AI algorithms.

Speech Data

This training dataset comprises 30 Hours of call center audio recordings covering various topics and scenarios related to the Telecom domain, designed to build robust and accurate customer service speech technology.

  • Participant Diversity:
  • Speakers: 60 expert native German speakers from the FutureBeeAI Community.
  • Regions: Different states/provinces of Germany, ensuring a balanced representation of German accents, dialects, and demographics.
  • Participant Profile: Participants range from 18 to 70 years old, representing both males and females in a 60:40 ratio, respectively.
  • Recording Details:
  • Conversation Nature: Unscripted and spontaneous conversations between call center agents and customers.
  • Call Duration: Average duration of 5 to 15 minutes per call.
  • Formats: WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 and 16 kHz.
  • Environment: Without background noise and without echo.
  • Topic Diversity

    This dataset offers a diverse range of conversation topics, call types, and outcomes, including both inbound and outbound calls with positive, neutral, and negative outcomes.

  • Inbound Calls:
  • Phone Number Porting
  • Network Connectivity Issues
  • Billing and Payments
  • Technical Support
  • Service Activation
  • International Roaming Enquiry
  • Refunds and Billing Adjustments
  • Emergency Service Access, and many more
  • Outbound Calls:
  • Welcome Calls / Onboarding Process
  • Payment Reminders
  • Customer Surveys
  • Technical Updates
  • Service Usage Reviews
  • Network Compliant Status Call, and many more
  • This extensive coverage ensures the dataset includes realistic call center scenarios, which is essential for developing effective customer support speech recognition models.

    Transcription

    To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. These transcriptions feature:

  • Speaker-wise Segmentation: Time-coded segments for both agents and customers.
  • Non-Speech Labels: Tags and labels for non-speech elements.
  • Word Error Rate: Word error rate is less than 5% thanks to the dual layer of QA.
  • These ready-to-use transcriptions accelerate the development of the Telecom domain call center conversational AI and ASR models for the German language.

    Metadata

    The dataset provides comprehensive metadata for each conversation and participant:

  • Participant Metadata: Unique identifier, age, gender, country, state, district, accent and dialect.
  • Conversation Metadata: Domain, topic, call type, outcome/sentiment, bit depth, and sample rate.
  • This metadata is a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of German call center speech recognition models.

    Usage and Applications

    This dataset can be used for various applications in the fields of speech recognition, natural language processing, and conversational AI, specifically tailored to the Telecom domain. Potential use cases include:

  • Speech Recognition Models: Training and fine-tuning speech recognition models for German.
  • Speech Analytics Models: Building speech analytics models to extract insights, identify patterns, and glean valuable information from customer conversation, enables data-driven decision-making and process optimization within the Telecom sector.
  • Smart Assistants and Chatbots: Developing conversational agents and virtual assistants for customer service in the Telecom industries.
  • Sentiment Analysis: Analyzing customer sentiment and improving customer experience based on call center interactions.
  • Generative AI: Training generative AI models capable of generating human-like responses, summaries, or content tailored to the Telecom domain.
  • Secure and Ethical Collection

  • Our proprietary data collection and transcription platform, “Yugo” was used throughout the process of this dataset creation.
  • Throughout the data collection process, the data remained within our secure platform and did not leave our environment, ensuring data security and confidentiality.
  • The data collection process adhered to strict ethical guidelines, ensuring the privacy and consent of all participants.
  • It does not include any personally identifiable information about any participant, which makes the dataset safe to use.
  • The dataset does not contain any copyrighted content.
  • Updates and Customization

    Understanding the importance of diverse environments for robust ASR models, our call center voice dataset is regularly updated with new audio data captured in various real-world conditions.

  • Customization & Custom Collection Options:
  • Environmental Conditions: Custom collection in specific environmental conditions upon request.
  • Sample Rates: Customizable from 8kHz to 48kHz.
  • Transcription Customization: Tailored to specific guidelines and requirements.
  • License

    This Telecom domain call center audio dataset is created by FutureBeeAI and is available for commercial use.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Sample Line

    ATTRIBUTES

    Channel 1Channel 2Format
    Female(34)Male(35)wav, json

    TRANSCRIPTION

    LABELSTARTENDCHANNELTRANSCRIPT
    Speech0.2421.56735765250Hallo Future Bee.
    Speech3.0674.48379945472Hallo Future Bee.
    Speech7.19211.35835765250Hallo. Telekom. Grüß gott. Mein name ist Haba Landa.
    Speech13.05815.54279945472Hallo Frau Haba Landa. Hier Stein Müller.
    Speech16.39219.19235765250Hallo Herr Stein Müller. Was kann ich für sie tun?
    Speech16.41717.04279945472(())
    Speech19.83327.11779945472Ich habe eines neues ziemlichen vernindungsproblem. Mein internet verbindung (()) ständig ab.
    Speech27.84229.52579945472Und das, das
    Speech30.73333.73379945472Ja das müssten wir irgendiwie (()) bekommen.
    Speech34.69244.32535765250Ja Herr Stein Müller ein problem mit der netzwerk verbindung. Ich notiere mir das hier, wo wohnen sie denn?
    Speech46.70848.86779945472#Ah das ist in Oberaudorf.
    Speech49.81754.30035765250In Oberauford. Können sie mir hier eine postzeitzahl nennen?
    Speech55.51757.13379945472Ja das ist die
    Speech57.70059.70079945472<PII>achtviernulldreineun</PII>
    Speech60.60863.20035765250<PII>achtviernulldreineun</PII> Oberaudorf.
    Speech63.73366.17535765250Ja #am ja ich sehe.
    Speech66.63369.90035765250Hier sind wir anbieter, genau wunderbar.
    Speech70.75075.81735765250Und sie sagen hier haben sie netzwerk probleme nur mit dem internet?
    Speech78.60079.32579945472#am
    Speech80.01784.03379945472Telefoniert wird meistens über, über mein, mein handy erledigt also
    Speech84.55086.98379945472ich nutze meinen festnetz anfluss so gut wie (())
    Speech87.57591.10079945472Deswegen kann ich zum, zum festnetz jetzt gerade, #Ah gar nicht sagen.
    Speech91.69299.82535765250#Hmm #Mmm (()) mir okay. Also sie haben hier internet probleme. Fällt ihnen das zu eine bestimmten uhrzeit (()) auf?
    Speech102.842106.25079945472#am nein eigentlich vorbei ich
    Speech106.967109.09279945472ich bin nur abends im, im
    Speech109.650112.48379945472abtäglich im internet zur ab achtzehn uhr.
    Speech113.933114.77535765250#Hmm #Mmm
    Speech114.792115.65079945472Und
    Speech116.917123.82579945472Ja das ist (()) regelmäßig und dann ungefähr nach, nach fünf bis zehn minuten fangt (()) ab.
    Speech124.417126.10879945472Das die, die verbindung abreist.
    Speech127.317142.02535765250#Ah okay. Also am anfang ist noch alles (()) fünf bis zehn minuten reißt die verbindung ab. #Ah könnte ihr da liegen das einfach ein (()) verbraucht ist. Wie finden sich denn in ihrem haus, in, ja in ihren gebäude?
    Speech142.175144.70835765250Mehrere anschlusse.
    Speech146.875150.69279945472#Ah das ist ein, ein mehr familien haus, ein, ein mehr partien haus.
    Speech151.575154.47579945472Ich glaube mit #Ah sechzehn wohneinheiten.
    Speech156.050159.40879945472Und die mit sprechen wahrscheinlich auch zu viel anschlussen ja.
    Speech159.800176.00035765250Ja Herr Stein Müller. Ich denke hier haben wir das problem das einfach die auslastung, nicht mehr denn anforderungen [laugh] ja stand hilt. Hier könnten sie mit ihrem, sie wohnen auf miete gehen davon aus.
    Speech177.541191.60835765250Können sie das problem einmal mit ihrem vermieter besprechen? Eine glasfaser haben wir ihnen nämlich schon einmal angeboten damit hier eine bessere verbindung zwischen (()) kommt
    Speech177.641178.75079945472Ja ganz genau.
    Speech191.916199.24135765250Ja meinte damals das sie nicht nötig sein. Jetzt haben sie Herr Stein Müller (()) hier schon eine #Ah
    Speech199.750209.15835765250Anfang an und gestellt (()) netzwerk verbindung. Vielleicht haben sie auch mit bewohner denen das selbe probleme vorliegt.
    Speech209.508212.00835765250Wissen das, wissen sie etwas darüber?
    Speech214.358217.69179945472Ich weiss von meinem direkt nachbarn mit dem ich (()) sehr viel in kontakt.
    Speech218.266223.90879945472Der hat auch (()) eine schwierigkeiten damit #Ah eine, eine stabile verbindung zu erhalten ja.
    Speech224.483236.39135765250#Hmm ja. Also mein tipp fur sie jetzt konkret in ihre jetzigen situation. Nehmen sie einmal wenn sie im internet sind, dann nutzen sie ja nur ein gerät.
    Speech236.450239.76635765250Nehmen, nehmen sie die anderen geräte
    Speech240.133246.76635765250aus ihre verbindung heraus ja. Und haben sie ein (()) WLAN?
    Speech249.166250.11679945472Ja habe ich.
    Speech249.525250.04135765250Ja.
    Speech250.750251.52535765250Und.
    Speech252.158257.11635765250Ja es ist ein #am auch nur ein WLAN verwand or haben sie noch eine (()) zugang?
    Speech259.425263.81679945472Nein auch kein (()) zugang. Also einfach nur, (()) ich bin mit mein router.
    Speech260.916261.57535765250#Hmm
    Speech264.891267.00879945472Und diese auch sonst eigentlich.
    Speech265.416266.66635765250#Hmm #Mmm ja
    Speech268.250270.19179945472Das heißt eigentlich es ist niemand da.
    Speech270.666273.50079945472versicht da, mit, mit einwählen könnte.
    Speech275.083290.00835765250Ja aber genau also falls, falls dieses problem auf denken sie daran das nur ein gerät das sitze zeit nutzen im netwerk eingesperrt wird und die andere geräte von netwerk
    Speech290.398305.19835765250abgekoppelt werden. Vielleicht möchten sie sich mit ihren nachbarn noch in verbindung setzen ob diese auch dieses probleme haben. Dann ich denke wirklich es liegt einfach an der alten verbindung hier ist dringend. (())
    Speech306.200309.25035765250zu erneuerung ja. Ich.
    Speech310.583313.63335765250Ja ich hoffe ich konnte ihn hier mit weiter helfen.
    Speech315.591317.89179945472Ja es gut zu wissen wo das problem liegt.
    Speech318.641323.05079945472Und #Ah ja das die, das die leitung (()) alt sind und wir das neues brauchen.
    Speech323.975325.25079945472Ich werde nicht (())
    Speech324.158324.93335765250Genau.
    Speech325.866329.53379945472mit mein mitmietern oder meinen nachbarn
    Speech330.616333.51679945472#Ah zusammen tun und werde mich bei uns (()) melden.
    Speech334.266335.75879945472Ich bedanke mich für die auskunft
    Speech335.308336.35035765250(())
    Speech336.850343.20835765250Ja gerne Herr Stein Müller wunderbar. Einen wunderschönen guten tag wünsche ich ihnen noch. Auf wiederhören.
    Speech343.708344.36679945472Ebenfalls.

    TRANSCRIPTION

    TIMETRANSCRIPT
    0.242
    1.567
    Hallo Future Bee.
    3.067
    4.483
    Hallo Future Bee.
    7.192
    11.358
    Hallo. Telekom. Grüß gott. Mein name ist Haba Landa.
    13.058
    15.542
    Hallo Frau Haba Landa. Hier Stein Müller.
    16.392
    19.192
    Hallo Herr Stein Müller. Was kann ich für sie tun?
    16.417
    17.042
    (())
    19.833
    27.117
    Ich habe eines neues ziemlichen vernindungsproblem. Mein internet verbindung (()) ständig ab.
    27.842
    29.525
    Und das, das
    30.733
    33.733
    Ja das müssten wir irgendiwie (()) bekommen.
    34.692
    44.325
    Ja Herr Stein Müller ein problem mit der netzwerk verbindung. Ich notiere mir das hier, wo wohnen sie denn?
    46.708
    48.867
    #Ah das ist in Oberaudorf.
    49.817
    54.300
    In Oberauford. Können sie mir hier eine postzeitzahl nennen?
    55.517
    57.133
    Ja das ist die
    57.700
    59.700
    <PII>achtviernulldreineun</PII>
    60.608
    63.200
    <PII>achtviernulldreineun</PII> Oberaudorf.
    63.733
    66.175
    Ja #am ja ich sehe.
    66.633
    69.900
    Hier sind wir anbieter, genau wunderbar.
    70.750
    75.817
    Und sie sagen hier haben sie netzwerk probleme nur mit dem internet?
    78.600
    79.325
    #am
    80.017
    84.033
    Telefoniert wird meistens über, über mein, mein handy erledigt also
    84.550
    86.983
    ich nutze meinen festnetz anfluss so gut wie (())
    87.575
    91.100
    Deswegen kann ich zum, zum festnetz jetzt gerade, #Ah gar nicht sagen.
    91.692
    99.825
    #Hmm #Mmm (()) mir okay. Also sie haben hier internet probleme. Fällt ihnen das zu eine bestimmten uhrzeit (()) auf?
    102.842
    106.250
    #am nein eigentlich vorbei ich
    106.967
    109.092
    ich bin nur abends im, im
    109.650
    112.483
    abtäglich im internet zur ab achtzehn uhr.
    113.933
    114.775
    #Hmm #Mmm
    114.792
    115.650
    Und
    116.917
    123.825
    Ja das ist (()) regelmäßig und dann ungefähr nach, nach fünf bis zehn minuten fangt (()) ab.
    124.417
    126.108
    Das die, die verbindung abreist.
    127.317
    142.025
    #Ah okay. Also am anfang ist noch alles (()) fünf bis zehn minuten reißt die verbindung ab. #Ah könnte ihr da liegen das einfach ein (()) verbraucht ist. Wie finden sich denn in ihrem haus, in, ja in ihren gebäude?
    142.175
    144.708
    Mehrere anschlusse.
    146.875
    150.692
    #Ah das ist ein, ein mehr familien haus, ein, ein mehr partien haus.
    151.575
    154.475
    Ich glaube mit #Ah sechzehn wohneinheiten.
    156.050
    159.408
    Und die mit sprechen wahrscheinlich auch zu viel anschlussen ja.
    159.800
    176.000
    Ja Herr Stein Müller. Ich denke hier haben wir das problem das einfach die auslastung, nicht mehr denn anforderungen [laugh] ja stand hilt. Hier könnten sie mit ihrem, sie wohnen auf miete gehen davon aus.
    177.541
    191.608
    Können sie das problem einmal mit ihrem vermieter besprechen? Eine glasfaser haben wir ihnen nämlich schon einmal angeboten damit hier eine bessere verbindung zwischen (()) kommt
    177.641
    178.750
    Ja ganz genau.
    191.916
    199.241
    Ja meinte damals das sie nicht nötig sein. Jetzt haben sie Herr Stein Müller (()) hier schon eine #Ah
    199.750
    209.158
    Anfang an und gestellt (()) netzwerk verbindung. Vielleicht haben sie auch mit bewohner denen das selbe probleme vorliegt.
    209.508
    212.008
    Wissen das, wissen sie etwas darüber?
    214.358
    217.691
    Ich weiss von meinem direkt nachbarn mit dem ich (()) sehr viel in kontakt.
    218.266
    223.908
    Der hat auch (()) eine schwierigkeiten damit #Ah eine, eine stabile verbindung zu erhalten ja.
    224.483
    236.391
    #Hmm ja. Also mein tipp fur sie jetzt konkret in ihre jetzigen situation. Nehmen sie einmal wenn sie im internet sind, dann nutzen sie ja nur ein gerät.
    236.450
    239.766
    Nehmen, nehmen sie die anderen geräte
    240.133
    246.766
    aus ihre verbindung heraus ja. Und haben sie ein (()) WLAN?
    249.166
    250.116
    Ja habe ich.
    249.525
    250.041
    Ja.
    250.750
    251.525
    Und.
    252.158
    257.116
    Ja es ist ein #am auch nur ein WLAN verwand or haben sie noch eine (()) zugang?
    259.425
    263.816
    Nein auch kein (()) zugang. Also einfach nur, (()) ich bin mit mein router.
    260.916
    261.575
    #Hmm
    264.891
    267.008
    Und diese auch sonst eigentlich.
    265.416
    266.666
    #Hmm #Mmm ja
    268.250
    270.191
    Das heißt eigentlich es ist niemand da.
    270.666
    273.500
    versicht da, mit, mit einwählen könnte.
    275.083
    290.008
    Ja aber genau also falls, falls dieses problem auf denken sie daran das nur ein gerät das sitze zeit nutzen im netwerk eingesperrt wird und die andere geräte von netwerk
    290.398
    305.198
    abgekoppelt werden. Vielleicht möchten sie sich mit ihren nachbarn noch in verbindung setzen ob diese auch dieses probleme haben. Dann ich denke wirklich es liegt einfach an der alten verbindung hier ist dringend. (())
    306.200
    309.250
    zu erneuerung ja. Ich.
    310.583
    313.633
    Ja ich hoffe ich konnte ihn hier mit weiter helfen.
    315.591
    317.891
    Ja es gut zu wissen wo das problem liegt.
    318.641
    323.050
    Und #Ah ja das die, das die leitung (()) alt sind und wir das neues brauchen.
    323.975
    325.250
    Ich werde nicht (())
    324.158
    324.933
    Genau.
    325.866
    329.533
    mit mein mitmietern oder meinen nachbarn
    330.616
    333.516
    #Ah zusammen tun und werde mich bei uns (()) melden.
    334.266
    335.758
    Ich bedanke mich für die auskunft
    335.308
    336.350
    (())
    336.850
    343.208
    Ja gerne Herr Stein Müller wunderbar. Einen wunderschönen guten tag wünsche ich ihnen noch. Auf wiederhören.
    343.708
    344.366
    Ebenfalls.

    Dataset Demographics

    Details Headline

    Language

    German

    Language code

    de

    Country

    Germany

    Accents

    Berlin,...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70

    Audio File Details

    Details Headline

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16 khz

    Channel

    Stereo

    Audio file duration

    5-15 minutes

    Download Sample Speech Dataset Now!

    Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

    Download Free Dataset

    Audio Download Btn
    Audio Promp Bg
    Audio Promp Bg

    Start your AI/ML model creation journey with FutureBeeAI!

    Contact Us

    Audio Arrow BtnAudio Arrow Btn Black
    Audio Promp 2 Bg