Spanish (Spain) Call Center Speech Dataset for BFSI

The audio dataset comprises call center conversations for the BFSI domain, featuring native Spanish speakers from Spain. It includes speech data, detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

Jun 2024

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

Introduction

Welcome to the Spanish Call Center Speech Dataset for the BFSI domain designed to enhance the development of call center speech recognition models specifically for the BFSI industry. This dataset is meticulously curated to support advanced speech recognition, natural language processing, conversational AI, and generative voice AI algorithms.

Speech Data

This training dataset comprises 30 Hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, designed to build robust and accurate customer service speech technology.

  • Participant Diversity:
  • Speakers: 60 People expert native Spanish speakers from the FutureBeeAI Community.
  • Regions: Different states/provinces of Spain, ensuring a balanced representation of Spanish accents, dialects, and demographics.
  • Participant Profile: Participants range from 18 to 70 years old, representing both males and females in a 60:40 ratio, respectively.
  • Recording Details:
  • Conversation Nature: Unscripted and spontaneous conversations between call center agents and customers.
  • Call Duration: Average duration of 5 to 15 minutes per call.
  • Formats: WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 and 16 kHz.
  • Environment: Without background noise and without echo.
  • Topic Diversity

    This dataset offers a diverse range of conversation topics, call types, and outcomes, including both inbound and outbound calls with positive, neutral, and negative outcomes.

  • Inbound Calls:
  • Debit Card Block Request
  • Home Loan Enquiry
  • Transaction Disputes
  • Credit Card Billing Dispute
  • Account Closure Procedures
  • Claim Procedures
  • Premium Payments
  • Policy Comparison
  • Policy Cancellation or Lapse
  • Insurance Renewal Options
  • Retirement Planning
  • Investment Risk Assessment Questionnaires
  • Tax-efficient Investment Strategies
  • Investment Performance Enquiry, and many more
  • Outbound Calls:
  • Credit Card Offers
  • Loan Offers
  • Loyalty Program Benefits
  • Customer Satisfaction Surveys
  • EMI Reminder Call
  • Policy Upgrade Offers
  • Claim Status Updates
  • Policyholder Loyalty Benefits
  • Insurance Policyholder Surveys
  • Term Life Insurance Offer
  • Investment Opportunities
  • Retirement Savings Review, and many more
  • This extensive coverage ensures the dataset includes realistic call center scenarios, which is essential for developing effective customer support speech recognition models.

    Transcription

    To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. These transcriptions feature:

  • Speaker-wise Segmentation: Time-coded segments for both agents and customers.
  • Non-Speech Labels: Tags and labels for non-speech elements.
  • Word Error Rate: Word error rate is less than 5% thanks to the dual layer of QA.
  • These ready-to-use transcriptions accelerate the development of the BFSI domain call center conversational AI and ASR models for the Spanish language.

    Metadata

    The dataset provides comprehensive metadata for each conversation and participant:

  • Participant Metadata: Unique identifier, age, gender, country, state, district, accent and dialect.
  • Conversation Metadata: Domain, topic, call type, outcome/sentiment, bit depth, and sample rate.
  • This metadata is a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Spanish call center speech recognition models.

    Usage and Applications

    This dataset can be used for various applications in the fields of speech recognition, natural language processing, and conversational AI, specifically tailored to the BFSI domain. Potential use cases include:

  • Speech Recognition Models: Training and fine-tuning speech recognition models for Spanish.
  • Speech Analytics Models: Building speech analytics models to extract insights, identify patterns, and glean valuable information from customer conversation, enables data-driven decision-making and process optimization within the BFSI sector.
  • Smart Assistants and Chatbots: Developing conversational agents and virtual assistants for customer service in the BFSI industries.
  • Sentiment Analysis: Analyzing customer sentiment and improving customer experience based on call center interactions.
  • Generative AI: Training generative AI models capable of generating human-like responses, summaries, or content tailored to the BFSI domain.
  • Secure and Ethical Collection

  • Our proprietary data collection and transcription platform, “Yugo” was used throughout the process of this dataset creation.
  • Throughout the data collection process, the data remained within our secure platform and did not leave our environment, ensuring data security and confidentiality.
  • The data collection process adhered to strict ethical guidelines, ensuring the privacy and consent of all participants.
  • It does not include any personally identifiable information about any participant, which makes the dataset safe to use.
  • The dataset does not contain any copyrighted content.
  • Updates and Customization

    Understanding the importance of diverse environments for robust ASR models, our call center voice dataset is regularly updated with new audio data captured in various real-world conditions.

  • Customization & Custom Collection Options:
  • Environmental Conditions: Custom collection in specific environmental conditions upon request.
  • Sample Rates: Customizable from 8kHz to 48kHz.
  • Transcription Customization: Tailored to specific guidelines and requirements.
  • License

    This BFSI domain call center audio dataset is created by FutureBeeAI and is available for commercial use.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Sample Line

    ATTRIBUTES

    Channel 1Channel 2Format
    Female(46)Female(40)wav, json

    TRANSCRIPTION

    LABELSTARTENDCHANNELTRANSCRIPT
    Speech0.7101.808Speaker 2Hey Futurebee
    Speech3.7936.735Speaker 1Banco Mediterráneo, buenos días. ¿En qué puedo ayudarle?
    Speech7.31511.442Speaker 2Buenos días, me gustaría informarme de las cuentas que tienen.
    Speech12.20114.390Speaker 1Claro que sí. ¿Es usted cliente nuestro?
    Speech15.08915.682Speaker 2No.
    Speech16.41922.280Speaker 1Ah, pues le informo. Verá, tiene dos tipos de cuentas, las cuentas de ahorro y las cuentas corrientes.
    Speech22.85229.414Speaker 1Las cuentas de ahorro son aquellas cuentas en las que usted ingresa una cantidad de dinero con intención de
    Noise25.53925.728--
    Noise26.32726.695--
    Speech29.95130.803Speaker 1dejarla ahí
    Noise31.10931.396--
    Speech31.27434.701Speaker 1y eso le va a generar una serie de intereses a final de mes.
    Noise31.99532.554--
    Speech35.10946.655Speaker 1Y las cuentas corrientes sirven para que usted [filler] disponga de su dinero inmediatamente, ya sea mediante cheque, talón o cualquier otro método de pago. ¿En qué estaría usted interesado?
    Noise39.72540.094--
    Speech47.25848.655Speaker 2En una cuenta corriente.
    Speech49.17350.219Speaker 1Ah, fenomenal.
    Speech50.85954.496Speaker 1Y dígame, ¿asociaría a esta cuenta u~ una tarjeta?
    Noise51.95352.264--
    Speech55.90257.097Speaker 2[filler] Sí.
    Speech57.65460.051Speaker 1Y qué sería, ¿una tarjeta de crédito o de débito?
    Speech61.32062.728Speaker 2[filler] Eso no lo sé.
    Noise63.12563.682--
    Speech64.20065.337Speaker 2¿Cuál es la difirencia?
    Noise64.36764.733--
    Speech66.08781.031Speaker 1Verá, una tarjeta [filler] de crédito es una tarjeta que le proporciona el banco y que le da acceso a un crédito, donde usted podrá hacer uso de él durante todo el mes, y al final del mes deberá pa~ deberá abonar, eso, la cantidad que usted haya utilizado.
    Speech81.55185.763Speaker 1[filler] Y todo eso por un tanto por ciento que le cobrará el banco.
    Speech86.52287.010Speaker 2[filler]
    Speech87.41893.896Speaker 1Una pequeña comisión. Y su cuenta de débito, usted solamente dispondrá del dinero que usted tenga en su cuenta.
    Speech96.34098.266Speaker 2De acuerdo. Una tarjeta de débito.
    Speech98.76099.927Speaker 1Ah, pues fenomenal.
    Speech100.852105.075Speaker 1Si quiere, le puedo mandar la documentación a su correo electrónico
    Speech105.703110.587Speaker 1y usted, en cualquier momento se paso por c~ cualquiera de nuestras oficinas y formaliza el contrato.
    Noise111.131111.498--
    Speech112.078112.896Speaker 2De acuerdo.
    Noise113.126113.459--
    Speech114.912118.453Speaker 1Y, dígame. ¿Me podría [filler] me podría facilitar su correo electrónico?
    Speech118.878121.706Speaker 2Por supuesto. <PII>Manuela García</PII> arroba
    Speech122.474123.539Speaker 2Gmail punto com.
    Speech124.022125.378Speaker 1Muy bien. Un segundo.
    Speech126.947136.354Speaker 1Pues, le acabo de mandar toda la información. Si usted quiere, mañana se pasa por cualquiera de nuestras oficinas y nosotros le tramitamos el alta tanto de la tarjeta como de la cuenta.
    Speech137.085140.913Speaker 2De acuerdo. Pero antes de hacerme la cuenta, tengo algunas preguntas.
    Speech141.497142.711Speaker 1Sí, claro. Dígame.
    Noise142.407142.669--
    Speech143.187149.657Speaker 2Me gustaría saber [filler] si tendría acceso con esa cuenta a mi cuenta de Paypal
    Speech151.298151.979Speaker 1Sí, claro.
    Speech151.497151.953Speaker 2y
    Noise152.479152.763--
    Speech152.614153.032Speaker 2¿Sí?
    Speech153.620158.792Speaker 1A ver, le explico. Nosotros tenemos una aplicación, una Ap~ una App
    Speech159.292174.252Speaker 1en la que usted podrá ingresar con su <initial>DNI</initial> y con la clave que le facilitemos y usted, desde ahí, podrá acceder tanto a su cuenta de Paypal como si quiere reali~ quiere crear una tarjeta virtual con la comprar por internet. Es muy sencillo y bastante intuitivo.
    Speech175.050176.786Speaker 2¿Tengo acceso a Bizum también?
    Speech177.824187.286Speaker 1Sí, claro. Eso, y además es superfácil. Si tiene algún problema usted solamente tiene que llamarnos aquí a atención al cliente y yo le explico exactamente lo que tiene que hacer

    TRANSCRIPTION

    TIMETRANSCRIPT
    0.710
    1.808
    Hey Futurebee
    3.793
    6.735
    Banco Mediterráneo, buenos días. ¿En qué puedo ayudarle?
    7.315
    11.442
    Buenos días, me gustaría informarme de las cuentas que tienen.
    12.201
    14.390
    Claro que sí. ¿Es usted cliente nuestro?
    15.089
    15.682
    No.
    16.419
    22.280
    Ah, pues le informo. Verá, tiene dos tipos de cuentas, las cuentas de ahorro y las cuentas corrientes.
    22.852
    29.414
    Las cuentas de ahorro son aquellas cuentas en las que usted ingresa una cantidad de dinero con intención de
    25.539
    25.728
    -
    26.327
    26.695
    -
    29.951
    30.803
    dejarla ahí
    31.109
    31.396
    -
    31.274
    34.701
    y eso le va a generar una serie de intereses a final de mes.
    31.995
    32.554
    -
    35.109
    46.655
    Y las cuentas corrientes sirven para que usted [filler] disponga de su dinero inmediatamente, ya sea mediante cheque, talón o cualquier otro método de pago. ¿En qué estaría usted interesado?
    39.725
    40.094
    -
    47.258
    48.655
    En una cuenta corriente.
    49.173
    50.219
    Ah, fenomenal.
    50.859
    54.496
    Y dígame, ¿asociaría a esta cuenta u~ una tarjeta?
    51.953
    52.264
    -
    55.902
    57.097
    [filler] Sí.
    57.654
    60.051
    Y qué sería, ¿una tarjeta de crédito o de débito?
    61.320
    62.728
    [filler] Eso no lo sé.
    63.125
    63.682
    -
    64.200
    65.337
    ¿Cuál es la difirencia?
    64.367
    64.733
    -
    66.087
    81.031
    Verá, una tarjeta [filler] de crédito es una tarjeta que le proporciona el banco y que le da acceso a un crédito, donde usted podrá hacer uso de él durante todo el mes, y al final del mes deberá pa~ deberá abonar, eso, la cantidad que usted haya utilizado.
    81.551
    85.763
    [filler] Y todo eso por un tanto por ciento que le cobrará el banco.
    86.522
    87.010
    [filler]
    87.418
    93.896
    Una pequeña comisión. Y su cuenta de débito, usted solamente dispondrá del dinero que usted tenga en su cuenta.
    96.340
    98.266
    De acuerdo. Una tarjeta de débito.
    98.760
    99.927
    Ah, pues fenomenal.
    100.852
    105.075
    Si quiere, le puedo mandar la documentación a su correo electrónico
    105.703
    110.587
    y usted, en cualquier momento se paso por c~ cualquiera de nuestras oficinas y formaliza el contrato.
    111.131
    111.498
    -
    112.078
    112.896
    De acuerdo.
    113.126
    113.459
    -
    114.912
    118.453
    Y, dígame. ¿Me podría [filler] me podría facilitar su correo electrónico?
    118.878
    121.706
    Por supuesto. <PII>Manuela García</PII> arroba
    122.474
    123.539
    Gmail punto com.
    124.022
    125.378
    Muy bien. Un segundo.
    126.947
    136.354
    Pues, le acabo de mandar toda la información. Si usted quiere, mañana se pasa por cualquiera de nuestras oficinas y nosotros le tramitamos el alta tanto de la tarjeta como de la cuenta.
    137.085
    140.913
    De acuerdo. Pero antes de hacerme la cuenta, tengo algunas preguntas.
    141.497
    142.711
    Sí, claro. Dígame.
    142.407
    142.669
    -
    143.187
    149.657
    Me gustaría saber [filler] si tendría acceso con esa cuenta a mi cuenta de Paypal
    151.298
    151.979
    Sí, claro.
    151.497
    151.953
    y
    152.479
    152.763
    -
    152.614
    153.032
    ¿Sí?
    153.620
    158.792
    A ver, le explico. Nosotros tenemos una aplicación, una Ap~ una App
    159.292
    174.252
    en la que usted podrá ingresar con su <initial>DNI</initial> y con la clave que le facilitemos y usted, desde ahí, podrá acceder tanto a su cuenta de Paypal como si quiere reali~ quiere crear una tarjeta virtual con la comprar por internet. Es muy sencillo y bastante intuitivo.
    175.050
    176.786
    ¿Tengo acceso a Bizum también?
    177.824
    187.286
    Sí, claro. Eso, y además es superfácil. Si tiene algún problema usted solamente tiene que llamarnos aquí a atención al cliente y yo le explico exactamente lo que tiene que hacer

    Dataset Demographics

    Details Headline

    Language

    Spanish

    Language code

    es

    Country

    Spain

    Accents

    Castellano del Norte,...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70

    Audio File Details

    Details Headline

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo

    Audio file duration

    5-15 minutes

    Download Sample Speech Dataset Now!

    Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

    Download Free Dataset

    Audio Download Btn
    Audio Promp Bg
    Audio Promp Bg

    Start your AI/ML model creation journey with FutureBeeAI!

    Contact Us

    Audio Arrow BtnAudio Arrow Btn Black
    Audio Promp 2 Bg