Spanish (Spain) Call Center Speech Dataset for Travel

The audio dataset includes call center conversations in Travel, featuring native Spanish speakers from Spain, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Spanish Language Call Center Speech Dataset for the Travel domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Travel industry.

With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Travel domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Spanish language spoken in Spain.

Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Travel domain, to build robust and accurate customer service speech technology.

To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Spanish speakers from different states/provinces of Spain. This collaborative effort ensures a balanced representation of Spain accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.

Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.

The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.

Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.

The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Spanish language call center speech recognition models for the Travel domain.

Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.

These ready-to-use transcriptions accelerate the development of Travel call center conversational AI and ASR models for the Spanish language.

Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.

If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.

License:

This Travel call center audio dataset is created by FutureBeeAI and is available for commercial use!

Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Travel sector, our dataset serves as a trusted resource to meet your goals

Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(46)Female(40)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.8591.963Speaker 1Hey Futurbee.
Speech2.5994.804Speaker 1Buenas tardes. Agencia de viajes
Speech5.2226.844Speaker 1Oasis. ¿En qué puedo ayudarle?
Speech7.57714.409Speaker 2Buenas tardes. Verá, es que necesitaba información, porque había pensado este veranos hacer un crucero con mi familia
Noise8.8299.188--
Speech14.91318.361Speaker 2y la verdad, como nunca lo he hecho pues quería que me asesoraran un poco.
Speech19.57620.681Speaker 2No s~, diga.
Speech19.58822.788Speaker 1Pues, en este momento tenemos ofertas de última hora
Speech23.20223.661Speaker 2Sí.
Speech24.07025.070Speaker 1en cruceros
Speech25.37025.902Speaker 2Sí.
Speech25.61128.306Speaker 1y llegarían hasta el veinticinco de junio.
Speech29.05030.777Speaker 2Ah, fenomenal. Me iría bien.
Speech31.18738.801Speaker 2[filler]Verá, nosotros estaríamos interesados, a ser posible, [filler] en un crucero por el Mediterráneo, porque la verdad es que me gusta mucho.
Speech31.49532.329Speaker 1La
Speech39.46844.890Speaker 1Pues le voy a comentar las ofertas. ¿De acuerdo? El primer crucero se llama La Música del Mar
Speech41.20741.786Speaker 2Dígame.
Speech45.80746.271Speaker 2Sí.
Speech45.81750.512Speaker 1[filler]Y el barco tendría que cogerlo entre el veintitrés de abril y el veinticinco de junio.
Speech50.92051.368Speaker 2Sí.
Speech51.09454.268Speaker 1Cuesta doscientos cincuenta y nueve euros por persona,
Speech54.37754.847Speaker 2[filler]
Noise54.63654.734--
Speech55.22557.347Speaker 1siempre y cuando la ocupación sea doble.
Speech58.33567.054Speaker 1Y el recorrido sería, Barcelona, Cagliari en Cerdeña, Palermo en Sicilia, Roma, Génova, Marsella y de vuelta a Barcelona.d
Speech67.95669.495Speaker 2[filler]¿Cuántos días sería?
Speech68.21569.197Speaker 1Y la segunda (())
Speech70.23970.831Speaker 1¿Perdón?
Speech70.95672.144Speaker 2¿Cuántos días sería?
Speech72.87073.677Speaker 1Ocho días.
Speech73.74575.102Speaker 2Ocho días. [filler]
Speech75.64080.849Speaker 1Tenemos otra oferta más, que es de trescientos ochenta y nueve euros, que se llama Pasión Mediterránea
Speech81.51387.162Speaker 1y el recorrido es diferente. Valencia, Marsella, Savona, Roma, Nápoles
Speech87.86190.022Speaker 1y [filler] Ibiza y Valencia de nuevo.
Speech90.77292.426Speaker 2[filler]Ese parece muy interesante.
Speech92.92699.304Speaker 1Sí. Y uno más, que est~ este esta oferta de última hora que se llama Symphony of the Seas.
Speech100.016102.158Speaker 1Tiene en diferente de los
Noise102.531102.849--
Speech102.852104.176Speaker 1anteriores que
Noise104.135104.394--
Speech104.953112.438Speaker 1[filler]a bordo puede usted [filler] contratar una di~ la dieta vegana, vegetariana o para celíacos.
Speech112.861117.903Speaker 2[filler]Bueno, eso en nuestro caso no sería necesario, porque nosotros comemos de todo.
Speech118.408123.694Speaker 1Ah, genial. Pues este crucero saldría el el ocho
Speech124.331128.324Speaker 1de abril, el veintidós de abril, el veintinueve de abril,
Speech128.919138.901Speaker 1y el cinco de mayo y el doce de junio. El recorrido es Barcelona, Palma, Marsella, La Spezia, Pizza, Florencia, Roma, Nápoles y Barcelona.
Speech128.985129.383Speaker 2[filler]
Noise139.258139.544--
Speech139.491139.967Speaker 2[filler]
Speech139.616143.014Speaker 1Y su precio es de seiscientos cuarenta y nueve euros por persona.
Speech142.449142.881Speaker 2[filler]
Speech144.472147.322Speaker 2Pues no está, la verdad que no está nada mal. No sé.
Speech147.854149.085Speaker 1Si ya quiere usted
Speech149.490151.020Speaker 1algo más
Speech151.417152.917Speaker 1[filler] durante el verano,
Speech153.304154.704Speaker 1por ejemplo julio y agosto,
Speech155.044155.520Speaker 2[filler]
Speech155.389162.288Speaker 1ya no serían ofertas de última hora. Eso ya serían paquetes contratados en familia, porque ¿me ha dicho usted que quiere ir en familia, verdad?
Speech161.866164.639Speaker 2Sí. Iríamos mi esposo y mis dos hijos.
Speech165.943176.935Speaker 1Pues, tenemos [filler] algunos cruceros especiales para familias en los que los niños pueden ha~ disfrutar de parques acuáticos, barcos piratas, castillos,
Noise177.282177.383--
Speech177.497180.967Speaker 1[filler]hay una habitación con consolas Xbox
Speech177.556178.199Speaker 2[filler]

TRANSCRIPTION

TIMETRANSCRIPT
0.859
1.963
Hey Futurbee.
2.599
4.804
Buenas tardes. Agencia de viajes
5.222
6.844
Oasis. ¿En qué puedo ayudarle?
7.577
14.409
Buenas tardes. Verá, es que necesitaba información, porque había pensado este veranos hacer un crucero con mi familia
8.829
9.188
-
14.913
18.361
y la verdad, como nunca lo he hecho pues quería que me asesoraran un poco.
19.576
20.681
No s~, diga.
19.588
22.788
Pues, en este momento tenemos ofertas de última hora
23.202
23.661
Sí.
24.070
25.070
en cruceros
25.370
25.902
Sí.
25.611
28.306
y llegarían hasta el veinticinco de junio.
29.050
30.777
Ah, fenomenal. Me iría bien.
31.187
38.801
[filler]Verá, nosotros estaríamos interesados, a ser posible, [filler] en un crucero por el Mediterráneo, porque la verdad es que me gusta mucho.
31.495
32.329
La
39.468
44.890
Pues le voy a comentar las ofertas. ¿De acuerdo? El primer crucero se llama La Música del Mar
41.207
41.786
Dígame.
45.807
46.271
Sí.
45.817
50.512
[filler]Y el barco tendría que cogerlo entre el veintitrés de abril y el veinticinco de junio.
50.920
51.368
Sí.
51.094
54.268
Cuesta doscientos cincuenta y nueve euros por persona,
54.377
54.847
[filler]
54.636
54.734
-
55.225
57.347
siempre y cuando la ocupación sea doble.
58.335
67.054
Y el recorrido sería, Barcelona, Cagliari en Cerdeña, Palermo en Sicilia, Roma, Génova, Marsella y de vuelta a Barcelona.d
67.956
69.495
[filler]¿Cuántos días sería?
68.215
69.197
Y la segunda (())
70.239
70.831
¿Perdón?
70.956
72.144
¿Cuántos días sería?
72.870
73.677
Ocho días.
73.745
75.102
Ocho días. [filler]
75.640
80.849
Tenemos otra oferta más, que es de trescientos ochenta y nueve euros, que se llama Pasión Mediterránea
81.513
87.162
y el recorrido es diferente. Valencia, Marsella, Savona, Roma, Nápoles
87.861
90.022
y [filler] Ibiza y Valencia de nuevo.
90.772
92.426
[filler]Ese parece muy interesante.
92.926
99.304
Sí. Y uno más, que est~ este esta oferta de última hora que se llama Symphony of the Seas.
100.016
102.158
Tiene en diferente de los
102.531
102.849
-
102.852
104.176
anteriores que
104.135
104.394
-
104.953
112.438
[filler]a bordo puede usted [filler] contratar una di~ la dieta vegana, vegetariana o para celíacos.
112.861
117.903
[filler]Bueno, eso en nuestro caso no sería necesario, porque nosotros comemos de todo.
118.408
123.694
Ah, genial. Pues este crucero saldría el el ocho
124.331
128.324
de abril, el veintidós de abril, el veintinueve de abril,
128.919
138.901
y el cinco de mayo y el doce de junio. El recorrido es Barcelona, Palma, Marsella, La Spezia, Pizza, Florencia, Roma, Nápoles y Barcelona.
128.985
129.383
[filler]
139.258
139.544
-
139.491
139.967
[filler]
139.616
143.014
Y su precio es de seiscientos cuarenta y nueve euros por persona.
142.449
142.881
[filler]
144.472
147.322
Pues no está, la verdad que no está nada mal. No sé.
147.854
149.085
Si ya quiere usted
149.490
151.020
algo más
151.417
152.917
[filler] durante el verano,
153.304
154.704
por ejemplo julio y agosto,
155.044
155.520
[filler]
155.389
162.288
ya no serían ofertas de última hora. Eso ya serían paquetes contratados en familia, porque ¿me ha dicho usted que quiere ir en familia, verdad?
161.866
164.639
Sí. Iríamos mi esposo y mis dos hijos.
165.943
176.935
Pues, tenemos [filler] algunos cruceros especiales para familias en los que los niños pueden ha~ disfrutar de parques acuáticos, barcos piratas, castillos,
177.282
177.383
-
177.497
180.967
[filler]hay una habitación con consolas Xbox
177.556
178.199
[filler]

Dataset Demographics

Details Headline

Language

Spanish

Language code

es

Country

Spain

Accents

Castellano del Norte,...more

Gender Distribution

M: 55, F: 45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg