![cookie-icon](/assets/img/Privacy/cookie-color-icon.webp)
We Use Cookies!!!
We use cookies to ensure that we give you the best experience on our website. Read cookies policies.
The audio dataset includes call center conversations in Healthcare, featuring native Spanish speakers from Spain, with detailed metadata and accurate transcriptions.
Unscripted Call Center Conversations
30 Speech Hours
July 2023
60
Welcome to the Spanish Language Call Center Speech Dataset for the Healthcare domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Healthcare industry.
With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Healthcare domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Spanish language spoken in Spain.
Speech Data:
This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Healthcare domain, to build robust and accurate customer service speech technology.
To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Spanish speakers from different states/provinces of Spain. This collaborative effort ensures a balanced representation of Spain accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.
Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.
The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.
Metadata:
In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.
The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Spanish language call center speech recognition models for the Healthcare domain.
Transcription:
To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.
These ready-to-use transcriptions accelerate the development of Healthcare call center conversational AI and ASR models for the Spanish language.
Updates and Customization:
We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.
If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.
License:
This Healthcare call center audio dataset is created by FutureBeeAI and is available for commercial use!
Conclusion:
Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Healthcare sector, our dataset serves as a trusted resource to meet your goals
Channel 1 | Channel 2 | Format |
---|---|---|
Female(40) | Male(31) | wav, json |
LABEL | START | END | CHANNEL | TRANSCRIPT |
---|---|---|---|---|
Speech | 1.112 | 2.156 | Speaker 1 | Hey Futurebee |
Noise | 3.443 | 3.601 | - | - |
Noise | 4.242 | 4.360 | - | - |
Speech | 4.541 | 5.484 | Speaker 2 | Hey Futurebee. |
Speech | 9.567 | 12.214 | Speaker 1 | Hola, buenos días. ¿El señor <PII>Antonio López</PII>? |
Speech | 13.022 | 15.176 | Speaker 2 | Sí, sí, soy yo. ¿Qué tal? Buenos días. |
Speech | 15.371 | 19.376 | Speaker 1 | Buenos días. Le llamo de la clínica Iderma. |
Speech | 20.274 | 27.596 | Speaker 1 | [filler]Probablemente no le sonará nuestro nombre, pero estamos azo~ asociados con el centro de fisioterapia donde acude usted habitualmente. |
Speech | 28.050 | 28.442 | Speaker 2 | Ya. |
Speech | 29.094 | 37.789 | Speaker 1 | Entonces, le quería informar que hemos creado un nuevo concepto de clínica. Vamos a inaugurar [filler] próximamente. |
Speech | 38.179 | 51.557 | Speaker 1 | Entones, como cliente del centro de fisioterapia, le queríamos explicar un poco el este nuevo este nuevo concepto de clínica y [filler] invitarlo a que nos conozca personalmente el día que inauguremos las instalaciones. |
Noise | 49.960 | 50.219 | - | - |
Speech | 51.960 | 52.411 | Speaker 2 | Sí. |
Speech | 52.231 | 53.526 | Speaker 1 | [filler]y |
Speech | 52.859 | 61.750 | Speaker 2 | A ver, un momentico. ¿Y estas instalaciones [filler] el centro este nuevo, esta nueva clínica, en qué sitio? ¿Donde? ¿Qué es aquí en en Barcelona? |
Speech | 62.216 | 68.683 | Speaker 1 | Está en Barcelona, sí. Muy cerca del del centro de fisioterapia donde donde usted era cliente. |
Speech | 68.938 | 69.248 | Speaker 2 | Sí. |
Speech | 69.795 | 79.831 | Speaker 1 | De momento ese centro lo vamos a mantener pero en en la nueva clínica, ya le digo, es un concepto más global. Va a haber muchos más servicios, a parte de la fisioterapia. |
Speech | 80.245 | 90.302 | Speaker 1 | Y usted puede puede acudir o puede combinar los tratamientos, porque algunos no van a estar en en los dos sitios, los vamos a tener en exclusiva en la clínica nueva. |
Noise | 90.492 | 90.796 | - | - |
Speech | 90.989 | 98.250 | Speaker 1 | [filler]Bueno, a parte de fisioterapia que es lo que usted, bueno [filler], te~ le tenemos en en ficha como cliente. |
Speech | 98.724 | 111.287 | Speaker 1 | Vamos a tener servicios de nutrición, servicios de estética, medicina de varios ámbitos. [filler] No sé si usted hace uso de estos servicios en otros centros, quizá. |
Noise | 111.424 | 111.864 | - | - |
Speech | 111.543 | 114.992 | Speaker 1 | Esta sería la manera de tenerlos un poco todos en el mismo sitio. |
Noise | 115.638 | 115.778 | - | - |
Speech | 115.656 | 115.953 | Speaker 2 | Sí. |
Speech | 116.308 | 116.801 | Speaker 1 | Qué |
Speech | 116.378 | 121.149 | Speaker 2 | No, me puede, me puede interesar, porque a parte de la fisioterapia que |
Noise | 121.263 | 121.462 | - | - |
Speech | 121.700 | 122.742 | Speaker 2 | ya me va muy bien, |
Speech | 123.236 | 126.465 | Speaker 2 | [noise] a esta, nutrición sí que me interesaría |
Speech | 127.075 | 136.020 | Speaker 2 | porque así podía combinar pues el tema este para mantener un poco el estado físico bien y tal, ¿no? Porque todo va acompañado. |
Speech | 135.078 | 135.436 | Speaker 1 | [filler] |
Speech | 136.717 | 144.008 | Speaker 2 | Pero, bueno, por eso te preguntaba antes si estaba en la en la zona. Si ya me dices que sí, pues sí, sí, puedo estar interesado. |
Speech | 144.519 | 149.776 | Speaker 1 | Sí, en l~ en concreto lo que me comenta de servicios de nutrición, tenemos asesores |
Noise | 149.842 | 150.181 | - | - |
Speech | 150.366 | 157.990 | Speaker 1 | tanto si existe una patología, por ejemplo problemas de de de peso de o que estén interesados en bajar de peso |
Speech | 158.497 | 165.747 | Speaker 1 | tanto personas que quieran, por ejemplo ganar masa muscular combinado con con entrenamiento físico |
Speech | 166.548 | 170.550 | Speaker 1 | una dieta especial, por ejemplo para deportistas o para gente que necesita |
Speech | 170.967 | 174.078 | Speaker 1 | [filler]pues, o que tiene un consumo de energía más elevado, |
Speech | 174.681 | 180.252 | Speaker 1 | [filler]tenemos, bueno, varios varios aspectos que se podrían tocar. No sé cuál cuál sería su caso en concreto. |
Speech | 179.133 | 185.443 | Speaker 2 | Vale. No, pero es que puede ser interesante, porque el hecho de bajar de peso pues bueno, es uno de mis problemas, ¿no? |
Speech | 180.991 | 181.544 | Speaker 1 | Pero (()). |
TIME | TRANSCRIPT |
---|---|
1.112 2.156 | Hey Futurebee |
3.443 3.601 | - |
4.242 4.360 | - |
4.541 5.484 | Hey Futurebee. |
9.567 12.214 | Hola, buenos días. ¿El señor <PII>Antonio López</PII>? |
13.022 15.176 | Sí, sí, soy yo. ¿Qué tal? Buenos días. |
15.371 19.376 | Buenos días. Le llamo de la clínica Iderma. |
20.274 27.596 | [filler]Probablemente no le sonará nuestro nombre, pero estamos azo~ asociados con el centro de fisioterapia donde acude usted habitualmente. |
28.050 28.442 | Ya. |
29.094 37.789 | Entonces, le quería informar que hemos creado un nuevo concepto de clínica. Vamos a inaugurar [filler] próximamente. |
38.179 51.557 | Entones, como cliente del centro de fisioterapia, le queríamos explicar un poco el este nuevo este nuevo concepto de clínica y [filler] invitarlo a que nos conozca personalmente el día que inauguremos las instalaciones. |
49.960 50.219 | - |
51.960 52.411 | Sí. |
52.231 53.526 | [filler]y |
52.859 61.750 | A ver, un momentico. ¿Y estas instalaciones [filler] el centro este nuevo, esta nueva clínica, en qué sitio? ¿Donde? ¿Qué es aquí en en Barcelona? |
62.216 68.683 | Está en Barcelona, sí. Muy cerca del del centro de fisioterapia donde donde usted era cliente. |
68.938 69.248 | Sí. |
69.795 79.831 | De momento ese centro lo vamos a mantener pero en en la nueva clínica, ya le digo, es un concepto más global. Va a haber muchos más servicios, a parte de la fisioterapia. |
80.245 90.302 | Y usted puede puede acudir o puede combinar los tratamientos, porque algunos no van a estar en en los dos sitios, los vamos a tener en exclusiva en la clínica nueva. |
90.492 90.796 | - |
90.989 98.250 | [filler]Bueno, a parte de fisioterapia que es lo que usted, bueno [filler], te~ le tenemos en en ficha como cliente. |
98.724 111.287 | Vamos a tener servicios de nutrición, servicios de estética, medicina de varios ámbitos. [filler] No sé si usted hace uso de estos servicios en otros centros, quizá. |
111.424 111.864 | - |
111.543 114.992 | Esta sería la manera de tenerlos un poco todos en el mismo sitio. |
115.638 115.778 | - |
115.656 115.953 | Sí. |
116.308 116.801 | Qué |
116.378 121.149 | No, me puede, me puede interesar, porque a parte de la fisioterapia que |
121.263 121.462 | - |
121.700 122.742 | ya me va muy bien, |
123.236 126.465 | [noise] a esta, nutrición sí que me interesaría |
127.075 136.020 | porque así podía combinar pues el tema este para mantener un poco el estado físico bien y tal, ¿no? Porque todo va acompañado. |
135.078 135.436 | [filler] |
136.717 144.008 | Pero, bueno, por eso te preguntaba antes si estaba en la en la zona. Si ya me dices que sí, pues sí, sí, puedo estar interesado. |
144.519 149.776 | Sí, en l~ en concreto lo que me comenta de servicios de nutrición, tenemos asesores |
149.842 150.181 | - |
150.366 157.990 | tanto si existe una patología, por ejemplo problemas de de de peso de o que estén interesados en bajar de peso |
158.497 165.747 | tanto personas que quieran, por ejemplo ganar masa muscular combinado con con entrenamiento físico |
166.548 170.550 | una dieta especial, por ejemplo para deportistas o para gente que necesita |
170.967 174.078 | [filler]pues, o que tiene un consumo de energía más elevado, |
174.681 180.252 | [filler]tenemos, bueno, varios varios aspectos que se podrían tocar. No sé cuál cuál sería su caso en concreto. |
179.133 185.443 | Vale. No, pero es que puede ser interesante, porque el hecho de bajar de peso pues bueno, es uno de mis problemas, ¿no? |
180.991 181.544 | Pero (()). |
Spanish
es
Spain
Castellano del Norte,...more
M: 55, F: 45
18-70
Silent, Noisy
16 bit
wav
8khz
Dual separate channel
5-15 minutes
Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.
Download Free Dataset
Contact Us