![cookie-icon](/assets/img/Privacy/cookie-color-icon.webp)
We Use Cookies!!!
We use cookies to ensure that we give you the best experience on our website. Read cookies policies.
The audio dataset includes call center conversations in Healthcare, featuring native Gujarati speakers from India, with detailed metadata and accurate transcriptions.
Unscripted Call Center Conversations
30 Speech Hours
July 2023
60
Welcome to the Gujarati Language Call Center Speech Dataset for the Healthcare domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Healthcare industry.
With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Healthcare domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Gujarati language spoken in India.
Speech Data:
This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Healthcare domain, to build robust and accurate customer service speech technology.
To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Gujarati speakers from different part of Gujarat. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.
Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.
The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.
Metadata:
In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.
The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Gujarati language call center speech recognition models for the Healthcare domain.
Transcription:
To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.
These ready-to-use transcriptions accelerate the development of Healthcare call center conversational AI and ASR models for the Gujarati language.
Updates and Customization:
We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.
If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.
License:
This Healthcare call center audio dataset is created by FutureBeeAI and is available for commercial use!
Conclusion:
Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Healthcare sector, our dataset serves as a trusted resource to meet your goals
Channel 1 | Channel 2 | Format |
---|---|---|
Male(30) | Male(26) | wav, json |
LABEL | START | END | CHANNEL | TRANSCRIPT |
---|---|---|---|---|
Speech | 0.525 | 1.075 | Speaker 1 | <lang:Foreign>Hello</lang:Foreign> |
Speech | 1.800 | 4.424 | Speaker 2 | <lang:Foreign>Hello featurebee</lang:Foreign> #અર |
Speech | 5.474 | 8.975 | Speaker 1 | હા હું <lang:Foreign>feature b hospital</lang:Foreign>થી બોલું છું. <lang:Foreign>customer representative</lang:Foreign> |
Speech | 9.451 | 13.948 | Speaker 1 | <lang:Foreign>sir</lang:Foreign> તમે એક <lang:Foreign>Query</lang:Foreign>નોધાવી હતી અમારા <lang:Foreign>website</lang:Foreign>પર એટલે તમને <lang:Foreign>Call</lang:Foreign>કરવા માં આવે છે. |
Speech | 14.248 | 17.148 | Speaker 1 | તમે મને જણાવી શકો કે તમારે શું જાણવું હતું? |
Speech | 19.122 | 30.371 | Speaker 2 | હા<lang:Foreign>sir</lang:Foreign> મારે <lang:Foreign>Actually covid vaccine</lang:Foreign>ની થોડી ગણી માહિતી જોઈતી હતી. <lang:Foreign>Because</lang:Foreign> #અર અત્યારે મેં મારા <lang:Foreign>family</lang:Foreign> બે <lang:Foreign>dose</lang:Foreign>લીધા છે. <lang:Foreign>vaccine</lang:Foreign>ના |
Speech | 25.597 | 26.122 | Speaker 1 | અચ્છા |
Speech | 31.071 | 32.021 | Speaker 1 | હા હા |
Speech | 31.921 | 35.395 | Speaker 2 | તો એની આગળ શું કેવી રીતે ધ્યાન રાખવા નું એ થોડુક કહેશો અમને |
Speech | 37.076 | 40.350 | Speaker 1 | અચ્છા અચ્છા હા તો અત્યારે આજકાલ છે ને #આહ |
Speech | 41.175 | 43.175 | Speaker 1 | <lang:Foreign>covid</lang:Foreign> ની <lang:Foreign>wave</lang:Foreign> ચાલુ થાય છે. |
Speech | 43.650 | 46.574 | Speaker 1 | એટલે જરૂરી છે કે તમે <lang:Foreign>vaccine</lang:Foreign> લો આની અને |
Speech | 46.950 | 54.098 | Speaker 1 | એ આજ કાલ કેવું છે. <lang:Foreign>market</lang:Foreign> છે ને <lang:Foreign>wave</lang:Foreign> પાછી આવે છે. એટલે <lang:Foreign>covid</lang:Foreign> નો <lang:Foreign>booster dose</lang:Foreign> બધાએ કરાવી જ લેવું જોઈએ. |
Speech | 55.648 | 56.499 | Speaker 1 | તો એનામાં |
Speech | 56.900 | 61.872 | Speaker 1 | હા તમે પહેલા <lang:Foreign>vaccine</lang:Foreign> લીધી હશે તો તમે તમારા <lang:Foreign>family</lang:Foreign> વાળા એ બંને <lang:Foreign>dose</lang:Foreign> પુરા કર્યા હશે. |
Speech | 57.598 | 58.223 | Speaker 2 | <lang:Foreign>ok</lang:Foreign> |
Speech | 63.003 | 67.827 | Speaker 2 | હા અમારા અમારા પાંચ <lang:Foreign>member</lang:Foreign>છે. ઘરમાં બધાના બે બે <lang:Foreign>dose</lang:Foreign> તો થઇ ગયા છે. |
Speech | 68.002 | 70.499 | Speaker 2 | એમને કેટલા ત્રણ ચાર મહિના થઇ ગયા એમને લઈને |
Speech | 68.424 | 69.024 | Speaker 1 | આચ્છા |
Speech | 71.574 | 76.423 | Speaker 1 | અચ્છા કયા <lang:Foreign>dose</lang:Foreign>લીધા તા તમે <lang:Foreign>Covaxin covishield</lang:Foreign> કે બીજું કાઈ |
Speech | 78.573 | 81.247 | Speaker 2 | <lang:Foreign>most of</lang:Foreign> બધા ના તો અમારા <lang:Foreign>covishield</lang:Foreign>ના જ હતા. |
Speech | 82.372 | 85.308 | Speaker 1 | અચ્છા અને બેઉ <lang:Foreign>dose</lang:Foreign> બધા ના પુરા જ થઇ ગયા હતા. |
Speech | 83.808 | 85.758 | Speaker 2 | #હમ |
Speech | 85.808 | 95.807 | Speaker 1 | અચ્છા હા તો તમે <lang:Foreign>covishield</lang:Foreign> બેઉ <lang:Foreign>dose</lang:Foreign>પુરા કર્યા છે તો તમારે હવે ત્રીજો <lang:Foreign>booster dose</lang:Foreign>લેવા નો છે. ને હું જાની શકું કે ક્યારે અમે પુરા કર્યા છે આ બૅઉ <lang:Foreign>dose</lang:Foreign> એક વર્ષ થાયી ગયો છે આ બન્નેઓને |
Speech | 98.381 | 107.661 | Speaker 2 | મને તો થઇ ગયો છે. મને અને મારા <lang:Foreign>father</lang:Foreign> ને પણ મારી <lang:Foreign>wife</lang:Foreign> અને મમ્મી ના હજુ ચાર કે પાંચ મહિના થયા છે. બે <lang:Foreign>dose</lang:Foreign>પતિ ને |
Speech | 109.035 | 115.385 | Speaker 1 | અચ્છા અચ્છા તો એમાં <lang:Foreign>sir</lang:Foreign> વાત એવી છે કે એક વર્ષ પતેને તો જ તમારે <lang:Foreign>booster dose</lang:Foreign> લઇ શકો. |
Speech | 115.385 | 116.834 | Speaker 2 | <lang:Foreign>dose</lang:Foreign> લેવાય <lang:Foreign>ok</lang:Foreign> |
Speech | 116.359 | 123.908 | Speaker 1 | હા એટલે હમણા હું <lang:Foreign>suggest</lang:Foreign> નહિ કરીશ કે તમારા <lang:Foreign>wife</lang:Foreign> કે તમારા મમ્મી પછી કરવડાવો <lang:Foreign>but</lang:Foreign> તમે છે ને તમે અને તમારા <lang:Foreign>father</lang:Foreign> પહેલા કરાવીદોં. |
Speech | 124.483 | 132.498 | Speaker 1 | તો એ તો <lang:Foreign>process</lang:Foreign> તો <lang:Foreign>sir</lang:Foreign> એમાં છે ને એટલે તમે ગયા વખત કરાયું <lang:Foreign>last time</lang:Foreign> હતું એવું જ છે. એટલે એમાં કોઈ <lang:Foreign>change</lang:Foreign>નથી. |
Speech | 126.683 | 127.183 | Speaker 2 | #અર |
Speech | 133.049 | 134.851 | Speaker 1 | <lang:Foreign>but</lang:Foreign> તમારે શું જાણવું હતું |
Speech | 134.426 | 139.426 | Speaker 2 | અચ્છા એની પણ એની પણ <lang:Foreign>same appointment</lang:Foreign> લઇ ને <lang:Foreign>slot book</lang:Foreign> કરાવીએ એવું છે કે |
Noise | 135.351 | 138.076 | - | - |
Speech | 139.326 | 149.649 | Speaker 1 | હા હા એ તમારે એ જે તમે આરોગ્ય શેતુ <lang:Foreign>app</lang:Foreign> ઉપર કરતાં હતા ને પહેલા જ <lang:Foreign>appointment</lang:Foreign> જોતા હતા. તમે પેલા ત્યાં એટલે કાતો એકવાર તમે <lang:Foreign>app</lang:Foreign> ખોલો એટલે હું તમને હમણાજ તમને ફટાફટ <lang:Foreign>guide</lang:Foreign> કરી દઈ તમને. |
Speech | 145.075 | 145.725 | Speaker 2 | #અર |
Speech | 151.038 | 151.748 | Speaker 1 | એવું હોય તો |
Speech | 152.163 | 152.798 | Speaker 2 | અચ્છા |
Speech | 152.899 | 153.413 | Speaker 1 | હા |
Speech | 153.274 | 163.012 | Speaker 2 | નહિ એ <lang:Foreign>procees</lang:Foreign> તો મને ખબર છે. એટલે <lang:Foreign>sem</lang:Foreign> પોત પોતાના બે <lang:Foreign>slot</lang:Foreign> હવે મારા ને મારા <lang:Foreign>father</lang:Foreign> ના બે <lang:Foreign>slot book</lang:Foreign> કરાવી દઈસ હું. અમારા નજીક ના <lang:Foreign>center</lang:Foreign>માં |
Speech | 164.111 | 166.211 | Speaker 2 | એ તો ખબર છે મને <lang:Foreign>process</lang:Foreign> |
Speech | 165.561 | 166.220 | Speaker 1 | હા |
Speech | 167.446 | 168.817 | Speaker 1 | અચ્છા હા |
Speech | 167.561 | 172.210 | Speaker 2 | એ <lang:Foreign>appoimennt</lang:Foreign> લઇ ને <lang:Foreign>boosterdose</lang:Foreign>લઇ આવવા નો બસ એટલું જ છે એમાં |
Noise | 168.818 | 170.760 | - | - |
Speech | 172.910 | 183.023 | Speaker 1 | હા હા એમાં એટલું જ છે એમાં કઈ વધારે જાજુ નથી. તમે એક કામ કરો ને તમે મન ખાલી એટલું કોને હું ફટાફટ એ <lang:Foreign>chek</lang:Foreign> કરી લઉં કે <lang:Foreign>slot</lang:Foreign>માં છે કે નય <lang:Foreign>booseter dose</lang:Foreign> તમારા <lang:Foreign>area</lang:Foreign> માં તમે ક્યાં રહો છો સુરતમાં? |
TIME | TRANSCRIPT |
---|---|
0.525 1.075 | <lang:Foreign>Hello</lang:Foreign> |
1.800 4.424 | <lang:Foreign>Hello featurebee</lang:Foreign> #અર |
5.474 8.975 | હા હું <lang:Foreign>feature b hospital</lang:Foreign>થી બોલું છું. <lang:Foreign>customer representative</lang:Foreign> |
9.451 13.948 | <lang:Foreign>sir</lang:Foreign> તમે એક <lang:Foreign>Query</lang:Foreign>નોધાવી હતી અમારા <lang:Foreign>website</lang:Foreign>પર એટલે તમને <lang:Foreign>Call</lang:Foreign>કરવા માં આવે છે. |
14.248 17.148 | તમે મને જણાવી શકો કે તમારે શું જાણવું હતું? |
19.122 30.371 | હા<lang:Foreign>sir</lang:Foreign> મારે <lang:Foreign>Actually covid vaccine</lang:Foreign>ની થોડી ગણી માહિતી જોઈતી હતી. <lang:Foreign>Because</lang:Foreign> #અર અત્યારે મેં મારા <lang:Foreign>family</lang:Foreign> બે <lang:Foreign>dose</lang:Foreign>લીધા છે. <lang:Foreign>vaccine</lang:Foreign>ના |
25.597 26.122 | અચ્છા |
31.071 32.021 | હા હા |
31.921 35.395 | તો એની આગળ શું કેવી રીતે ધ્યાન રાખવા નું એ થોડુક કહેશો અમને |
37.076 40.350 | અચ્છા અચ્છા હા તો અત્યારે આજકાલ છે ને #આહ |
41.175 43.175 | <lang:Foreign>covid</lang:Foreign> ની <lang:Foreign>wave</lang:Foreign> ચાલુ થાય છે. |
43.650 46.574 | એટલે જરૂરી છે કે તમે <lang:Foreign>vaccine</lang:Foreign> લો આની અને |
46.950 54.098 | એ આજ કાલ કેવું છે. <lang:Foreign>market</lang:Foreign> છે ને <lang:Foreign>wave</lang:Foreign> પાછી આવે છે. એટલે <lang:Foreign>covid</lang:Foreign> નો <lang:Foreign>booster dose</lang:Foreign> બધાએ કરાવી જ લેવું જોઈએ. |
55.648 56.499 | તો એનામાં |
56.900 61.872 | હા તમે પહેલા <lang:Foreign>vaccine</lang:Foreign> લીધી હશે તો તમે તમારા <lang:Foreign>family</lang:Foreign> વાળા એ બંને <lang:Foreign>dose</lang:Foreign> પુરા કર્યા હશે. |
57.598 58.223 | <lang:Foreign>ok</lang:Foreign> |
63.003 67.827 | હા અમારા અમારા પાંચ <lang:Foreign>member</lang:Foreign>છે. ઘરમાં બધાના બે બે <lang:Foreign>dose</lang:Foreign> તો થઇ ગયા છે. |
68.002 70.499 | એમને કેટલા ત્રણ ચાર મહિના થઇ ગયા એમને લઈને |
68.424 69.024 | આચ્છા |
71.574 76.423 | અચ્છા કયા <lang:Foreign>dose</lang:Foreign>લીધા તા તમે <lang:Foreign>Covaxin covishield</lang:Foreign> કે બીજું કાઈ |
78.573 81.247 | <lang:Foreign>most of</lang:Foreign> બધા ના તો અમારા <lang:Foreign>covishield</lang:Foreign>ના જ હતા. |
82.372 85.308 | અચ્છા અને બેઉ <lang:Foreign>dose</lang:Foreign> બધા ના પુરા જ થઇ ગયા હતા. |
83.808 85.758 | #હમ |
85.808 95.807 | અચ્છા હા તો તમે <lang:Foreign>covishield</lang:Foreign> બેઉ <lang:Foreign>dose</lang:Foreign>પુરા કર્યા છે તો તમારે હવે ત્રીજો <lang:Foreign>booster dose</lang:Foreign>લેવા નો છે. ને હું જાની શકું કે ક્યારે અમે પુરા કર્યા છે આ બૅઉ <lang:Foreign>dose</lang:Foreign> એક વર્ષ થાયી ગયો છે આ બન્નેઓને |
98.381 107.661 | મને તો થઇ ગયો છે. મને અને મારા <lang:Foreign>father</lang:Foreign> ને પણ મારી <lang:Foreign>wife</lang:Foreign> અને મમ્મી ના હજુ ચાર કે પાંચ મહિના થયા છે. બે <lang:Foreign>dose</lang:Foreign>પતિ ને |
109.035 115.385 | અચ્છા અચ્છા તો એમાં <lang:Foreign>sir</lang:Foreign> વાત એવી છે કે એક વર્ષ પતેને તો જ તમારે <lang:Foreign>booster dose</lang:Foreign> લઇ શકો. |
115.385 116.834 | <lang:Foreign>dose</lang:Foreign> લેવાય <lang:Foreign>ok</lang:Foreign> |
116.359 123.908 | હા એટલે હમણા હું <lang:Foreign>suggest</lang:Foreign> નહિ કરીશ કે તમારા <lang:Foreign>wife</lang:Foreign> કે તમારા મમ્મી પછી કરવડાવો <lang:Foreign>but</lang:Foreign> તમે છે ને તમે અને તમારા <lang:Foreign>father</lang:Foreign> પહેલા કરાવીદોં. |
124.483 132.498 | તો એ તો <lang:Foreign>process</lang:Foreign> તો <lang:Foreign>sir</lang:Foreign> એમાં છે ને એટલે તમે ગયા વખત કરાયું <lang:Foreign>last time</lang:Foreign> હતું એવું જ છે. એટલે એમાં કોઈ <lang:Foreign>change</lang:Foreign>નથી. |
126.683 127.183 | #અર |
133.049 134.851 | <lang:Foreign>but</lang:Foreign> તમારે શું જાણવું હતું |
134.426 139.426 | અચ્છા એની પણ એની પણ <lang:Foreign>same appointment</lang:Foreign> લઇ ને <lang:Foreign>slot book</lang:Foreign> કરાવીએ એવું છે કે |
135.351 138.076 | - |
139.326 149.649 | હા હા એ તમારે એ જે તમે આરોગ્ય શેતુ <lang:Foreign>app</lang:Foreign> ઉપર કરતાં હતા ને પહેલા જ <lang:Foreign>appointment</lang:Foreign> જોતા હતા. તમે પેલા ત્યાં એટલે કાતો એકવાર તમે <lang:Foreign>app</lang:Foreign> ખોલો એટલે હું તમને હમણાજ તમને ફટાફટ <lang:Foreign>guide</lang:Foreign> કરી દઈ તમને. |
145.075 145.725 | #અર |
151.038 151.748 | એવું હોય તો |
152.163 152.798 | અચ્છા |
152.899 153.413 | હા |
153.274 163.012 | નહિ એ <lang:Foreign>procees</lang:Foreign> તો મને ખબર છે. એટલે <lang:Foreign>sem</lang:Foreign> પોત પોતાના બે <lang:Foreign>slot</lang:Foreign> હવે મારા ને મારા <lang:Foreign>father</lang:Foreign> ના બે <lang:Foreign>slot book</lang:Foreign> કરાવી દઈસ હું. અમારા નજીક ના <lang:Foreign>center</lang:Foreign>માં |
164.111 166.211 | એ તો ખબર છે મને <lang:Foreign>process</lang:Foreign> |
165.561 166.220 | હા |
167.446 168.817 | અચ્છા હા |
167.561 172.210 | એ <lang:Foreign>appoimennt</lang:Foreign> લઇ ને <lang:Foreign>boosterdose</lang:Foreign>લઇ આવવા નો બસ એટલું જ છે એમાં |
168.818 170.760 | - |
172.910 183.023 | હા હા એમાં એટલું જ છે એમાં કઈ વધારે જાજુ નથી. તમે એક કામ કરો ને તમે મન ખાલી એટલું કોને હું ફટાફટ એ <lang:Foreign>chek</lang:Foreign> કરી લઉં કે <lang:Foreign>slot</lang:Foreign>માં છે કે નય <lang:Foreign>booseter dose</lang:Foreign> તમારા <lang:Foreign>area</lang:Foreign> માં તમે ક્યાં રહો છો સુરતમાં? |
Gujarati
gu-in
India
Kathiawari,...more
M:55, F:45
18-70
Silent, Noisy
16 bit
wav
8khz
Dual separate channel
5-15 minutes
Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.
Download Free Dataset
Contact Us