Gujarati (India) Call Center Speech Dataset for Delivery & Logistics

The audio dataset includes call center conversations in Delivery & Logistics, featuring native Gujarati speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Gujarati Language Call Center Speech Dataset for the Delivery and Logistics domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Delivery and Logistics industry.

With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Delivery and Logistics domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Gujarati language spoken in India.

Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Delivery and Logistics domain, to build robust and accurate customer service speech technology.

To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Gujarati speakers from different part of Gujarat. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.

Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.

The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.

Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.

The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Gujarati language call center speech recognition models for the Delivery and Logistics domain.

Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.

These ready-to-use transcriptions accelerate the development of Delivery and Logistics call center conversational AI and ASR models for the Gujarati language.

Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.

If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.

License:

This Delivery and Logistics call center audio dataset is created by FutureBeeAI and is available for commercial use!

Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Delivery and Logistics sector, our dataset serves as a trusted resource to meet your goals

Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(30)Male(26)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.5501.100Speaker 1<lang:Foreign>Hello</lang:Foreign>
Speech3.4756.349Speaker 2 <lang:Foreign>Hello Futurbee Car Transport Services</lang:Foreign>
Speech5.1155.716Speaker 1હા
Speech7.77210.074Speaker 1હા હુ <lang:Foreign>Futurbee Delivery</lang:Foreign>બોલું છું
Speech10.62514.897Speaker 1#હમ <lang:Foreign>Car Transport भी</lang:Foreign> છે એમા. બતાવો <lang:Foreign>sir</lang:Foreign> તમારી કેમ હુ શાહેતા કરી શકુ?
Speech11.38111.782Speaker 2#અમ
Speech16.18128.812Speaker 2#અમ અત્યારે મે મારે <lang:Foreign>Actually Sir Car</lang:Foreign> મોકલવી છે તો મે <lang:Foreign>Google</lang:Foreign> પર તમારા <lang:Foreign>Reviews</lang:Foreign> જોયા <lang:Foreign>Company</lang:Foreign> ના તો મને એમ લાગ્યુ કે એક વાર <lang:Foreign>Inquiry</lang:Foreign> કરી લેવાય એમ.
Speech31.30344.078Speaker 1અચ્છા અચ્છા ના ના <lang:Foreign>Sir Google</lang:Foreign> તો છે જ અમે <lang:Foreign>But Actual</lang:Foreign> મા <lang:Foreign>भी</lang:Foreign> અમારુ સારૂ ચાલે છે ને <lang:Foreign>Customer</lang:Foreign> બોવ <lang:Foreign>Satisfied</lang:Foreign> હોય છે તો સારી જગ્યા એ <lang:Foreign>Call</lang:Foreign>છે બતાવો <lang:Foreign>Sir</lang:Foreign> કેવી રીતે હુ તમને <lang:Foreign>Help</lang:Foreign> કરુ? કઈ <lang:Foreign>Car</lang:Foreign> છે તમારી પેલા તો એ મને જણાવો?
Speech43.43543.799Speaker 2#અમ
Speech45.32648.950Speaker 2#ઉહ અમારુ #હમ <lang:Foreign>WagonR <initial>LXI</initial> Model</lang:Foreign> છે
Speech50.05151.234Speaker 2બે હજાર દસ વાડુ.
Speech50.50350.774Speaker 1#હમ
Speech51.52652.125Speaker 1કેટલા
Speech53.02656.576Speaker 1અચ્છા બે હજાર દસ હમડા <lang:Foreign>Car Fully Runing</lang:Foreign> છે કે કઈ તફલિક છે <lang:Foreign>Car</lang:Foreign> મા?
Speech57.85959.898Speaker 2નઈ <lang:Foreign>Fully Running</lang:Foreign> છે
Speech60.34861.512Speaker 2ને કોઈ
Speech61.91463.225Speaker 2એને (())
Speech63.72568.209Speaker 2(()) એટલે એને <lang:Foreign>Body</lang:Foreign> ને કઈ બધુ બરાબર છે કોઈ <lang:Foreign>Issue</lang:Foreign> નથી.
Speech68.43372.459Speaker 1<lang:Foreign>Okay</lang:Foreign> ને <lang:Foreign>Petrol</lang:Foreign> પર છે <lang:Foreign>Sir</lang:Foreign> ગાડી કે <lang:Foreign><initial>CNG</initial></lang:Foreign> વગર આ <lang:Foreign>Diesel</lang:Foreign> વગર હાલે?
Speech72.15773.956Speaker 2<lang:Foreign>Both Both</lang:Foreign> બન્ને વ છે.
Speech75.28379.358Speaker 1અચ્છા સરસ તો તમારે <lang:Foreign>Sir</lang:Foreign> બિજુ એટલે ક્યાથી ક્યા મોકલવાની છે ગાડી આ?
Speech80.40886.281Speaker 2#હમ <lang:Foreign>Actually</lang:Foreign> આમારે છે ને સુરત થી બેંગલોર સુધિ મોકલવાની છે.
Speech89.07290.875Speaker 1અચ્છા સુરત થી બેંગલોર <lang:Foreign>Okay</lang:Foreign>
Speech91.32695.772Speaker 1#હમ [noise] ને ક્યારે ક્યારે વિચાર છે તમારો <lang:Foreign>Move</lang:Foreign> કરવાનો?
Speech97.79699.347Speaker 2#હમ આ <lang:Foreign>Month</lang:Foreign> ની
Speech100.949102.072Speaker 2પંદર તારીખ પછી.
Speech104.272106.421Speaker 1પંદર તારીખથી <lang:Foreign>Okay</lang:Foreign>
Speech106.694108.750Speaker 2પંદર તારીખથી ને પચ્છી જો
Speech109.176111.245Speaker 2<lang:Foreign>Next</lang:Foreign> દસ દિવસમા મડી જાતુ હોય તો.
Speech113.171114.451Speaker 1<lang:Foreign>Okay Okay</lang:Foreign>
Speech115.227123.245Speaker 1ઠીક છે અને <lang:Foreign>sir</lang:Foreign> તમારા ગાડી ના <lang:Foreign>Papers</lang:Foreign> તમારા જોડે <lang:Foreign>Ready</lang:Foreign> છે આપડે <lang:Foreign><initial>RC</initial>Book</lang:Foreign> છે જે બિજુ કાઈક છ ઈ <lang:Foreign>Polution Certificae Insurance</lang:Foreign>
Speech120.968121.376Speaker 2
Speech121.852126.694Speaker 2<lang:Foreign>Papers</lang:Foreign> છે બધા <lang:Foreign>papers Paper</lang:Foreign> છે બધા છે મારી જોડે પન.
Speech126.918129.351Speaker 2ક્યા ક્યા લાગસે એક વાર મને કઈ દો તો હુ એની
Speech129.777132.068Speaker 2અને <lang:Foreign>Original</lang:Foreign> જોસે કે <lang:Foreign>Zerox Copy</lang:Foreign>?
Speech134.127139.682Speaker 1ના અમારે તો<lang:Foreign>Zerox Copy</lang:Foreign> ચાલી જશે એક છે તમારુ <lang:Foreign><initial>RC</initial> Book</lang:Foreign> છે ઈ તમારુ <lang:Foreign>Insurance</lang:Foreign> હસે ગાડી નુ ઈ
Speech136.092136.667Speaker 2[noise] <lang:Foreign>Okay</lang:Foreign>
Speech139.143139.838Speaker 2<lang:Foreign>Okay</lang:Foreign>
Speech140.133144.751Speaker 1અને ત્રીજુ તમારુ <lang:Foreign><initial>PUC</initial> Certificate</lang:Foreign> હસે ને ગાડી નુ ઈ ત્યા ચલાવસો તો ત્યા લાગશે.
Speech141.014141.491Speaker 2#હમ
Speech144.217144.890Speaker 2#હમ
Speech146.516147.101Speaker 2<lang:Foreign>Okay</lang:Foreign>
Speech147.502149.376Speaker 2છે આ કાગડીયા તો છે મરી જોડે
Speech149.827152.039Speaker 2ને મને એ કો પેલા કે?
Speech153.116159.164Speaker 2કેટલા દિવસ મા ગાડી પોચસે ને <lang:Foreign>approximant Price</lang:Foreign> શુ રેસે એ મને થોડી જાણકારી આપશો?
Speech159.965169.462Speaker 1અચ્છા તો સુરત થી નિકડતા બેંગ્લોર એક <lang:Foreign>Minute</lang:Foreign> હો હુ <lang:Foreign>Chek</lang:Foreign> કરી લવ <lang:Foreign>System</lang:Foreign> મા સુરત થી બેંગલોર <lang:Foreign>Distance</lang:Foreign> નઈ નઈ કભી પંદરશો કિલોમિટર એટલુ હોય <lang:Foreign>sir</lang:Foreign>.
Speech170.139172.389Speaker 1તમારી દિવસમાં જાય છે.
Speech173.330180.354Speaker 1તણસો કિલોમિટર ચલાવી અમે રોજ એના તો પાંચ દિવસ લગ્સે <lang:Foreign>sir</lang:Foreign> પોંચતા <lang:Foreign>Proxylate</lang:Foreign> કવ ચુ આમા પાંચ દિવસ મા એકાદ દિવસ ઉપર નિચે થાઈ સકે છે.

TRANSCRIPTION

TIMETRANSCRIPT
0.550
1.100
<lang:Foreign>Hello</lang:Foreign>
3.475
6.349
<lang:Foreign>Hello Futurbee Car Transport Services</lang:Foreign>
5.115
5.716
હા
7.772
10.074
હા હુ <lang:Foreign>Futurbee Delivery</lang:Foreign>બોલું છું
10.625
14.897
#હમ <lang:Foreign>Car Transport भी</lang:Foreign> છે એમા. બતાવો <lang:Foreign>sir</lang:Foreign> તમારી કેમ હુ શાહેતા કરી શકુ?
11.381
11.782
#અમ
16.181
28.812
#અમ અત્યારે મે મારે <lang:Foreign>Actually Sir Car</lang:Foreign> મોકલવી છે તો મે <lang:Foreign>Google</lang:Foreign> પર તમારા <lang:Foreign>Reviews</lang:Foreign> જોયા <lang:Foreign>Company</lang:Foreign> ના તો મને એમ લાગ્યુ કે એક વાર <lang:Foreign>Inquiry</lang:Foreign> કરી લેવાય એમ.
31.303
44.078
અચ્છા અચ્છા ના ના <lang:Foreign>Sir Google</lang:Foreign> તો છે જ અમે <lang:Foreign>But Actual</lang:Foreign> મા <lang:Foreign>भी</lang:Foreign> અમારુ સારૂ ચાલે છે ને <lang:Foreign>Customer</lang:Foreign> બોવ <lang:Foreign>Satisfied</lang:Foreign> હોય છે તો સારી જગ્યા એ <lang:Foreign>Call</lang:Foreign>છે બતાવો <lang:Foreign>Sir</lang:Foreign> કેવી રીતે હુ તમને <lang:Foreign>Help</lang:Foreign> કરુ? કઈ <lang:Foreign>Car</lang:Foreign> છે તમારી પેલા તો એ મને જણાવો?
43.435
43.799
#અમ
45.326
48.950
#ઉહ અમારુ #હમ <lang:Foreign>WagonR <initial>LXI</initial> Model</lang:Foreign> છે
50.051
51.234
બે હજાર દસ વાડુ.
50.503
50.774
#હમ
51.526
52.125
કેટલા
53.026
56.576
અચ્છા બે હજાર દસ હમડા <lang:Foreign>Car Fully Runing</lang:Foreign> છે કે કઈ તફલિક છે <lang:Foreign>Car</lang:Foreign> મા?
57.859
59.898
નઈ <lang:Foreign>Fully Running</lang:Foreign> છે
60.348
61.512
ને કોઈ
61.914
63.225
એને (())
63.725
68.209
(()) એટલે એને <lang:Foreign>Body</lang:Foreign> ને કઈ બધુ બરાબર છે કોઈ <lang:Foreign>Issue</lang:Foreign> નથી.
68.433
72.459
<lang:Foreign>Okay</lang:Foreign> ને <lang:Foreign>Petrol</lang:Foreign> પર છે <lang:Foreign>Sir</lang:Foreign> ગાડી કે <lang:Foreign><initial>CNG</initial></lang:Foreign> વગર આ <lang:Foreign>Diesel</lang:Foreign> વગર હાલે?
72.157
73.956
<lang:Foreign>Both Both</lang:Foreign> બન્ને વ છે.
75.283
79.358
અચ્છા સરસ તો તમારે <lang:Foreign>Sir</lang:Foreign> બિજુ એટલે ક્યાથી ક્યા મોકલવાની છે ગાડી આ?
80.408
86.281
#હમ <lang:Foreign>Actually</lang:Foreign> આમારે છે ને સુરત થી બેંગલોર સુધિ મોકલવાની છે.
89.072
90.875
અચ્છા સુરત થી બેંગલોર <lang:Foreign>Okay</lang:Foreign>
91.326
95.772
#હમ [noise] ને ક્યારે ક્યારે વિચાર છે તમારો <lang:Foreign>Move</lang:Foreign> કરવાનો?
97.796
99.347
#હમ આ <lang:Foreign>Month</lang:Foreign> ની
100.949
102.072
પંદર તારીખ પછી.
104.272
106.421
પંદર તારીખથી <lang:Foreign>Okay</lang:Foreign>
106.694
108.750
પંદર તારીખથી ને પચ્છી જો
109.176
111.245
<lang:Foreign>Next</lang:Foreign> દસ દિવસમા મડી જાતુ હોય તો.
113.171
114.451
<lang:Foreign>Okay Okay</lang:Foreign>
115.227
123.245
ઠીક છે અને <lang:Foreign>sir</lang:Foreign> તમારા ગાડી ના <lang:Foreign>Papers</lang:Foreign> તમારા જોડે <lang:Foreign>Ready</lang:Foreign> છે આપડે <lang:Foreign><initial>RC</initial>Book</lang:Foreign> છે જે બિજુ કાઈક છ ઈ <lang:Foreign>Polution Certificae Insurance</lang:Foreign>
120.968
121.376
121.852
126.694
<lang:Foreign>Papers</lang:Foreign> છે બધા <lang:Foreign>papers Paper</lang:Foreign> છે બધા છે મારી જોડે પન.
126.918
129.351
ક્યા ક્યા લાગસે એક વાર મને કઈ દો તો હુ એની
129.777
132.068
અને <lang:Foreign>Original</lang:Foreign> જોસે કે <lang:Foreign>Zerox Copy</lang:Foreign>?
134.127
139.682
ના અમારે તો<lang:Foreign>Zerox Copy</lang:Foreign> ચાલી જશે એક છે તમારુ <lang:Foreign><initial>RC</initial> Book</lang:Foreign> છે ઈ તમારુ <lang:Foreign>Insurance</lang:Foreign> હસે ગાડી નુ ઈ
136.092
136.667
[noise] <lang:Foreign>Okay</lang:Foreign>
139.143
139.838
<lang:Foreign>Okay</lang:Foreign>
140.133
144.751
અને ત્રીજુ તમારુ <lang:Foreign><initial>PUC</initial> Certificate</lang:Foreign> હસે ને ગાડી નુ ઈ ત્યા ચલાવસો તો ત્યા લાગશે.
141.014
141.491
#હમ
144.217
144.890
#હમ
146.516
147.101
<lang:Foreign>Okay</lang:Foreign>
147.502
149.376
છે આ કાગડીયા તો છે મરી જોડે
149.827
152.039
ને મને એ કો પેલા કે?
153.116
159.164
કેટલા દિવસ મા ગાડી પોચસે ને <lang:Foreign>approximant Price</lang:Foreign> શુ રેસે એ મને થોડી જાણકારી આપશો?
159.965
169.462
અચ્છા તો સુરત થી નિકડતા બેંગ્લોર એક <lang:Foreign>Minute</lang:Foreign> હો હુ <lang:Foreign>Chek</lang:Foreign> કરી લવ <lang:Foreign>System</lang:Foreign> મા સુરત થી બેંગલોર <lang:Foreign>Distance</lang:Foreign> નઈ નઈ કભી પંદરશો કિલોમિટર એટલુ હોય <lang:Foreign>sir</lang:Foreign>.
170.139
172.389
તમારી દિવસમાં જાય છે.
173.330
180.354
તણસો કિલોમિટર ચલાવી અમે રોજ એના તો પાંચ દિવસ લગ્સે <lang:Foreign>sir</lang:Foreign> પોંચતા <lang:Foreign>Proxylate</lang:Foreign> કવ ચુ આમા પાંચ દિવસ મા એકાદ દિવસ ઉપર નિચે થાઈ સકે છે.

Dataset Demographics

Details Headline

Language

Gujarati

Language code

gu-in

Country

India

Accents

Kathiawari,...more

Gender Distribution

M: 55, F: 45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg